この CSV ファイル内の改行をデータベースまたはスプレッドシートに適切にインポートするにはどうすればよいでしょうか?

この CSV ファイル内の改行をデータベースまたはスプレッドシートに適切にインポートするにはどうすればよいでしょうか?

独自の電子医療記録データベース システムからエクスポートされた .csv ファイルがあります。私はそのサービスの加入者でしたが、加入を終了したため、この方法でデータを保存し、別のシステムに移行できるようになりました。簡単に言うと、データベースまたはスプレッドシートにインポートして、Word の差し込み印刷を使用して医療記録文書を読み取り可能な形式で再作成し、印刷できるようにする必要があります。

問題は、ファイルを直接 Excel で開いたり、Access でインポートしたりすると、多くのデータ フィールド エントリ内にレコード区切りとして誤って解釈される書式設定の改行があることです。これにより、Excel または Access はエントリの途中で新しい行を開始し、当然ながら状況がおかしくなります。Notepad ++ でファイルを開いて [すべての文字を表示] をオンにすると、実際のレコード区切りの改行は CR LF 記号であることがわかりますが、エントリ内の書式設定の改行はそれ自体が LF 記号です。ざっと読んだところ、改行を含む CSV データ フィールド エントリは理想的には二重引用符で囲む必要があることがわかりましたが、私のファイルではそうではありません。これが問題の原因であると思われます。

これを修正するにはどうすればよいでしょうか。Access、Excel、またはその他のオープン ソース プログラムで、LF をデータ フィールド エントリ内の書式設定改行としてレンダリングする方法はありますか。単独の LF を他の改行タイプに変換して、適切にレンダリングすることはできますか。CR が先行していない LF だけを無視する場合でも、後で Word の差し込み印刷を使用してドキュメントを出力すると、LF が適切に改行としてレンダリングされる可能性があります。もう 1 つの方法として、何らかの検索/置換操作を実行して、データベースにインポートするまですべての単独の LF を別の文字に置き換え、データベースにインポートした後、または差し込み印刷でドキュメントを作成した後に、その文字を適切な種類の改行に置き換えることが考えられます。または、単独の LF を含む各フィールド エントリを二重引用符で囲むことができる何らかの検索/置換操作はありますか。ファイル内のすべてのデータ フィールド エントリを非選択的に二重引用符で囲む方法があったとしても、それでも機能するはずですよね。ここから先に進む最も簡単な方法がわからないので、何か提案があればお願いします。

答え1

Notepad++の正規表現では「[^\r]\n」はLFに一致しますが、CRLFには一致しません。これを好きなものに置き換えてください。答え役に立つ情報があります。

答え2

CSVが適切に引用符で囲まれている場合、つまり「セル」を区切ると考えられるすべての部分を二重引用符で囲んでいる場合、リブレオフィスうまくいくはずです。(人によって違います)ウィキペディアCSV 形式の説明については、こちらをご覧ください。

関連情報