以下をインポートしようとしていますCSVファイルデータ セットを Excel にインポートします。テキスト インポート ウィザードを使用して適切な区切り文字を設定しています。これまでは、「;」と「,」の区切り文字を使用していました。
こちらは結果これまでのところ、データ セットは行 493 までは問題ないように見えます。その時点から、データは 2014 年から 2015 年に変わります。どういうわけか、その時点からデータの形式が多少変更されたようで、列が揃わなくなった CSV ファイルになっています。
以下に、何が起こるかのスナップショットを示します。
質問: この CSV データ セットを Excel で列がきちんと整列するようにフォーマットするにはどうすればよいですか?
答え1
ファイルは 494 行目で不正な形式になっており、レコードは単なるフラグメントのようです。
Notepad++ では次のようになります:
行 493 を 2 つに分割する誤った改行があるようです。行 493 と行 494 を手動で結合すると、この行の問題が解決する可能性があります (インポートは試していません)。
"
ただし、この行は唯一の行ではありません。 で始まる行はすべて前の行に属しているように見えるため、で始まる行を探す必要があります。
Notepad++ を使用すると、次のすべて置換操作ですべての行が修正される可能性があります。
- 何を探すか:
\n"
- と置換する :
"
- 検索モード: 拡張