以下をインポートしようとしていますCSVファイルデータ セットを Excel にインポートします。テキスト インポート ウィザードを使用して適切な区切り文字を設定しています。これまでは、「;」と「,」の区切り文字を使用していました。
こちらは結果これまでのところ、データ セットは行 493 までは問題ないように見えます。その時点から、データは 2014 年から 2015 年に変わります。どういうわけか、その時点からデータの形式が多少変更されたようで、列が揃わなくなった CSV ファイルになっています。
Notepad++ で何が起こるかのスナップショットを以下に示します。
私はすでにこの問題について尋ねましたここだが、これまでのところその質問は解決に至っていない。私はまた、これスーパーユーザーの質問ですが、使用する文字の組み合わせが「"、”、Notepad++\R(?="";")
では文書が認識されないようです。
私は今、「"、” 文字の組み合わせが前の行に存在します。
質問: このCSVデータセットを「"、” はそれぞれの前の行に配置されますか? (Notepad++ または Excel のいずれかで)
答え1
これはデータクリーニング作業のように思えます元のファイル上記のダウンロード リンクから。私の回答はこのファイルに基づいています。これは、ここでの質問に示されているスクリーンショットと同一ではありません。
493 行目以降の形式が異なることに加え、長いハイフンなどの特殊文字やその他の問題もあります。データセットには制御文字 (タブ) も含まれているため、削除する必要があることに注意してください。
CSV ファイルは Windows ファイル形式ではないことに注意してください。
\n
= LF (ラインフィード) → Unix/Mac OS Xで改行文字として使用されます\r\n
= CR + LF → Windowsでは改行文字として使用されます
開始する前に必ずファイルをコピーし、Notepad++ を使用して手動でこの簡単な解決策を試してください。
(1)後で使用するために特殊文字を設定する:
- Ctrl+H
- 検索対象:
\"\n
- と置換する:
\"#\n
- チェック 包み込む
- チェック 正規表現
- Replace all
(2)LFをすべて置き換える
- 検索対象:
\n
- と置換する:
LEAVE EMPTY
- チェック 包み込む
- チェック 正規表現
- Replace all
(3)クリーンな改行をリセットする
- 検索対象:
\"#
- と置換する:
\"\n
- チェック 包み込む
- チェック 正規表現
- Replace all
(4)行を検索する^","
改行を削除して20行未満を手動で編集します。
ところで、レコードが地理参照されていることに気付きました。Excel はおそらくこれにはあまり適していません (下の QGIS スクリーンショットを参照)。