Excel または Notepad++ で、特定の文字の組み合わせで始まるすべての行を前の行に配置するにはどうすればよいでしょうか?

Excel または Notepad++ で、特定の文字の組み合わせで始まるすべての行を前の行に配置するにはどうすればよいでしょうか?

以下をインポートしようとしていますCSVファイルデータ セットを Excel にインポートします。テキスト インポート ウィザードを使用して適切な区切り文字を設定しています。これまでは、「;」と「,」の区切り文字を使用していました。

こちらは結果これまでのところ、データ セットは行 493 までは問題ないように見えます。その時点から、データは 2014 年から 2015 年に変わります。どういうわけか、その時点からデータの形式が多少変更されたようで、列が揃わなくなった CSV ファイルになっています。

Notepad++ で何が起こるかのスナップショットを以下に示します。

ここに画像の説明を入力してください

私はすでにこの問題について尋ねましたここだが、これまでのところその質問は解決に至っていない。私はまた、これスーパーユーザーの質問ですが、使用する文字の組み合わせが「"、”、Notepad++\R(?="";")では文書が認識されないようです。

私は今、「"、” 文字の組み合わせが前の行に存在します。

質問: このCSVデータセットを「"、” はそれぞれの前の行に配置されますか? (Notepad++ または Excel のいずれかで)

答え1

これはデータクリーニング作業のように思えます元のファイル上記のダウンロード リンクから。私の回答はこのファイルに基づいています。これは、ここでの質問に示されているスクリーンショットと同一ではありません。

493 行目以降の形式が異なることに加え、長いハイフンなどの特殊文字やその他の問題もあります。データセットには制御文字 (タブ) も含まれているため、削除する必要があることに注意してください。

CSV ファイルは Windows ファイル形式ではないことに注意してください。

  • \n= LF (ラインフィード) → Unix/Mac OS Xで改行文字として使用されます
  • \r\n= CR + LF → Windowsでは改行文字として使用されます

開始する前に必ずファイルをコピーし、Notepad++ を使用して手動でこの簡単な解決策を試してください。

(1)後で使用するために特殊文字を設定する:

  • Ctrl+H
  • 検索対象:\"\n
  • と置換する:\"#\n
  • チェック 包み込む
  • チェック 正規表現
  • Replace all

(2)LFをすべて置き換える

  • 検索対象:\n
  • と置換する:LEAVE EMPTY
  • チェック 包み込む
  • チェック 正規表現
  • Replace all

(3)クリーンな改行をリセットする

  • 検索対象:\"#
  • と置換する:\"\n
  • チェック 包み込む
  • チェック 正規表現
  • Replace all

(4)行を検索する^","改行を削除して20行未満を手動で編集します。

ところで、レコードが地理参照されていることに気付きました。Excel はおそらくこれにはあまり適していません (下の QGIS スクリーンショットを参照)。

ここに画像の説明を入力してください

関連情報