
Ich habe zwei CSV-Dateien und sie sehen gleich aus, wenn ich sie in einem Texteditor wie Notepad++ ansehe. Wenn ich sie jedoch beide in Excel (aktuell 2003) öffne, zeigt eine davon doppelte Anführungszeichen in den Feldern an und die andere nicht. Weiß jemand, warum das so ist?
Hinweis: Die Spalten haben unterschiedliche Reihenfolgen und eine unterschiedliche Anzahl
Datei 1 zeigt " in Excel
"1794", "FEMALE", "9", "", "CHRISTENSEN", "JAMES FAKE", "LUCIA", "8/28/2006", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "40890", "209417", "767-544-033", ""
Datei 2 zeigt " in Excel nicht an
"1794","CHRISTENSEN","JAMES FAKE","LUCIA","8/28/2006","9","FEMALE","","","","","","",""
Nach welchen anderen fehlerhaften Variablen sollte ich suchen? Ist die Kodierung wichtig?
Antwort1
Einer von ihnen zeigt doppelte Anführungszeichen in Feldern und der andere nicht
Weiß jemand, warum das so ist?
Die erste Datei enthält nach den Kommas Leerzeichen.
Entfernen Sie die Leerzeichen, um mit beiden Dateien das gleiche Verhalten zu erzielen.
Laut RFC 4180 sind Leerzeichen außerhalb von Anführungszeichen in einem Feld nicht zulässig. Allerdings heißt es im RFC auch: „Leerzeichen gelten als Teil eines Felds und dürfen nicht ignoriert werden.“ Außerdem heißt es bei der Verarbeitung von CSV-Dateien: „Implementierer sollten bei dem, was sie tun, konservativ sein, aber bei dem, was sie von anderen akzeptieren, großzügig.“ (RFC 793).
1997, Ford, E350
ist nicht dasselbe wie
1997,Ford,E350
QuelleKomma-getrennte Werte
Antwort2
Wie der OP oben kommentiert hat, löst das Entfernen der Leerzeichen das Problem, aber wenn Sie die Datei vor dem Importieren nicht manipulieren möchten, markieren Sie einfach sowohl Komma als auch Leerzeichen als Trennzeichen und aktivieren Sie das Kontrollkästchen „Aufeinanderfolgende Trennzeichen als eins behandeln“ im Textimport-Assistenten.