
In einer Datei habe ich zwei Blätter, die einige Spalten gemeinsam haben. Ich müsste die Blätter basierend auf dem Spaltennamen zusammenführen und, wenn die Spalte nicht existiert, sie hinzufügen. Ich habe also
Blatt1
+----+-------+--------------+
| id | name | description |
+----+-------+--------------+
| 1 | name1 | description1 |
| 2 | name2 | description2 |
+----+-------+--------------+
Blatt 2
+----+-------+--------------+--------+
| id | name | description | title |
+----+-------+--------------+--------+
| 3 | name3 | description3 | title3 |
| 4 | name4 | description4 | title4 |
+----+-------+--------------+--------+
Gewünschte Ausgabe
+----+-------+--------------+--------+
| id | name | description | title |
+----+-------+--------------+--------+
| 1 | name1 | description1 | |
| 2 | name2 | description2 | |
| 3 | name3 | description3 | title3 |
| 4 | name4 | description4 | title4 |
+----+-------+--------------+--------+
Gibt es eine Möglichkeit, dies zu tun?
Antwort1
Sie können dies tun Python + Pandas
import pandas as pd
import numpy as np
import glob
a = glob.glob("C:/Documents and Settings/Administrator/My Documents/*.xlsx")
all_data = pd.DataFrame()
for f in a:
df = pd.read_excel(f)
all_data = all_data.append(df,ignore_index=True,sort=False)
print all_data
Dadurch werden alle Daten des angegebenen Speicherorts zusammengeführt und angezeigt