
En un archivo tengo dos hojas que comparten algunas de las columnas. Necesitaría fusionar las hojas según el nombre de la columna; si la columna no existe, agréguela. Es decir. Tengo
Hoja 1
+----+-------+--------------+
| id | name | description |
+----+-------+--------------+
| 1 | name1 | description1 |
| 2 | name2 | description2 |
+----+-------+--------------+
Hoja 2
+----+-------+--------------+--------+
| id | name | description | title |
+----+-------+--------------+--------+
| 3 | name3 | description3 | title3 |
| 4 | name4 | description4 | title4 |
+----+-------+--------------+--------+
Salida deseada
+----+-------+--------------+--------+
| id | name | description | title |
+----+-------+--------------+--------+
| 1 | name1 | description1 | |
| 2 | name2 | description2 | |
| 3 | name3 | description3 | title3 |
| 4 | name4 | description4 | title4 |
+----+-------+--------------+--------+
¿Hay alguna manera de hacer esto?
Respuesta1
Puedes hacer esto python + pandas
import pandas as pd
import numpy as np
import glob
a = glob.glob("C:/Documents and Settings/Administrator/My Documents/*.xlsx")
all_data = pd.DataFrame()
for f in a:
df = pd.read_excel(f)
all_data = all_data.append(df,ignore_index=True,sort=False)
print all_data
Esto fusionará todos los datos de la ubicación que especificó y se mostrará