
Supongamos que tengo un archivo con 50K líneas, considere (Cuenta, Cusip) como clave principal. Me gustaría mantener la última línea entre líneas con la misma clave principal. esas líneas que, para las líneas con la misma clave principal, mantienen la última línea, ¿cómo puedo lograr esto?
Account Cusip Amount
A a 500
A a 450
A b 500
B b 600
B b 350
C a 300
C c 100
C c 200
C c 500
Resultado Esperado
Account Cusip Amount
A a 450
A b 500
B b 350
C a 300
C c 500
Respuesta1
Utilice el siguiente script de Python para hacer lo que esperaba. El archivo 1.txt
contiene sus datos de entrada:
key1=''
key2=''
amount=''
with open('1.txt') as f:
for line in f:
[nkey1,nkey2,namount]=line.split()
if nkey1==key1 and nkey2==key2:
amount=namount
else:
print '%s\t%s\t%s' % (key1,key2,amount)
key1=nkey1
key2=nkey2
amount=namount
print '%s\t%s\t%s' % (key1,key2,amount)