Um arquivo de string Str.rc
sobre o idioma francês está aqui:
ID_STR_BRIGHTNESS;,"Luminosité"
ID_STR_CHILE_EASTER_ISLAND;,"Île de Pâques"
ID_STR_CURRENT_CH;,"Saisie chaîne"
ID_STR_DETAILS;,"Détails"
......
Agora posso exportá-lo para um Microsoft Str.xls
assim:
cat ./Str.rc | sed 's/.*,//g' > ./Str.xls
Mas obterá, por exemplo, 'Détails' de 'Détails' desta forma.
A propósito, tento obter o formato de codificação do arquivo Str.rc via comando: enca Str.rc
e ele retorna da seguinte forma:
enca: Cannot determine (or understand) your language preferences.
Please use `-L language', or `-L none' if your language is not supported
(only a few multibyte encodings can be recognized then).
Run `enca --list languages' to get a list of supported languages.
Então, o que posso fazer para isso?
Responder1
Você provavelmente pode ajustar suas ferramentas Unix para lidar com a codificação corretamente. No entanto, se você quiser apenas remover os dados antes de ',' usando Python:
with open('Str.xls', 'w') as ofp:
with open('Str.rc') as fp:
for line in fp:
ofp.write(line.split(',',1)[1])
Se você quiser executá-lo a partir da linha de comando sem salvá-lo como um arquivo, primeiro você pode recortar e colar:
python -c "with open('Str.xls', 'w') as ofp:
with open('Str.rc') as fp:
for line in fp:
ofp.write(line.split(',',1)[1])"