Str.rc
フランス語に関する文字列ファイルが 1 つあります。
ID_STR_BRIGHTNESS;,"Luminosité"
ID_STR_CHILE_EASTER_ISLAND;,"Île de Pâques"
ID_STR_CURRENT_CH;,"Saisie chaîne"
ID_STR_DETAILS;,"Détails"
......
これで、次のように Microsoft にエクスポートできますStr.xls
。
cat ./Str.rc | sed 's/.*,//g' > ./Str.xls
しかし、この方法では、たとえば「Détails」から「Details」が取得されます。
ちなみに、コマンドを使用して Str.rc ファイルのエンコード形式を取得しようとするenca Str.rc
と、次のように返されます。
enca: Cannot determine (or understand) your language preferences.
Please use `-L language', or `-L none' if your language is not supported
(only a few multibyte encodings can be recognized then).
Run `enca --list languages' to get a list of supported languages.
それで、これに対して何ができるでしょうか?
答え1
おそらく、Unix ツールを微調整してエンコードを正しく処理できるでしょう。ただし、Python を使用して ',' の前のデータを単に削除したいだけの場合は、次のようになります。
with open('Str.xls', 'w') as ofp:
with open('Str.rc') as fp:
for line in fp:
ofp.write(line.split(',',1)[1])
最初にファイルとして保存せずにコマンドラインから実行したい場合は、次のように切り取って貼り付けることができます。
python -c "with open('Str.xls', 'w') as ofp:
with open('Str.rc') as fp:
for line in fp:
ofp.write(line.split(',',1)[1])"