有沒有一個快速工具可以顯示文件中所有唯一的 unicode 字元及其數量?

有沒有一個快速工具可以顯示文件中所有唯一的 unicode 字元及其數量?

有人知道有一個工具可以將文件中所有唯一的 unicode 字元及其計數製成表格嗎?

答案1

我不確定「unicode 字元」到底是什麼意思。要計算文件中的不同字符,您可以執行以下操作:

$ awk -v FS="" -v OFS="\t" '{for(i=1;i<=NF;i++) char[$i]++} END { for(i in char) print i,char[i]}' input.txt

我們-v FS=""將欄位分隔符號設為空。因此每個字元都作為單一字段處理。在每一行中,我們使用字元作為列表的鍵來迭代這些字段,並使用 遞增計數++。如果讀取了所有行,我們將迭代計數列表並列印每個鍵(代表字元)及其計數。

相關內容