テキストの行内の単語の文字を並べ替えることは可能ですか?

Question 1

別のperlバリエーション:

$ perl -pe 's{^rap ,\K\S+}{join "", sort split //, $&}e' file
rap ,Xfgl MIT X11
rap ,BPXfl 'MITER'
rap ,Bfgl share git-grep
rap ,bfl X11
rap ,Bfl xzfgrep
rap ,Bf X11

小文字を大文字の前に置かなければならないという追加の要件については、ASCII ではで'x'ある'X' ^ 32(およびで'X'ある'x' ^ 32) という事実に頼ることができます。

$ perl -pe 's{^rap ,\K\S+}{join "", sort {(ord($a)^32) <=> (ord($b)^32)} split //, $&}e' file
rap ,fglX MIT X11
rap ,flBPX 'MITER'
rap ,fglB share git-grep
rap ,bfl X11
rap ,flB xzfgrep
rap ,fB X11

Answer

別のperlバリエーション:

$ perl -pe 's{^rap ,\K\S+}{join "", sort split //, $&}e' file
rap ,Xfgl MIT X11
rap ,BPXfl 'MITER'
rap ,Bfgl share git-grep
rap ,bfl X11
rap ,Bfl xzfgrep
rap ,Bf X11

小文字を大文字の前に置かなければならないという追加の要件については、ASCII ではで'x'ある'X' ^ 32(およびで'X'ある'x' ^ 32) という事実に頼ることができます。

$ perl -pe 's{^rap ,\K\S+}{join "", sort {(ord($a)^32) <=> (ord($b)^32)} split //, $&}e' file
rap ,fglX MIT X11
rap ,flBPX 'MITER'
rap ,fglB share git-grep
rap ,bfl X11
rap ,flB xzfgrep
rap ,fB X11

Question 2

Perl を使用して、コンマに続く単語の文字のシーケンスを取得し、その結果を配列に分割し、それをソートして結果を置き換えることができます。

$ perl -pe 's{(?<=,)(\w+)}{join "", sort split(//, $1)}e' yourfile 
rap ,Xfgl MIT X11           
rap ,BPXfl 'MITER'
rap ,Bfgl share git-grep    
rap ,bfl X11
rap ,Bfl xzfgrep
rap ,Bf X11

ご要望に応じて、すべての小文字オプションを大文字オプションの前に並べ替える 1 つの方法 (おそらく最適ではない) を次に示します。

$ perl -pe 's{(?<=,)(\w+)}{@opts = split(//,$1); join "", 
    (sort grep /[[:lower:]]/,@opts), (sort grep /[^[:lower:]]/, @opts)
  }e' yourfile 
rap ,fglX MIT X11           
rap ,flBPX 'MITER'
rap ,fglB share git-grep    
rap ,bfl X11
rap ,flB xzfgrep
rap ,fB X11

Answer

Perl を使用して、コンマに続く単語の文字のシーケンスを取得し、その結果を配列に分割し、それをソートして結果を置き換えることができます。

$ perl -pe 's{(?<=,)(\w+)}{join "", sort split(//, $1)}e' yourfile 
rap ,Xfgl MIT X11           
rap ,BPXfl 'MITER'
rap ,Bfgl share git-grep    
rap ,bfl X11
rap ,Bfl xzfgrep
rap ,Bf X11

ご要望に応じて、すべての小文字オプションを大文字オプションの前に並べ替える 1 つの方法 (おそらく最適ではない) を次に示します。

$ perl -pe 's{(?<=,)(\w+)}{@opts = split(//,$1); join "", 
    (sort grep /[[:lower:]]/,@opts), (sort grep /[^[:lower:]]/, @opts)
  }e' yourfile 
rap ,fglX MIT X11           
rap ,flBPX 'MITER'
rap ,fglB share git-grep    
rap ,bfl X11
rap ,flB xzfgrep
rap ,fB X11

Question 3

GNU awkを使用してsorted_inいずれにせよgawkを使用するので、他にも便利だが不要な拡張機能をいくつか使用して、装飾-並べ替え-装飾解除の慣用句1小文字の前にを置き、2大文字の前にを置くと、小文字がすべて大文字より前にソートされ、印刷前にそれらの装飾が再度削除されます。

$ cat tst.awk
BEGIN { PROCINFO["sorted_in"] = "@val_str_asc" }
match( $0, /^(\s*\S+\s*,)(\S+)(.*)/, a ) {
    gsub( /[[:lower:]]/, "1 &,", a[2] )        # Decorate
    gsub( /[[:upper:]]/, "2 &,", a[2] )

    sorted = ""
    split(a[2],opts,",")
    for ( idx in opts ) {                      # Sort
        sorted = sorted opts[idx]
    }

    gsub( /[[:digit:] ,]/, "", sorted )        # Undecorate
    $0 = a[1] sorted a[3]
}
{ print }

$ awk -f tst.awk file
rap ,fglX MIT X11
rap ,flBPX 'MITER'
rap ,fglB share git-grep
rap ,bfl X11
rap ,flB xzfgrep
rap ,fB X11

Answer

GNU awkを使用してsorted_inいずれにせよgawkを使用するので、他にも便利だが不要な拡張機能をいくつか使用して、装飾-並べ替え-装飾解除の慣用句1小文字の前にを置き、2大文字の前にを置くと、小文字がすべて大文字より前にソートされ、印刷前にそれらの装飾が再度削除されます。

$ cat tst.awk
BEGIN { PROCINFO["sorted_in"] = "@val_str_asc" }
match( $0, /^(\s*\S+\s*,)(\S+)(.*)/, a ) {
    gsub( /[[:lower:]]/, "1 &,", a[2] )        # Decorate
    gsub( /[[:upper:]]/, "2 &,", a[2] )

    sorted = ""
    split(a[2],opts,",")
    for ( idx in opts ) {                      # Sort
        sorted = sorted opts[idx]
    }

    gsub( /[[:digit:] ,]/, "", sorted )        # Undecorate
    $0 = a[1] sorted a[3]
}
{ print }

$ awk -f tst.awk file
rap ,fglX MIT X11
rap ,flBPX 'MITER'
rap ,fglB share git-grep
rap ,bfl X11
rap ,flB xzfgrep
rap ,fB X11

Question 4

入力ファイル内のカンマをダッシュに置き換えると、getopts通常どおりを使用してrap関数のオプションを解析できます。

この変更はを使用して行うことができ、行の先頭をにsed変更するだけでよいと仮定すると、次のようになります。rap ,rap -

sed 's/^rap ,/rap -/' file.in >file

その後、関数が以前に宣言されていると. ./file仮定して、生成されたファイルをスクリプト内で簡単にソース化できるようになります。rap

関数内のオプションを解析するにはrap:

rap () {
        OPTIND=1

        unset -v B_flag P_flag X_flag
        unset -v b_flag f_flag g_flag l_flag

        while getopts BPXbfgl opt; do
                case $opt in
                        B) B_flag=true ;;
                        P) P_flag=true ;;
                        X) X_flag=true ;;
                        b) b_flag=true ;;
                        f) f_flag=true ;;
                        g) g_flag=true ;;
                        l) l_flag=true ;;
                        *) echo 'Error' >&2; return 1
                esac
        done
        shift "$(( OPTIND - 1 ))"

        # Act on set flags here.

        if "${f_flag-false}"; then
                echo 'The -f option was used'
        fi

        # The non-options are available in "$@".

        printf 'Other argument: %s\n' "$@"
        printf -- '---\n'
}

ループ内でフラグ変数を設定しwhile、ループ後にそれらを操作すると、重複したオプションが複数回操作されることが回避されることに注意してください。

Answer