각 줄에서 처음 나타나는 문자 바꾸기를 건너뛰는 방법은 무엇입니까?

각 줄에서 처음 나타나는 문자 바꾸기를 건너뛰는 방법은 무엇입니까?

다음과 같은 형식의 파일이 있습니다.

Y15-SUB-B04-P17-BK_M02734_4_000000000-ANNUF_1_1111_24724_4878;size=1;
Y15-SUB-B05-P22-LM_M02734_4_000000000-ANNUF_1_1111_20624_14973;size=1;
Y15-SUB-B05-P22-LM_M02734_4_000000000-ANNUF_1_1103_11326_10379;size=1;

첫 번째 항목을 제외하고 모든 밑줄(_)을 콜론(:)으로 바꾸고 싶습니다. 나는 다음과 같은 출력을 원합니다 :

Y15-SUB-B04-P17-BK_M02734:4:000000000-ANNUF:1:1111:24724:4878;size=1;
Y15-SUB-B05-P22-LM_M02734:4:000000000-ANNUF:1:1111:20624:14973;size=1;
Y15-SUB-B05-P22-LM_M02734:4:000000000-ANNUF:1:1103:11326:10379;size=1;

sed -i '' 's/_/:/g' old_fileALL(또는 )을 대체하는 데 사용할 수 있고 sed 's/_/:/g' old_file > new_file두 번째, 네 번째 정도의 항목만 대체하기 위해 숫자를 추가할 수 있다는 것을 알고 있습니다.

sed 's/_/:/2' old_file > new_file

그러나 첫 번째 줄을 제외하고 각 줄의 모든 항목을 바꾸는 방법은 무엇입니까?

답변1

GNU 사용 sed(다른 버전에서는 다르게 동작할 수 있습니다. 감사합니다.글렌 잭맨):

 sed -i'' 's/_/:/2g' file

이렇게 하면 각 줄의 첫 번째 항목을 건너뛰 _도록 모두 변경됩니다 .:

답변2

Posix-sed다음과 같은 구성만 사용합니다 .

$ sed -e '
     y/_/\n/
     s/\n/_/
     y/\n/:/
' inp.file

Stephane의 제안에 따라 몇 가지 추가 방법은 다음과 같습니다.

$ perl -pe 's/(^\G.*?_)?.*?\K_/:/g' inp.file 

$ perl -pe 'my $n; s/_/$n++?":":$&/ge' inp.file 

$ perl -pe 's/_\K(.*)/$1 =~ y|_|:|r/e' inp.file 

답변3

어크 괜찮아? _필드 구분 기호로 사용하여 다음을 인쇄할 수 있습니다 .

<field 1>_<field 2>:<field n>:<field n+1>:...

이와 같이:

awk -F_ '{ printf("%s_%s", $1, $2); for (x = 3; x <=NF; x++) { printf(":%s", $x); }; printf("\n"); }'

각 줄의 구조가 동일한 경우 루프를 피하기 위해 필드 수를 하드 코딩할 수 있습니다(매우 대략적인 예비 시험에 따르면 시간의 약 2/3에서 실행됨).

awk -F_ '{printf("%s_%s:%s:%s:%s:%s:%s:%s\n", $1, $2, $3, $4, $5, $6, $7, $8);}'

답변4

다음은 루프가 없는 또 다른 간단한 awk스크립트(표준 Linux )입니다.gawk

cat script.awk
match($0,/^[^_]*_/,a){ # match current line to first _ (including) into a[0] variable
   sub(a[0],"");       # remove a[0] from current line
   gsub("_",":");      # replace all _ to : in current line
   print a[0]""$0;     # output a[0] and current line
}

달리다:

awk -f script.awk input.txt

또는:

awk 'match($0,/^[^_]*_/,a){sub(a[0],"");gsub("_",":");print a[0]""$0;}' input.txt

관련 정보