AWK: 줄의 패턴 위치에 관계없이 2개의 사용자 정의 필드 구분 기호 사이에서 패턴을 추출하는 방법은 무엇입니까?

Question 1

데이터에 이름=값 쌍이 있을 때마다 먼저 해당 매핑을 캡처하는 배열을 생성하는 것이 가장 좋습니다( f[]아래). 그런 다음 해당 이름으로 원하는 필드에 액세스할 수 있습니다. 예:

$ awk -F'[=,] *' '{for (i=1;i<NF;i+=2) f[$i]=$(i+1); print f["MIC"]}' file
XAIM

테스트 값에 적응하고 다른 필드를 어떤 순서로든 인쇄하는 것이 얼마나 쉬운지 살펴보세요.

awk -F'[=,] *' '
    { for (i=1;i<NF;i+=2) f[$i]=$(i+1) }
    (f["MIC"] == "XAIM") && (f["LN"] ~ /FOOD/){ print f["SG"], f["RIC"] }
' file
MA1 FF.MI

Answer

데이터에 이름=값 쌍이 있을 때마다 먼저 해당 매핑을 캡처하는 배열을 생성하는 것이 가장 좋습니다( f[]아래). 그런 다음 해당 이름으로 원하는 필드에 액세스할 수 있습니다. 예:

$ awk -F'[=,] *' '{for (i=1;i<NF;i+=2) f[$i]=$(i+1); print f["MIC"]}' file
XAIM

테스트 값에 적응하고 다른 필드를 어떤 순서로든 인쇄하는 것이 얼마나 쉬운지 살펴보세요.

awk -F'[=,] *' '
    { for (i=1;i<NF;i+=2) f[$i]=$(i+1) }
    (f["MIC"] == "XAIM") && (f["LN"] ~ /FOOD/){ print f["SG"], f["RIC"] }
' file
MA1 FF.MI

Question 2

$ sed -n 's/.* MIC=\([^,}]*\).*/\1/p' file
XAIM

이는 또는 문자열 sed을 일치시키는 데 사용되며 전체 줄을 문자열로 바꿉니다. 다른 모든 데이터는 삭제됩니다. MIC=SOMETHING,MIC=SOMETHING}SOMETHING

$ tr ',' '\n' <file | awk -F '=' '$1 == " MIC" { print $2 }'
XAIM

이것은 먼저 모든 쉼표를 줄 바꿈으로 바꾼 다음 필드 구분 기호로 문자를 awk사용하여 실행됩니다 =. 첫 번째 필드가 와 같으면 MIC두 번째 필드가 인쇄됩니다.

$ awk -F ',' '{ for (i = 1; i <= NF; ++i) if (sub(" MIC=","",$i)) print $i }' file
XAIM

이는 awk입력을 쉼표로 구분된 필드로만 사용하고 처리합니다. 이는 모든 필드를 반복하며, 필드가 string 으로 시작하면 MIC=해당 문자열이 필드에서 제거되고 나머지가 인쇄됩니다.

파일이 JSON 형식이었다면(데이터를 변환했을 수도 있습니다.)~에서대부분의 REST API는 JSON 형식의 데이터를 반환하기 때문에 어떤 시점에서는 JSON을 반환하며 이 데이터는 금융 주식 시장과 관련된 것으로 보입니다.

{
  "CU": "EUR",
  "GTPID": 144115188076657540,
  "II": "IT0005215329",
  "IS": 18814564,
  "LN": "FINE FOODS & PHARMACEUTICALS NTM",
  "MIC": "XAIM",
  "RIC": "FF.MI",
  "SG": "MA1",
  "SN": 801670,
  "STY": "ORDINARY",
  "TK": "0.0002 to 0.1,0.0005 to 0.2,0.001 to 0.5,0.002 to 1,0.005 to 2,0.01 to 5,0.02 to 10,0.05 to 20,0.1 to 50,0.2 to 100,0.5 to 200,1 to 500,2 to 1000,5 to 2000,10 to 5000,20 to 10000,50 to 20000,100 to 50000,200",
  "TS": "FF",
  "TY": "S",
  "UQ": 1
}

그렇다면 jq가장 쉬웠을 것입니다.

$ jq -r '.MIC' file1
XAIM

Answer

$ sed -n 's/.* MIC=\([^,}]*\).*/\1/p' file
XAIM

이는 또는 문자열 sed을 일치시키는 데 사용되며 전체 줄을 문자열로 바꿉니다. 다른 모든 데이터는 삭제됩니다. MIC=SOMETHING,MIC=SOMETHING}SOMETHING

$ tr ',' '\n' <file | awk -F '=' '$1 == " MIC" { print $2 }'
XAIM

이것은 먼저 모든 쉼표를 줄 바꿈으로 바꾼 다음 필드 구분 기호로 문자를 awk사용하여 실행됩니다 =. 첫 번째 필드가 와 같으면 MIC두 번째 필드가 인쇄됩니다.

$ awk -F ',' '{ for (i = 1; i <= NF; ++i) if (sub(" MIC=","",$i)) print $i }' file
XAIM

이는 awk입력을 쉼표로 구분된 필드로만 사용하고 처리합니다. 이는 모든 필드를 반복하며, 필드가 string 으로 시작하면 MIC=해당 문자열이 필드에서 제거되고 나머지가 인쇄됩니다.

파일이 JSON 형식이었다면(데이터를 변환했을 수도 있습니다.)~에서대부분의 REST API는 JSON 형식의 데이터를 반환하기 때문에 어떤 시점에서는 JSON을 반환하며 이 데이터는 금융 주식 시장과 관련된 것으로 보입니다.

{
  "CU": "EUR",
  "GTPID": 144115188076657540,
  "II": "IT0005215329",
  "IS": 18814564,
  "LN": "FINE FOODS & PHARMACEUTICALS NTM",
  "MIC": "XAIM",
  "RIC": "FF.MI",
  "SG": "MA1",
  "SN": 801670,
  "STY": "ORDINARY",
  "TK": "0.0002 to 0.1,0.0005 to 0.2,0.001 to 0.5,0.002 to 1,0.005 to 2,0.01 to 5,0.02 to 10,0.05 to 20,0.1 to 50,0.2 to 100,0.5 to 200,1 to 500,2 to 1000,5 to 2000,10 to 5000,20 to 10000,50 to 20000,100 to 50000,200",
  "TS": "FF",
  "TY": "S",
  "UQ": 1
}

그렇다면 jq가장 쉬웠을 것입니다.

$ jq -r '.MIC' file1
XAIM

Question 3

와 .grep 일치하는 데이터만 가져오고 요청된 필드와 값을 찾는 데 cut사용합니다 . 필드 구분자로 사용하여 에 입력 하고 두 번째 필드를 가져옵니다.grep -oocut=

$ grep -o 'MIC=[^,]*' input | cut -d= -f2
XAIM

와 함께 sed. 요청된 필드/값 쌍을 찾고 ()및 를 사용하여 \1일치하는 하위 패턴을 추출합니다.

$ sed -nE 's/^.*MIC=([^,]+).*$/\1/;p' input
XAIM
# or, alternatively,
$ sed -n 's/^.*MIC=\([^,]*\).*$/\1/;p' input
XAIM

와 함께 awk. 필드 구분 기호와 레코드 구분 기호를 각각 =및 로 설정합니다 ,. 일치하는 패턴이 있는 레코드의 경우 두 번째 필드(즉, 값)를 인쇄합니다.

$ awk 'BEGIN { FS="="; RS=","; } $1 ~ /MIC/ { print $2 }' input
XAIM

Answer

와 .grep 일치하는 데이터만 가져오고 요청된 필드와 값을 찾는 데 cut사용합니다 . 필드 구분자로 사용하여 에 입력 하고 두 번째 필드를 가져옵니다.grep -oocut=

$ grep -o 'MIC=[^,]*' input | cut -d= -f2
XAIM

와 함께 sed. 요청된 필드/값 쌍을 찾고 ()및 를 사용하여 \1일치하는 하위 패턴을 추출합니다.

$ sed -nE 's/^.*MIC=([^,]+).*$/\1/;p' input
XAIM
# or, alternatively,
$ sed -n 's/^.*MIC=\([^,]*\).*$/\1/;p' input
XAIM

와 함께 awk. 필드 구분 기호와 레코드 구분 기호를 각각 =및 로 설정합니다 ,. 일치하는 패턴이 있는 레코드의 경우 두 번째 필드(즉, 값)를 인쇄합니다.

$ awk 'BEGIN { FS="="; RS=","; } $1 ~ /MIC/ { print $2 }' input
XAIM

Question 4

명령

 awk -F "," '{for(i=1;i<=NF;i++){if($i ~ /MIC/){gsub(/.*=/,"",$i);print $i}}}'

파일 이름

산출

XAIM

Answer

명령

 awk -F "," '{for(i=1;i<=NF;i++){if($i ~ /MIC/){gsub(/.*=/,"",$i);print $i}}}'

파일 이름

산출

XAIM

AWK: 줄의 패턴 위치에 관계없이 2개의 사용자 정의 필드 구분 기호 사이에서 패턴을 추출하는 방법은 무엇입니까?

답변1

답변2

답변3

답변4

관련 정보