檢查某些列匹配後合併兩個文件

檢查某些列匹配後合併兩個文件

假設我有兩個檔案 912300001.file1.txt 和 file2.txt,它們包含以下內容:

912300001.file1.txt

VALUE   1000    -21 -21
VALUE   1001    -23 -22
VALUE   1002    -23 -21

第一列並不重要,第二列是兩個檔案中都存在的計數器,這是我在合併時要檢查的列之一。第三列和第四列是我要合併的列。

文件2.txt

-123456.12 -1234567.12 912300001     1000 123.1 123.1 ab 1 3
-123466.12 -1234667.12 912300001     1001 133.1 124.1 ab 2 2
-123476.12 -1234767.12 912300001     1002 143.1 125.1 ab 3 1
-123486.12 -1234867.12 922300001     1000 153.1 126.1 ab 3 1
-123496.12 -1234967.12 922300001     1001 163.1 127.1 ab 2 2
-123446.12 -1234367.12 922300001     1002 173.1 128.1 ab 1 3

我想使用第三列(例如“912300001”)與第一個檔案名稱中的數字進行比較,並將計數器“1000”與第一個檔案中的計數器進行比較。如果兩者都匹配,我想將第一個文件中第 3 列和第 4 列的值複製到第二個文件,這樣就會發生這種情況:

輸出.txt

-123456.12 1234567.12 912300001     1000 123.1 123.1 ab 1 3 -21 -21
-123466.12 1234667.12 912300001     1001 133.1 124.1 ab 2 2 -23 -22
-123476.12 1234767.12 912300001     1002 143.1 125.1 ab 3 1 -23 -21
-123486.12 1234867.12 922300001     1000 153.1 126.1 ab 3 1 Values from
-123496.12 1234967.12 922300001     1001 163.1 127.1 ab 2 2 other files
-123446.12 1234367.12 922300001     1002 173.1 128.1 ab 1 3 will come in here

如果可能的話,我想提供應該在外部文件中檢查的文件列表,例如“list.txt”。

謝謝,


編輯:解決方案是由reddit使用者提供的:commandlineluser和ropid在此。解決方法如下:

#!/bin/bash

{
    read -r line
    read -r _ _ prev_name prev_count _ <<< "$line"

    declare -A lookup
    while read -r _ key value
    do
        lookup[$key]=$value
    done < <( sed '$a\' "$prev_name.file1.txt" )

    echo "$line ${lookup[$prev_count]}"

    while read -r line
    do
        read -r _ _ name count _ <<< "$line"
        [[ $name != $prev_name ]] && {
            lookup=()
            while read -r _ key value
            do
                lookup[$key]=$value
            done < "$name.file1.txt"
        }
        prev_name=$name
        prev_count=$count
        echo "$line ${lookup[$prev_count]}"
    done
} < file2.txt

謝謝,

相關內容