如何找到兩個文件之間的相似之處?

如何找到兩個文件之間的相似之處?

您好,我是 Linux 新手,我有兩個文件,其中一個具有序列 ID(文件 1),另一個文件具有序列 ID 和序列(文件 1)。如果 file_1 中存在的sequence_id(file_1)要儲存在新檔案中,我必須這樣做。

例子: 文件_1

lcl|NW_002477239.1_gene_517
lcl|NW_002477243.1_gene_364
lcl|NW_002477248.1_gene_148
lcl|NW_002477249.1_gene_419
lcl|NW_002477249.1_gene_95 

文件_2

>lcl|NW_002477253.1_gene_1
TGATGGAAGCTTCCAATTCTCCCGACCAACAATCAGTGCTCAGTGAATCTATCCTTGTTAGCGAGTCGCTTGTTCCA
>lcl|NW_002477239.1_gene_517
ATGGCTGATTTTGCAAAGGATCCTGCTCTCAACGCAGCATTATCTGCACCATGGGCGTTTCTCTGCCCTACATCAGAATTAAACGATACCATA

預期產出

>lcl|NW_002477239.1_gene_517
ATGGCTGATTTTGCAAAGGATCCTGCTCTCAACGCAGCATTATCTGCACCATGGGCGTTTCTCTGCCCTACATCAGAATTAAACGATACCATA

請幫我解決這個問題。

答案1

您可以使用此 bash 腳本來取得匹配結果

!#/bin/bash
while read line
do
     grep $line File_2 >> file
done <./File_1

相關內容