如何找到兩個文件之間的相似之處？

2024-6-10 • tag-icon

您好，我是 Linux 新手，我有兩個文件，其中一個具有序列 ID（文件 1），另一個文件具有序列 ID 和序列（文件 1）。如果 file_1 中存在的sequence_id（file_1）要儲存在新檔案中，我必須這樣做。

例子： 文件_1

lcl|NW_002477239.1_gene_517
lcl|NW_002477243.1_gene_364
lcl|NW_002477248.1_gene_148
lcl|NW_002477249.1_gene_419
lcl|NW_002477249.1_gene_95

文件_2

>lcl|NW_002477253.1_gene_1
TGATGGAAGCTTCCAATTCTCCCGACCAACAATCAGTGCTCAGTGAATCTATCCTTGTTAGCGAGTCGCTTGTTCCA
>lcl|NW_002477239.1_gene_517
ATGGCTGATTTTGCAAAGGATCCTGCTCTCAACGCAGCATTATCTGCACCATGGGCGTTTCTCTGCCCTACATCAGAATTAAACGATACCATA

預期產出：

>lcl|NW_002477239.1_gene_517
ATGGCTGATTTTGCAAAGGATCCTGCTCTCAACGCAGCATTATCTGCACCATGGGCGTTTCTCTGCCCTACATCAGAATTAAACGATACCATA

請幫我解決這個問題。

答案1

您可以使用此 bash 腳本來取得匹配結果

!#/bin/bash
while read line
do
     grep $line File_2 >> file
done <./File_1

答案1

相關內容