我有一个超过40.000行(file1)的文件,我想提取与file2中的模式匹配的行(约6000行).我像这样使用grep,但它很慢:
grep -f file2 file1 > out
有没有更快的方法来使用awk
或sed
?
这是我文件的一些摘录:
File1: scitn003869.2| scign003869 CGCATGTGTGCATGTATTATCGTATCCCTTG scitn007747.1| scign007747 CACGCAGACGCAGTGGAGCATTCCAGGTCACAA scitn003155.1| scign003155 TAAAAATCGTTAGCACTCGCTTGGTACACTAAC scitn018252.1| scign018252 CGTGTGTGTGCATATGTGTGCATGCGTG scitn004671.2| scign004671 TCCTCAGGTTTTGAAAGGCAGGGTAAGTGCT
File2: scign000003 scign000004 scign000005 scign004671 scign000013
`