问

从文件中删除重复的行块

mobiledu2502889253 发布于 2023-02-10 11:45

我有这样的特定文件结构

>ID1
data about ID1....
................
................

>ID2
data about ID2....
................
................
................
................
>ID3
data about ID3....
................
................
...............

>ID1
data about ID1....
................
>ID5
data about ID5....
................
................

我想删除这些重复的ID块.例如,在上述情况下,它是ID1.应该注意的是,只有ID部分相同,之后的数据可能不同.但是,我想保留第一个并删除所有其他的.我怎样才能以shell脚本的方式做到这一点？

1 个回答

在awk
```
awk '/^>/{p=!($0 in a);a[$0]}p' file1
```
2023-02-10 11:48 回答

love28119_529_700

撰写答案

今天，你开发时遇到什么问题呢？

立即提问

热门标签