我正在尝试构建一个与2个字符的重复DNA序列匹配的正则表达式.这些字符可以是相同的.
正则表达式应该匹配2个字符的重复序列至少3次,这里有一些例子:
正则表达式应匹配:
ATATAT
GAGAGAGA
CCCCCC
并且不应该匹配:
ACAC
ACGTACGT
到目前为止,我已经提出了以下正则表达式:
[ACGT]{2}
它捕获由恰好两个字符(A,C,G或T)组成的任何序列.现在我想重复这个模式至少三次,所以我尝试了以下正则表达式:
[ACGT]{2}{3,} ([ACGT]{2}){3,}
不幸的是,第一个引发了"多重复"错误(Python),而第二个错误只是匹配任何包含A,C,G和T组成的6个字符的序列.
有没有人可以帮我解决这个正则表达式?提前致谢.