我有以下文本文件,我想从中提取"NAME ="和第一个","或")"字符之间的内容.
AZTBCM = (CURVE=(NAME=AZTBCM), -SOME TEXT B08M = (CURVE=(NAME=B08M), - SOME TEXT YMOD = (CURVE=(NAME=YMOD), - SOME TEXT ZCCP = (CURVE=(NAME=ZCCP, CURVE TYPE= GAMMA), - SOME TEXT
然而,gensub中的字符范围和懒惰选择不像nedit那样工作.在下面的awk-script文件中,您可以找到我尝试过的不同行
#! /bin/awk -f {name=gensub(/.*NAME=(.*?)[,)].*/,"\\1","g",$0); print "line1 "name} #line1 {name=gensub(/.*NAME=([:alnum:]*?)[,)].*/,"\\1","g",$0); print "line2 "name} #line2 {name=gensub(/.*NAME=([0-z ]*?)[,)].*/,"\\1","g",$0); "line3 "print name} #line3 {name=gensub(/.*NAME=([0-z Z]*?)[,)].*/,"\\1","g",$0); "line4 "print name} #line4 {name=gensub(/.*NAME=([0-Z0-9]*?)[,)].*/,"\\1","g",$0); "line5 "print name} #line5
这产生以下:
line1 AZTBCM) line2 AZTBCM = (CURVE=(NAME=AZTBCM), -SOME TEXT line3 AZTBCM = (CURVE=(NAME=AZTBCM), -SOME TEXT line4 AZTBCM line5 AZTBCM line1 B08M) line2 B08M = (CURVE=(NAME=B08M), - SOME TEXT line3 B08M line4 B08M line5 B08M line1 YMOD) line2 YMOD = (CURVE=(NAME=YMOD), - SOME TEXT line3 YMOD line4 YMOD line5 YMOD line1 ZCCP, CURVE TYPE= GAMMA) line2 ZCCP = (CURVE=(NAME=ZCCP, CURVE TYPE= GAMMA), - SOME TEXT line3 ZCCP = (CURVE=(NAME=ZCCP, CURVE TYPE= GAMMA), - SOME TEXT line4 ZCCP line5 ZCCP
第1行只返回包含")"的名称.我的懒惰限定符本应该阻止这个.使用相同选择/替换的Nedit只给出了名称.看看ZCCP案例,它甚至似乎继续捕获并包括最后一个括号.
Line2不返回匹配项,因此返回$ 0.无法让这个在Nedit中起作用.(似乎不支持,没关系)
第3行应该为零,以降低ascii表的z.这对我来说是最奇怪的失败.因为我加载了更多的行,只有在名称中有Z时才会失败.甚至不像我的角色范围中的终止角色那样.
第4行我添加了空格和Z(实际上不需要空格)来查看字符范围是否由于某种未知原因而错过了它.似乎有一个,因为它现在再次起作用.忘了第5行:)
任何人都可以解释这个捕获在第一行的情况下如何工作?我不明白为什么它会推动第一个括号.其次,为什么我的角色范围不包括"Z"?
干杯,Robbert
PS这个问题似乎是两个折叠.所以我改变了这篇文章的标题,以及所得到的内容.