问

AWK中的正则表达式不接受懒惰选择

家里蹲是如何炼成的发布于 2023-01-31 18:58

文件

我有以下文本文件,我想从中提取"NAME ="和第一个","或")"字符之间的内容.

  AZTBCM         = (CURVE=(NAME=AZTBCM), -SOME TEXT
  B08M           = (CURVE=(NAME=B08M), -  SOME TEXT
  YMOD         = (CURVE=(NAME=YMOD), - SOME TEXT
  ZCCP         = (CURVE=(NAME=ZCCP, CURVE TYPE= GAMMA), - SOME TEXT

然而,gensub中的字符范围和懒惰选择不像nedit那样工作.在下面的awk-script文件中,您可以找到我尝试过的不同行

#! /bin/awk -f
{name=gensub(/.*NAME=(.*?)[,)].*/,"\\1","g",$0); print "line1 "name}        #line1
{name=gensub(/.*NAME=([:alnum:]*?)[,)].*/,"\\1","g",$0); print "line2 "name}    #line2
{name=gensub(/.*NAME=([0-z ]*?)[,)].*/,"\\1","g",$0); "line3 "print name}   #line3
{name=gensub(/.*NAME=([0-z Z]*?)[,)].*/,"\\1","g",$0); "line4 "print name}  #line4
{name=gensub(/.*NAME=([0-Z0-9]*?)[,)].*/,"\\1","g",$0); "line5 "print name} #line5

这产生以下:

line1 AZTBCM)
line2       AZTBCM         = (CURVE=(NAME=AZTBCM), -SOME TEXT
line3       AZTBCM         = (CURVE=(NAME=AZTBCM), -SOME TEXT
line4 AZTBCM
line5 AZTBCM
line1 B08M)
line2       B08M           = (CURVE=(NAME=B08M), -  SOME TEXT
line3 B08M
line4 B08M
line5 B08M
line1 YMOD)
line2       YMOD         = (CURVE=(NAME=YMOD), - SOME TEXT
line3 YMOD
line4 YMOD
line5 YMOD
line1 ZCCP, CURVE TYPE= GAMMA)
line2       ZCCP         = (CURVE=(NAME=ZCCP, CURVE TYPE= GAMMA), - SOME TEXT
line3       ZCCP         = (CURVE=(NAME=ZCCP, CURVE TYPE= GAMMA), - SOME TEXT
line4 ZCCP
line5 ZCCP

第1行只返回包含")"的名称.我的懒惰限定符本应该阻止这个.使用相同选择/替换的Nedit只给出了名称.看看ZCCP案例,它甚至似乎继续捕获并包括最后一个括号.

Line2不返回匹配项,因此返回$ 0.无法让这个在Nedit中起作用.(似乎不支持,没关系)

第3行应该为零,以降低ascii表的z.这对我来说是最奇怪的失败.因为我加载了更多的行,只有在名称中有Z时才会失败.甚至不像我的角色范围中的终止角色那样.

第4行我添加了空格和Z(实际上不需要空格)来查看字符范围是否由于某种未知原因而错过了它.似乎有一个,因为它现在再次起作用.忘了第5行:)

任何人都可以解释这个捕获在第一行的情况下如何工作？我不明白为什么它会推动第一个括号.其次,为什么我的角色范围不包括"Z"？

干杯,Robbert

PS这个问题似乎是两个折叠.所以我改变了这篇文章的标题,以及所得到的内容.

撰写答案

今天，你开发时遇到什么问题呢？

立即提问

热门标签