我正在解析一个数据集,该数据集恼人地决定用逗号分隔TSV中的项目(PharmaGKB路径,我正在看你),但是在每个逻辑元素中都允许使用逗号.
基本上,逗号后跟空格表示没有分隔符,而逗号后跟字符表示新元素.
"这是一个,元素,两个元素,三个元素"
应该:
这是一个元素
两个元素
三要素
我有正则表达式a.split(",\\S+");
,它分裂很好但它删除了每次拆分后的第一个字符.
这是一个元素
wo元素
hree元素
正则表达式就像是为我找牙医,非常感谢帮助.
积极的向前看:
a.split(",(?=\\S)");