Perlsplit字符串分割函数用法指南

作者：Morpheus尘世美t | 来源：互联网 | 2022-08-19 08:50

本文向大家简单介绍一下Perlsplit函数的用法，Perl中的一个非常有用的函数是Perlsplit函数-把字符串进行分割并把分割后的结果放入数组中

本文和大家重点讨论一下Perl split函数的用法，Perl中的一个非常有用的函数是Perl split函数-把字符串进行分割并把分割后的结果放入数组中。这个Perl split函数使用规则表达式（RE），如果未特定则工作在$_变量上。

Perl split函数

Perl中的一个非常有用的函数是Perl split函数-把字符串进行分割并把分割后的结果放入数组中。这个Perl split函数使用规则表达式（RE），如果未特定则工作在$_变量上。

Perl split函数可以这样使用：

代码如下:

$info="Caine:Michael:Actor:14,LeafyDrive";  
@persOnal=split(/:/,$info);  

其结果是：@persOnal=("Caine","Michael","Actor","14,LeafyDrive");

◆如果我们已经把信息存放在$_变量中，那么可以这样：

代码如下:

@persOnal=split(/:/);

如果各个域被任何数量的冒号分隔，可以用RE代码进行分割：

代码如下:

$_="Capes:Geoff::Shotputter:::BigAvenue";  
@persOnal=split(/:+/);  

其结果是：@persOnal=("Capes","Geoff","Shotputter","BigAvenue");

但是下面的代码：

代码如下:

$_="Capes:Geoff::Shotputter:::BigAvenue";  
@persOnal=split(/:/); 

的结果是：@persOnal=("Capes","Geoff","","Shotputter","","","BigAvenue");

◆这个Perl split函数中单词可以被分割成字符，句子可以被分割成单词，段落可以被分割成句子：

代码如下:

@chars=split(//,$word); 
@words=split(//,$sentence);  
@sentences=split(/\./,$paragraph);  

在第一句中，空字符串在每个字符间匹配，所以@chars数组是一个字符的数组。>>

//之间的部分表示split用到的正则表达式（或者说分隔法则）
\s是一种通配符，代表空格
+代表重复一次或者一次以上。
所以，\s+代表一个或者一个以上的空格。
split(/\s+/,$line)表示把字符串$line,按空格为界分开。
比如说，$line="你好朋友欢迎光临我的网站jb51.net"；
split(/\s+/,$line)后得到：
你好朋友欢迎访问我的网站jb51.net

一般用法： @somearray = split(/:+/, $string ); #括号可以不要。若不指定$string, 则对默认变量$_操作，两斜线间为分割符，可以用正则表达式，强悍异常。

在perl手册里，有一个用法不多见。即： split /PATTERN/, EXPR, LIMIT；关键就是这个LIMIT参数，可以节省不少事情。如果使用了LIMIT，且是正数，表示分割成不多于LIMIT指定的数目的域。If LIMIT is unspecified or zero, trailing null fields are stripped (which potential users of pop would do well to remember). If LIMIT is negative, it is treated as if an arbitrarily large LIMIT had been specified. Note that splitting an EXPR that evaluates to the empty string always returns the empty list, regardless of the LIMIT specified.

通过制定LIMIT，可以在很长(分割产生几万个元素or域)的行分割操作中，只返回关键的前几列的域值，减少了内存使用及时间消耗。比如一般的基因型数据，第一列通常是材料命名，需要通过材料名的判断取舍，这时候就可以这样用。 my ($firstfield) = split /\t/, $someline, 1; 如果需要前面几列的值，这样的方式对大文件效率很好： my （undef, $var1, undef, undef, undef, $var2）=split /\t/, $someline, 6;

有网友对这种方式做了测试，显示较好。引用如下：
>>>
一个文件，每行都有18项，各项之间用\t分割，使用时用到了第6项，折腾了几种用法

代码如下:

my @array = split("\t",$_); my $var = $array[6];   测试文件平均用时8.2s
 my($var) = (split("\t",$_))[6];  测试平均用时5.1s
 my(undef,undef,undef,undef,undef,undef,$var) = split("\t",$_); 平均用时3.53s
 my(undef,undef,undef,undef,undef,undef,$var) = split("\t",$_,7);平均用时3.52s
 my $var = (split("\t",$_,7))[6]; 平均用时3.53s

看来后3种才是王道，如果需要使用多项也可以进行进行适当的变动。不过两项如果跨度比较大，3，4应该是不错选择，5就只能用中间数组。

自己动手测试下吧。

perl
lua

推荐阅读

sum
页面请求方法参数最长_关于 HTTP GET/POST 请求参数长度最大值的一个理解误区

http:my.oschina.netleejun2005blog136820刚看到群里又有同学在说HTTP协议下的Get请求参数长度是有大小限制的，最大不能超过XX ... [详细]

蜡笔小新 2023-12-13 19:20:03
ip
Openresty+Lua+Redis灰度发布

Openresty+Lua+Redis灰度发布灰度发布，简单来说，就是根据各种条件，让一部分用户使用旧版本，另一部分用户使用新版本。百度百科中解释：灰度发布是指在黑与白之间，能够平 ... [详细]

蜡笔小新 2023-10-15 13:04:33
ip
Server Installation for Jitsi Meet

2019独角兽企业重金招聘Python工程师标准ServerInstallationforJitsiMeetThisdescribesconfiguringaserverji ... [详细]

蜡笔小新 2023-10-14 19:43:03
version
在lua中调用DLL

整整的花了一个下午的时候，才在lua中调用了动态链接库。比起其他脚本语言，lua的调用方式算是比较繁琐的，但是lua的编程思想非常的统一& ... [详细]

蜡笔小新 2023-10-14 18:22:27
string
在Lua中处理TSV文件

我有一个非常大的TSV文件。第一行是标题。如果字段为空白，则以下各行包含数 ... [详细]

蜡笔小新 2023-10-14 10:54:39
sum
单目标应用：最有价值球员算法（Most Valuable Player Algorithm，MVPA）求解旅行商问题TSP

一、最有价值球员算法最有价值球员算法（MostValuablePlayerAlgorithm，MVPA）由Bouchekara等人于20 ... [详细]

蜡笔小新 2023-10-14 10:30:17
ip
redis知识汇总[随笔记录]

... [详细]

蜡笔小新 2023-10-13 17:02:48
ip
luaI/O

--文件IO：分简单模式与完全模式。简单模式在做一些简单的文件操作时较为合适。但是在进行一些高级的文件操作的时候，简单模式就显得力不从心。例如同时读取多 ... [详细]

蜡笔小新 2023-10-13 13:36:55
version
样式迁移(风格迁移)

原文来源：https:arxiv.org、https:github.com作者：FujunLuan、SylvainParis、EliShechtman、KavitaB ... [详细]

蜡笔小新 2023-10-13 12:12:36
install
require luasql.mysql_luarocks错误 require ‘luasql.mysql' 报module 'luasql.mysql' not found:

错误：requireluasql.mysqlstdin:1:moduleluasql.mysqlnotfound:nofieldpackage.preload[lua ... [详细]

蜡笔小新 2023-10-13 11:22:42
ip
基于Redis实现分布式锁剖析

之前的文章《分布式锁详解-分别利用Zookeeper和数据库实现分布式锁》，由于篇幅太长，又碰上加班时间不够充裕，所以没有把Redis的实 ... [详细]

蜡笔小新 2023-10-13 09:59:20
version
luarestyqlesswebUI界面运行

lua-resty-qless-web是lua-resty-qless的web管理界面以及lua-resty-template模版引擎开发的，里面实现了一个简单的路由功能备注：de ... [详细]

蜡笔小新 2023-10-13 09:47:59
version
软链接和硬链接的解读

1、概念解读1.1什么是链接？链接是一种在共享文件和访问它的用户的若干目录项之间建立联系的方法。Linux系统中有两种链接：硬链接（HardLink）和软链接（SoftLink）， ... [详细]

蜡笔小新 2023-10-13 09:35:49
process
英语专业计算机基础知识,计算机专业英语基础知识

《计算机专业英语基础知识》由会员分享，可在线阅读，更多相关《计算机专业英语基础知识(25页珍藏版)》请在人人文库网上搜索。1、专业英语知识补充,本章学习 ... [详细]

蜡笔小新 2023-10-13 09:04:31
process
php还能用多少年(php还行吗)

导读：很多朋友问到关于php还能用多少年的相关问题，本文编程笔记就来为大家做个详细解答，供大家参考，希望对大家有所帮助！一起来看看吧！本文目录一览： ... [详细]

蜡笔小新 2023-10-13 01:01:25

Morpheus尘世美t

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章