Perl使用技巧
Perl哈希嵌套数组
https://blog.csdn.net/weixin_56198196/article/details/120978024
1)访问哈希中的数组的元素:
$hash{$key}[position];
就可以访问哈希里嵌套的数组的元素了,这里的position就是指要访问第几个元素(从0开始的)
2)把数组直接赋值给哈希中的数组:
$hash{$key}=[@array];
就可以把数组传递给哈希了
3)push()
:
向数组中添加元素
push(@{$hash{$key}},element);
如果是添加一组数
push(@{$hash{$key}},@array);
注:
1)$hash{$key}[0]=2
,这里的$key
假设为“apple”,如果要print
的话,apple不要带上双引号,类似这样 print"$hash{"apple"}[0]"
,这样是会报错的,写为 print"$hash{apple}[0]"
就可以了
2)print($hash{$array});
得到的是array的地址,不是其中的元素,想要看其中有什么元素要这样写 print(@{$hash{$array}});
3)需要初始化:$hash{$key} = [()];
Perl哈希嵌套哈希
与哈希嵌套数组类似,例:
定义:$hash{$key1}->{$key2} = $a
取用值:$hash{$key1}->{$key2}
取用键:keys %{$hash{$key1}}
Perl数组排序
https://www.jb51.net/article/67894.htm https://blog.csdn.net/zxianyong/article/details/5931487
Perl有个内置函数叫做sort
,毫无疑问的可以排序一个数组。其最简单的形式是传递一个数组,它会返回排序后的元素组成的数组:@sorted = sort @original
。
基于ASCII码排序
Perl的sort
的工作方式是这样的,它遍历原始数组的每两个元素;每次把左边的值放入变量$a
,把右边的值放入变量$b
。然后调用比较函数。如果$a
的内容应该在左边的话,比较函数会返回1
;如果$b
应该在左边的话,返回-1
,两者一样的话,返回0
。
通常你看不到比较函数,sort
会根据ASCII码表对值进行比较,不过如果你想的话,你可以显式的写出来:sort { $a cmp $b } @words;
这段代码会跟没有使用块的sort @words
达到同样的效果。
这里你可以看到,默认Perl使用cmp
作为比较函数。这是因为正是cmp
可以做这里边我们需要的工作。 它比较两边的字符串的值,如果左边参数“小于”右边参数,就返回1;如果左边参数“大于”右边参数,就返回-1;如果相等,就返回0。
按字母顺序排列(忽略大小写)
对数值排序(使用<=>
)
<=>
)Hash 按 keys 排序
Hash 按 value 排序
Perl数组去重
https://www.cnblogs.com/mmtinfo/p/11970736.html
利用hash去重
基本原理是将原数组元素作为hash
的key
,遍历计数,grep
函数筛选出只出现一次的key
,放入新的数组@uniq
中。
利用uniq函数去重
这个函数所在的模块:List::MoreUtils
Perl函数参数传递与返回值
https://www.cnblogs.com/tobecrazy/archive/2013/06/11/3131887.html
参数传递
普通模式:参数中没有数组和哈希
无论参数有多少个,均能正常传递。
文艺模式:参数中包含数组
还是这个函数,只不过我们传递的参数里包括一个数组
当我们只传入2个参数,一个数组,一个变量,结果是这样,变成了5个参数。无论数组在前还是在后,都是显示5个参数。 由此@_
会把数组每一个值当做一个参数储存。那我的疑问是perl能否正确的把传递的数组还原成数组而不是单个变量???
那我们换一种方式接受参数:
结果令人意外,$variable
传递的参数丢失,同时数组却取得所有参数,相当于把变量归为数组的一个元素。perl接受传递来的数组,会贪婪的把变量变成数组的元素。所以在接受参数传递赋值时,不要把数组放前面。
改成这样就好了:
如果要传递2个数组怎么办???可以采用引用的方式:
perl使用引用是在变量或数组前加\
,相当于地址传递
The Arrow Operators (->
)
->
)https://www.shlomifish.org/lecture/Perl/Newbies/lecture2/references/arrow.html
An arrow (->
) followed by a square ([]
) or curly brackets ({}
) can be used to directly access the elements of an array or a hash referenced by a certain hash. For instance: $array_ref->[5]
will retrieve the 5th element of the array pointed to by $array_ref
.
An example:
Note that the arrows following the first arrow are optional as perl sees that the programmer wishes to access the subseqeunt sub-items. However, the first one is mandatory because the expression $array_ref{'elem'}
looks for the hash %array_ref
.
Perl正则表达式
https://blog.csdn.net/blog_abel/category_2657845.html https://www.runoob.com/perl/perl-regular-expressions.html https://perl-book.junmajinlong.com/ch6/12_y_tr.html
匹配操作符m/regex/
m/regex/
用于匹配一个字符串语句或者一个正则表达式,如m//
、~//
、$a=~/a/; $b!~/b/
。模式匹配有一些常用的修饰符,如下表所示:
i
忽略模式中的大小写
m
多行模式
o
仅赋值一次
s
单行模式,"."匹配"\n"(默认不匹配)
x
忽略模式中的空白
g
全局匹配
cg
全局匹配失败后,允许再次查找匹配串
perl处理完后会给匹配到的值存在三个特殊变量名:
$`: 匹配部分的前一部分字符串
$&: 匹配的字符串
$': 还没有匹配的剩余字符串
如果将这三个变量放在一起,你将得到原始字符串。
查找替换s/regex/rep/mod
s/regex/rep/mod
替换操作修饰符如下表所示:
i
取消大小写敏感性
m
默认的正则开始^和结束"$"只是对于正则字符串如果在修饰符中加上"m",那么开始和结束将会指字符串的每一行:每一行的开头就是"^",结尾就是"$"
o
表达式只执行一次
x
表达式中的空白字符将会被忽略,除非它已经被转义
r
默认情况下,s///的返回值是替换成功的次数,然后改变原始标量。使用r修饰符,可以让这个替换操作返回替换后的字符串,而原始标量的值不会发生变化。
g
替换所有匹配的字符串
e
替换字符串作为表达式
s///
s///r
s///g
s///e
转化操作符tr/regex/rep/
tr/regex/rep/
用于字符映射转换。以下是转化操作符相关的修饰符:
c
转化所有未指定字符
d
删除所有指定字符
s
把多个相同的输出字符缩成一个
例:
更多正则表达式规则
.
匹配除换行符以外的所有字符
x?
匹配 0 次或一次 x 字符串
x*
匹配 0 次或多次 x 字符串,但匹配可能的最少次数
x+
匹配 1 次或多次 x 字符串,但匹配可能的最少次数
.*
匹配 0 次或多次的任何字符
.+
匹配 1 次或多次的任何字符
{m}
匹配刚好是 m 个 的指定字符串
{m,n}
匹配在 m个 以上 n个 以下 的指定字符串
{m,}
匹配 m个 以上 的指定字符串
[]
匹配符合 [] 内的字符
[^]
匹配不符合 [] 内的字符
[0-9]
匹配所有数字字符
[a-z]
匹配所有小写字母字符
[^0-9]
匹配所有非数字字符
[^a-z]
匹配所有非小写字母字符
^
匹配字符开头的字符
$
匹配字符结尾的字符
\d
匹配一个数字的字符,和 [0-9] 语法一样
\d+
匹配多个数字字符串,和 [0-9]+ 语法一样
\D
非数字,其他同 \d
\D+
非数字,其他同 \d+
\w
英文字母或数字的字符串,和 [a-zA-Z0-9_] 语法一样
\w+
和 [a-zA-Z0-9_]+ 语法一样
\W
非英文字母或数字的字符串,和 [^a-zA-Z0-9_] 语法一样
\W+
和 [^a-zA-Z0-9_]+ 语法一样
\s
空格,和 [\n\t\r\f] 语法一样
\s+
和 [\n\t\r\f]+ 一样
\S
非空格,和 [^\n\t\r\f] 语法一样
\S+
和 [^\n\t\r\f]+ 语法一样
\b
匹配以英文字母,数字为边界的字符串
\B
匹配不以英文字母,数值为边界的字符串
a|b|c
匹配符合a字符 或是b字符 或是c字符 的字符串
abc
匹配含有 abc 的字符串 (pattern) () 这个符号会记住所找寻到的字符串,是一个很实用的语法.第一个 () 内所找到的字符串变成 $1 这个变量或是 \1 变量,第二个 () 内所找到的字符串变成 $2 这个变量或是 \2 变量,以此类推下去.
/pattern/i
i 这个参数表示忽略英文大小写,也就是在匹配字符串的时候,不考虑英文的大小写问题. \ 如果要在 pattern 模式中找寻一个特殊字符,如 "*",则要在这个字符前加上 \ 符号,这样才会让特殊字符失效
懒惰限定符
默认情况下,Perl 的正则表达式是“贪婪地”,也就是说它们将尽可能多地匹配字符。要改变匹配特点,只须简单地在量词(加号[+]或星号[*])后面加一个问号(?)即可。 如下:
*?
重复任意次,但尽可能少重复
+?
重复1次或更多次,但尽可能少重复
??
重复0次或1次,但尽可能少重复
{n,m}?
重复n到m次,但尽可能少重复
{n,}?
重复n次以上,但尽可能少重复
Perl文件操作
https://www.cnblogs.com/wanghuixi/p/12072840.html
-r
文件或目录可读
-w
文件或目录可写
-x
文件或目录执行
-o
文件或目录归用户所有
-R
文件或目录对真正用户可读
-W
文件或目录对真正用户可写
-X
文件或目录对真正用户执行
-O
文件或目录归真正用户所有
-e
文件或目录存在
-z
文件存在且大小为0
-s
文件或目录存在且不为0(返回字节数)
-f
文件为普通文件
-d
文件为目录
-l
文件为符号链接
-p
文件为命名管道(FIFO)
-S
文件为一个套口(socket)
-b
文件为块特殊文件
-c
文件为字符特殊文件
-t
打开tty控制台的文件句柄
-u
文件或目录是设置用户ID号
-g
文件或目录是设置用户组ID号
-k
文件或目录的sticky位置位
-T
文件是文本文件
-B
文件是二进制文件
-M
以天为单位的存在时间
-A
以天为单位访问时间
-C
以天为单位同代码更改时间
例:
Last updated