Python实现像awk一样分割字符串

2020-10-10 0 500

若你使用过 Shell 中的 awk 工具,会发现用它来分割字符串是非常方便的。特别是多个连续空格会被当做一个处理。

[root@localhost ~]# cat demo.txt
hello world
[root@localhost ~]#
[root@localhost ~]# awk \'{print$1,$2}\’ demo.txt
hello world

可是转换到 Python 上面来呢?结果可能是这样的。

>>> msg=\’hello world\’
>>> msg.split(\’ \’)
[\’hello\’, \’\’, \’\’, \’\’, \’world\’]

与我预想的结果不符,多个空格会被分割多次。

那有什么办法可以达到 awk 一样的效果呢?

有两种方法。

第一种方法

不加参数,这种只适用于将多个空格当成一个空格处理,如果不是以空格为分隔符的场景,这种就不适用了。

>>> msg=\’hello world\’
>>> msg.split()
[\’hello\’, \’world\’]

第二种方法

使用 filter 来辅助,这种适用于所有的分隔符,下面以 – 为分隔符来举例。

>>> msg=\’hello—-world\’
>>> msg.split(\’-\’)
[\’hello\’, \’\’, \’\’, \’\’, \’world\’]
>>>
>>> filter(None, msg.split(\’-\’))
[\’hello\’, \’world\’]

是不是很神奇,filter 印象中第一个参数接收的是 函数,这里直接传 None 居然有奇效。

查看了注释,原来是这个函数会适配 None 的情况,当第一个参数是None的时候,返回第二个参数(可迭代对象)中非空的值,非常方便。

Python实现像awk一样分割字符串

换用函数的写法,可以这样

>>> msg=\’hello—-world\’
>>> msg.split(\’-\’)
[\’hello\’, \’\’, \’\’, \’\’, \’world\’]
>>>
>>> filter(lambda item: True if item else False, msg.split(\’-\’))
[\’hello\’, \’world\’]

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持自学编程网。

遇见资源网 Python Python实现像awk一样分割字符串 http://www.ox520.com/27096.html

常见问题

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务