正则怎么取这样的数据

foming 发布于 2016/12/02 13:43
阅读 197
收藏 0

<bb>321</bb>

<bb id="123123"> this is my love </bb>

<bb>12341</bb>

怎么用正则取  this is my love 

加载中
0
Feng_Yu
Feng_Yu

标记类型的文档不适合用正则,非常难维护。个人建议用Xpath或者DOM解析一类的类库去搞。

比如Xpath提取这个内容就相当简单,表达式: /bb[@id="123123"]/text()

554330833a
554330833a
大神
0
yak
yak
import re

text='''
<bb>321</bb>

<bb id="123123"> this is my love </bb>

<bb>12341</bb>
'''


match= re.findall('<bb.+?>(.*?)</bb>',text)
print(match)



0
开源中国最帅没有之一
开源中国最帅没有之一

不知道楼主是什么语言。如果是基于js的宿主环境可以使用cheerio这个库。

正则表达式 @yak 大牛已经给出来了

返回顶部
顶部