python中的正则表达式与json数据交换格式

 更新时间:2019年07月03日 14:12:30   作者:张 涛   我要评论

正则表达式 是一个特殊的字符序列,一个字符串是否与所设定的这样的字符序列,相匹配快速检索文本、实现替换文本的操作。这篇文章主要介绍了python中的正则表达式与json ,需要的朋友可以参考下

一、初识正则表达式

正则表达式 是一个特殊的字符序列,一个字符串是否与所设定的这样的字符序列,相匹配快速检索文本、实现替换文本的操作

json(xml) 轻量级 web 数据交换格式

import re
a='c|c++|java|c#||python|javascript'
r= re.findall('python',a)
print(r)
if len(r) > 0:
 print('字符串中包含python')
else:
 print('no')
['python']
字符串中包含python 

二、元字符与普通字符

import re
a='c0c++7java8c#9python6javascript'
r= re.findall('\d',a)
print(r)
b=''
for x in a:
 try:
 int(x)
 b +=x+','
 except :
 pass
print(b)

结果:

['0', '7', '8', '9', '6']
0,7,8,9,6,

'python' 普通字符 '\d' 元字符

三、字符集

import re
#找出中间一个字符不是c 和f的 单词
s = 'abc, acc, adc, aec, afc, ahc'
r = re.findall('a[^cf]c', s) #[a-z] [cf]
print(r)

结果:

['abc', 'adc', 'aec', 'ahc']

四、概括字符集

#\d 数字 \d 字母
#\w 数字和字母 =[a-za-z0-9_] \w 
#\s 空白字符 \s
a='python 11\t11java&678p\nh\rp'
r = re.findall('\s', a)
print(r)

结果:

[' ', '\t', '\n', '\r']

五、数量词

a='python 1111java&678php'
r = re.findall('[a-z]{3,6}', a)
print(r)

结果:

['python', 'java', 'php']

六、贪婪与非贪婪

a='python 1111java&678php'
r = re.findall('[a-z]{3,6}?', a)
#贪婪 与 非贪婪 ?
print(r)

结果:

['pyt', 'hon', 'jav', 'php']

七、匹配0次1次或者无限多次

# * 匹配0次或者无限多次
# + 匹配1次或者无限多次
# ? 匹配0次或者1次
a='pytho0python1pythonn2pythonw'
r = re.findall('python*', a)
print(r)

结果:

['pytho', 'python', 'pythonn', 'python']

八、边界匹配符

qq = '12345678'
# 4~8 
r = re.findall('^\d{4,8}$', qq)
print(r)
a = '123456789'
# 4~8 ^规则$ ^开头 $结尾
e = re.findall('^\d{4,8}$', a)
print(e)

结果:

['12345678']
[]

九、组

# () 组
a = 'pythonpythonpythonpythonpython'
# 
r = re.findall('(python){3}', a)
print(r)

结果:

['python'] 代表存在一组(pythonpythonpython) 这样的数据

十、匹配模式参数

# i | s 忽略大小写 | 匹配所有字符
lanuage = 'pythonc#\njavaphp'
r = re.findall('c#.{1}', lanuage,re.i | re.s)
print(r)

结果:

['c#\n']

十一、re.sub正则替换

搜索替换

def convert(value):
 matched = value.group()
 # print(value) <_sre.sre_match object; span=(6, 8), match='c#'>
 return '!!'+matched+'!!'
lanuage = 'pythonc#javac#phpc#'
# r = re.sub('c#', 'go', lanuage, 1) 返回结果: pythongojavac#phpc#
# s=lanuage.replace('c#', 'go')
r = re.sub('c#', convert, lanuage) #传入参数
print(r)

结果:

python!!c#!!java!!c#!!php!!c#!!

十二、把函数作为参数传递

def convert(value):
 matched = value.group() #拿到对象的值
 # print(value) <_sre.sre_match object; span=(6, 8), match='c#'>
 if int(matched) >=6 :
 return '9'
 else:
 return '0'
lanuage = 'a8c3721d86'
r = re.sub('\d', convert, lanuage)
print(r)
#
a9c0900d99

十三、search与match函数

s = 'a8c3721d86'
# none 从开头开始匹配 假如没有找到相应的匹配结果 返回none 只匹配一次
r = re.match('\d', s) 
print(r) #none
#搜索这个字符串 一旦找到第一个满足匹配的结果就返回 只匹配一次
r1 = re.search('\d', s)
print(r1) #<_sre.sre_match object; span=(1, 2), match='8'>
print(r1.group()) #8
print(r1.span()) # (1, 2)
r2 = re.findall('\d', s)
print(r2) #['8', '3', '7', '2', '1', '8', '6']

十四、group分组

#提取life 和python 之间的值
s = 'life is short,i use python'
#none
r = re.search('life.*python', s)
print(r.group()) #life is short,i use python group(组号)
r = re.search('life(.*)python', s)
print(r.group(0)) #life is short,i use python group(组号)
print(r.group(1)) # is short,i use
#group(0) 一种特殊情况 匹配正则表达式完整的结果
r = re.findall('life(.*)python', s)
print(r) #[' is short,i use ']
s = 'life is short,i use python, i love python'
r = re.search('life(.*)python(.*)python', s)
print(r.group(0)) # life is short,i use python, i love python 
print(r.group(1)) # is short,i use
print(r.group(2)) # , i love
print(r.group(0,1,2)) #('life is short,i use python, i love python', ' is short,i use ', ', i love ')
print(r.groups()) # (' is short,i use ', ', i love ')

十五、一些关于学习正则的建议

#\d 数字 \d 字母
#\w 数字和字母 =[a-za-z0-9_] \w 
#\s 空白字符 \s
# . 匹配除了换行符\n之外其他所有字符
# * 匹配0次或者无限多次
# + 匹配1次或者无限多次
# ? 匹配0次或者1次
# () 组 
# i | s 忽略大小写 | 匹配所有字符

python :爬虫,数据处理

十六、理解json

json 是一种轻量级的数据交换格式

字符串是json的表现形式

符合 json 格式的字符串叫做 json 字符串

{"name":"qiyue"}

json vs xml

优势:

跨语言交换数据

易于阅读

易于解析

网络传输效率高

十七、反序列化

import json
# json object array
json_str = '{"name":"qiyue","age":18}'
s = json.loads(json_str)
# dict
#反序列化
s = json.loads(json_str) #load() 把json 的数据类型 转换为自己语言的数据类型
print(type(s)) #<class 'dict'>
print(s) #{'name': 'qiyue', 'age': 18}
print(s['name']) # qiyue
json_str = '[{"name":"qiyue","age":18},{"name":"qiyue","age":18}]'
s = json.loads(json_str)
print(type(s)) # <class 'list'>
print(s) # [{'name': 'qiyue', 'age': 18}, {'name': 'qiyue', 'age': 18}]json python
object dict
array list
string str
number int
number float
true true
false false
null none

十八、序列化

#序列化 为json
student = [
 {"name":"qiyue","age":18, 'flag':false},
 {"name":"python","age":18}
]
json_str = json.dumps(student)
print(type(json_str)) # <class 'str'>
print(json_str) #[{"name": "qiyue", "age": 18, "flag": false}, {"name": "python", "age": 18}]

十九、小谈json、json对象与json字符串

json 是一种轻量级的数据交换格式

json对象 局限于语言

json字符串

json 有自己的数据类型

虽然它和javascript 的数据类型有些相似 但是他们不是一种语言

ecmascript一个标准 javascript actionscription json 实现标准的一种方案

rest 服务

总结

以上所述是小编给大家介绍的python中的正则表达式与json数据交换格式 ,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

相关文章

最新评论