首页 > 编程语言 >字符串包含了不需要的双引号,导致读取成json文件失败?Python怎么批量修改?

字符串包含了不需要的双引号,导致读取成json文件失败?Python怎么批量修改?

时间:2024-08-24 13:47:45浏览次数:11  
标签:文件 读取 双引号 Python json str

大家好,我是Python进阶者。

一、前言

前几天在Python最强王者交流群【哎呦喂  是豆子~】问了一个Python数据处理的问题。问题如下:

大佬们 请教下这个问题,数据为下载的html文件,写法已经固定,解析成json文件会报错,这种字符串包含了不需要的双引号,导致读取成json文件失败?怎么批量修改?用正则会把其他数据也给替换掉,出现双引号的位置内容不确定

测试数据:{ "taskType": 1, "printPageHeight": 1459, "exportTypeTemplate": "html", "reportTitle": "信息科技"网络安全漏洞扫描系统 "安全评估报告-主机报表", "companyName": "信息科技", "createTime": "2024-08-09 10:03:48", "curr_lang": "zh-CN"pt "漏洞" }

怎么批量修改成可读取的json文件?

image.png

二、实现过程

这里【猫药师Kelly】给了一个指导,如下所示:最后一个字段curr_lang意思是用到的语言,那么pt "漏洞"就是无效信息。看看是不是其它数据都符合这个规律,是的话把无效信息清洗掉。

【哎呦喂  是豆子~】:那个是我改的   造的测试数据。

后来【此类生物】给了一份代码:

import re
import json

# 原始的JSON字符串
json_str = '''{
 "taskType": 1,
 "printPageHeight": 1459,
 "exportTypeTemplate": "html",
 "reportTitle": "信息科技"网络安全漏洞扫描系统 "安全评估报告-主机报表",
 "companyName": "信息科技",
 "createTime": "2024-08-09 10:03:48",
 "curr_lang": "zh-CN"pt "漏洞"
}'''

# 修复多余的逗号
json_str = re.sub(r',\s*[^,}]*/pre>, '', json_str)

# 修复属性值,确保每个属性值都被双引号包围
# 这个正则表达式会匹配到属性名和属性值,然后尝试修复属性值
json_str = re.sub(r'("([^"]+)"\s*:\s*)([^"]+)(,?)', r'\1"\4"\5', json_str)

# 尝试将修复后的字符串解析为JSON
try:
    data = json.loads(json_str)
    print("JSON解析成功:", data)
except json.JSONDecodeError as e:
    print("JSON解析失败:", e)

【哎呦喂  是豆子~】:不行  error: invalid group reference 5 at position 7。测试数据

要把这个数据解析成json文件,正常都是可以读取的,但是部分数据为了展示好看,研发把部分数据又加了引号,导致读取成json文件的时候报错,有没有什么办法可以避开这种问题,成功读取成json格式

【瑜亮老师】:下面这个代码:

json_str = re.findall(r'"(.*?)": (.*?)[,\n]', json_str)
data = {i[0]: i[1].replace('"', ' ') for i in json_str}

这样出来就字典。就是先匹配数据中冒号两端的数据,然后替换删除右侧字符串中的双引号。

想转换成json字符串,就加一行json_str = json.dumps(data, ensure_ascii=False)

【哎呦喂  是豆子~】:还得是大佬!!!瑜亮老师的办法简直了!!!显得我更我菜了  不知道变通  难怪有ai也救不了我

【黑科技·鼓包】:向老师学习!太强了!

后来【此类生物】也给了一份代码:他补充道:或许需求不是这样,没细看。

image.png

【瑜亮老师】:我那个也只是给出一个思路。你这个可以进一步修改,保持原数据中整型不变。data = {i[0]: i[1][1:-1] if i[1][0] == '"' else int(i[1]) for i in json_str}

后来粉丝的数据又有新增,如下:

image.png

后来【瑜亮老师】也顺利地解决了粉丝的提问。

image.png

顺利地解决了自己的问题。

如果你也有类似这种Python相关的小问题,欢迎随时来交流群学习交流哦,有问必答!

三、总结

大家好,我是Python进阶者。这篇文章主要盘点了一个Python数据处理的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【哎呦喂  是豆子~】提出的问题,感谢【瑜亮老师】、【猫药师Kelly】、【冯诚】、【黑科技·鼓包】、【此类生物】给出的思路,感谢【莫生气】等人参与学习交流。

【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。

image.png

标签:文件,读取,双引号,Python,json,str
From: https://www.cnblogs.com/dcpeng/p/18377696

相关文章

  • 【python教程】打包和发布自己的项目,让别人去pip
    @目录1.环境搭建1.1换源1.2安装wheel1.3安装twine1.4注册PyPI账号2.编写setup.py2.1项目文件树2.2编写setup.py文件3.构建4.上传ERROR:Theuser'XXX'isn'tallowedtouploadtoproject''2024.1.19更新:1.环境搭建1.1换源在pip安装时使用-i参数,可以指定源。以下有许......
  • catvod、TVBox源的格式解析及合并多个源的内容(Python脚本)
    文章目录TVBox官网核心代码分析源内容的结构定义源内容的主体结构解析直播的结构解析ApiConfig其他处理代码核心类分析完整代码参考合并多个catvod、TVBox源的内容(Python脚本)可用catvod、TVBox源参考(最新接口)更新:解决Spider参数覆盖问题TVBox官网TVBox项目索引:htt......
  • Python文件管理器:一个基于wxPython的桌面应用
    在当今的软件开发世界中,管理大量的源代码文件变得越来越重要。无论是个人项目还是大型团队协作,有一个强大而灵活的文件管理工具都可以大大提高工作效率。今天,我们要介绍一个基于Python和wxPython构建的文件管理器,它专门用于管理.py文件。C:\pythoncode\new\managefiles.py......
  • Python之QRCode
    方法一:生成二维码importqrcode#生成二维码img=qrcode.make(data="你好")#将二维码保存为图片withopen('qrcode_test.png','wb')asf:img.save(f)解码二维码importcv2d=cv2.QRCodeDetector()val,_,_=d.detectAndDecode(cv2.imread('qrcode......
  • 计算机毕业设计推荐-基于python的医院预约门诊平台
    精彩专栏推荐订阅:在下方专栏......
  • 计算机毕业设计推荐-基于python的无人超市管理系统
    精彩专栏推荐订阅:在下方主页......
  • Python小白自用学习日记 | print和input函数(参考“Python_子木”的教程)&pandas的下载
            写论文要分析气象数据,下载后发现是txt格式,看来要学学python做数据处理。真是“书到用时方恨少”。我看的是B站“Python_子木”的教程。电脑里以前装过了VScode,就暂时不下载pycharm了。        仅作为一个超级小白的养成系学习日记吧。大佬们请不用点......
  • 下载小说时,python字符集编码utf-8和GBK的错误处理(慎!)
    创作背景  今天想找本小说看,但是居然只能在网页上能找到资源,作为一名测试工程师,这能忍?多么严重的体验,这还能一起愉快的玩耍了吗?还能好好摸鱼了吗?  果断花点时间,查看页面结构,写个脚本自动请求网页,获取小说内容,并进行储存到本地txt文件中,放在手机里,躺在床上慢慢看。没......
  • python Logging 模块的日志参数配置及使用
    官方文档查看路径:logging---Python的日志记录工具—Python3.12.5文档步骤一:先建立log.conf文件步骤二:在基类文件中引用log.conf文件,并创建Logger日志记录器--步骤一-----------------------log.conf文件配置信息[loggers]keys=root,infoLogger[logger_root......
  • 十大免费的Python爬虫APP!再也不用开那么多会员了!
      在探讨十大网络爬虫免费App时,需要注意的是,并非所有提到的工具都完全免费或以App形式存在。不过,我可以根据当前可用的信息和市场情况,列出一些广受欢迎且部分功能可能免费的网络爬虫工具或软件,尽管其中一些可能主要是桌面应用或框架。以下是按照您的要求整理的列表:1.八爪......