本教程旨在解决接收到由多个独立json对象直接拼接而成,而非封装在数组或以逗号分隔的非标准json响应数据。我们将介绍一种基于行检测的python方法,通过识别相邻的`}`和`{`字符序列来精确分割并解析每个独立的json对象,从而有效处理此类特殊数据格式。
在数据交换中,JSON(JavaScript Object Notation)因其轻量级和易于解析的特性而广受欢迎。通常,当我们需要传输多个JSON对象时,它们会被封装在一个JSON数组中,例如 [{...}, {...}],或者以逗号分隔。然而,在某些特定场景下,我们可能会遇到一种非标准的JSON响应格式,即多个独立的JSON对象直接拼接在一起,既没有外部的数组方括号,也没有对象之间的逗号分隔符。这种格式 {...}{...} 无法直接使用标准的 json.loads() 方法进行解析,因为它不构成一个合法的JSON文档。
标准的JSON规范要求一个JSON文档要么是一个对象,要么是一个数组。当服务器返回多个JSON对象时,它们通常会像这样组织:
[
{
"id": 1,
"name": "Object One"
},
{
"id": 2,
"name": "Object Two"
}
]然而,本教程所讨论的场景是接收到以下形式的数据:
{
"self": "https://example1.com",
"key": "keyOne",
"name": "nameOne",
"emailAddress": "mailOne",
"avatarUrls": {
"48x48": "https://test.com/secure/useravatar?avatarId=1",
"24x24": "https://test.com/secure/useravatar?size=small&avatarId=1",
"16x16": "https://test.com/secure/useravatar?size=xsmall&avatarId=1",
"32x32": "https://test.com/secure/useravatar?size=medium&avatarId=1"
},
"displayName": "displayNameOne",
"active": true,
"timeZone": "Europe",
"locale": "en_UK"
}
{
"self": "https://example2.com",
"key": "keyTwo",
"name": "nameTwo",
"emailAddress": "mailTwo",
"avatarUrls": {
"48x48": "https://test.com/secure/useravatar?avatarId=2",
"24x24": "https://test.com/secure/useravatar?size=small&avatarId=2",
"16x16": "https://test.com/secure/useravatar?size=xsmall&avatarId=2",
"32x32": "https://test.com/secure/useravatar?size=medium&avatarId=2"
},
"displayName": "displayNameTwo",
"active": false,
"timeZone": "Europe",
"locale": "en_US"
}这种格式在Python中直接使用 json.loads() 会导致 json.JSONDecodeError,因为它被视为一个包含多个根级别元素的无效JSON字符串。
要成功解析这种非标准格式,我们需要一种方法来识别每个独立JSON对象的边界。观察上述数据结构,可以发现一个关键模式:一个JSON对象的结束标记 } 紧接着下一行就是下一个JSON对象的开始标记 {。我们可以利用这个特征来手动分割整个响应字符串。
核心思路如下:
以下是使用Python实现此解析策略的详细步骤和代码:
首先,准备我们的非标准JSON数据:
data = '''
{
"self": "https://example1.com",
"key": "keyOne",
"name": "nameOne",
"emailAddress": "mailOne",
"avatarUrls": {
"48x48": "https://test.com/secure/useravatar?avatarId=1",
"24x24": "https://test.com/secure/useravatar?size=small&avatarId=1",
"16x16": "https://test.com/secure/useravatar?size=xsmall&avatarId=1",
"32x32": "https://test.com/secure/useravatar?size=medium&avatarId=1"
},
"displayName": "displayNameOne",
"active": true,
"timeZone": "Europe",
"locale": "en_UK"
}
{
"self": "https://example2.com",
"key": "keyTwo",
"name": "nameTwo",
"emailAddress": "mailTwo",
"avatarUrls": {
"48x48": "https://test.com/secure/useravatar?avatarId=2",
"24x24": "https://test.com/secure/useravatar?size=small&avatarId=2",
"16x16": "https://test.com/secure/useravatar?size=xsmall&avatarId=2",
"32x32": "https://test.com/secure/useravatar?size=medium&avatarId=2"
},
"displayName": "displayNameTwo",
"active": false,
"timeZone": "Europe",
"locale": "en_US"
}
'''接下来是解析代码:
from json import loads, dumps
jlist = [] # 用于存储解析后的JSON对象
k = 0 # 标记当前JSON对象开始的行索引
# 将原始数据按行分割
lines = data.splitlines()
# 遍历所有行,查找对象边界
for i, line in enumerate(lines):
# 检查当前行是否为 '{' 且前一行是否为 '}'
# i > 0 确保不是第一行,避免索引越界
if i > 0 and line.strip() == "{" and lines[i-1].strip() == "}":
# 找到了一个对象边界,将从 k 到 i 的行拼接成一个JSON字符串并解析
json_str_segment = "".join(lines[k:i])
jlist.append(loads(json_str_segment))
k = i # 更新 k 为新对象的起始行
# 处理最后一个JSON对象
# 循环结束后,从 k 到末尾的行构成了最后一个JSON对象
json_str_segment = "".join(lines[k:])
jlist.append(loads(json_str_segment))
# 打印解析后的每个JSON对象以验证
for j_obj in jlist:
print(dumps(j_obj, indent=2, ensure_ascii=False))
print("-" * 30) # 分隔符,便于查看代码解释:
行)到 i(当前JSON对象结束行,但不包含 i)的所有行拼接起来,形成一个完整的JSON字符串。执行上述代码后,你将看到每个独立的JSON对象都被正确解析并格式化打印出来:
{
"self": "https://example1.com",
"key": "keyOne",
"name": "nameOne",
"emailAddress": "mailOne",
"avatarUrls": {
"48x48": "https://test.com/secure/useravatar?avatarId=1",
"24x24": "https://test.com/secure/useravatar?size=small&avatarId=1",
"16x16": "https://test.com/secure/useravatar?size=xsmall&avatarId=1",
"32x32": "https://test.com/secure/useravatar?size=medium&avatarId=1"
},
"displayName": "displayNameOne",
"active": true,
"timeZone": "Europe",
"locale": "en_UK"
}
------------------------------
{
"self": "https://example2.com",
"key": "keyTwo",
"name": "nameTwo",
"emailAddress": "mailTwo",
"avatarUrls": {
"48x48": "https://test.com/secure/useravatar?avatarId=2",
"24x24": "https://test.com/secure/useravatar?size=small&avatarId=2",
"16x16": "https://test.com/secure/useravatar?size=xsmall&avatarId=2",
"32x32": "https://test.com/secure/useravatar?size=medium&avatarId=2"
},
"displayName": "displayNameTwo",
"active": false,
"timeZone": "Europe",
"locale": "en_US"
}
------------------------------格式依赖性: 此方法高度依赖于 } 和 { 字符在独立行上且彼此相邻的特定模式。如果JSON对象内部的字符串值恰好包含 } 或 { 并在行尾/行首,或者 } 和 { 不在单独的行上(例如,{"a":1}{"b":2} 这种单行拼接),此方法可能需要调整甚至失效。
空白字符: 代码中使用了 .strip() 来处理行首尾的空白,这增强了对格式变化的容错性。但如果 } 或 { 周围有其他非空白字符,则此方法将不适用。
错误处理: json.loads() 在遇到任何无效的JSON片段时都会抛出 json.JSONDecodeError 异常。在生产环境中,强烈建议将 loads() 调用封装在 try-except 块中,以便优雅地处理可能出现的解析错误,例如:
try:
jlist.append(loads(json_str_segment))
except json.JSONDecodeError as e:
print(f"Error decoding JSON segment: {e}")
print(f"Problematic segment: {json_str_segment}")
# 可以选择跳过此段或进行其他错误处理性能: 对于非常大的文件,按行读取和拼接字符串可能会有一定的性能开销。但对于大多数常见的JSON响应大小,这种方法是高效且可接受的。
替代方案: 如果数据格式更加复杂或不规则,例如 }{ 不总是出现在独立行上,或者对象之间有其他非JSON内容,那么可能需要更强大的文本处理工具,如正则表达式 (re 模块) 来匹配和提取每个JSON对象。
当面对非标准的多个JSON对象直接拼接的响应数据时,直接使用 json.loads() 是行不通的。通过分析其独特的结构特征,即 } 紧接着 { 的行模式,我们可以设计一个基于行检测的Python解析策略。此方法能够有效地将整个响应字符串分割成独立的、可解析的JSON片段,从而成功提取出所有数据。在实际应用中,务必考虑数据格式的稳定性和可能出现的异常情况,并添加相应的错误处理机制,以确保程序的健壮性。理解并适应各种数据格式是处理外部数据时的关键技能。
# javascript
# python
# java
# js
# json
# 正则表达式
# app
# 工具
# ai
# json数组
相关文章:
建站之星免费模板:自助建站系统与智能响应式一键生成
大连企业网站制作公司,大连2025企业社保缴费网上缴费流程?
建站上市公司网站建设方案与SEO优化服务定制指南
如何快速搭建高效服务器建站系统?
威客平台建站流程解析:高效搭建教程与设计优化方案
网站制作公司广州有几家,广州尚艺美发学校网站是多少?
C++中的Pimpl idiom是什么,有什么好处?(隐藏实现)
免费视频制作网站,更新又快又好的免费电影网站?
网站制作模板下载什么软件,ppt模板免费下载网站?
制作网站的软件下载免费,今日头条开宝箱老是需要下载怎么回事?
如何在服务器上配置二级域名建站?
如何快速选择适合个人网站的云服务器配置?
网站制作公司哪里好做,成都网站制作公司哪家做得比较好,更正规?
制作营销网站公司,淘特是干什么用的?
高性能网站服务器部署指南:稳定运行与安全配置优化方案
建站之星CMS建站配置指南:模板选择与SEO优化技巧
青岛网站设计制作公司,查询青岛招聘信息的网站有哪些?
如何在阿里云购买域名并搭建网站?
外贸公司网站制作,外贸网站建设一般有哪些步骤?
网站制作知乎推荐,想做自己的网站用什么工具比较好?
小捣蛋自助建站系统:数据分析与安全设置双核驱动网站优化
网站好制作吗知乎,网站开发好学吗?有什么技巧?
制作网站的过程怎么写,用凡科建站如何制作自己的网站?
C++时间戳转换成日期时间的步骤和示例代码
正规网站制作公司有哪些,目前国内哪家网页网站制作设计公司比较专业靠谱?口碑好?
建站之星如何开启自定义404页面避免用户流失?
香港服务器建站指南:外贸独立站搭建与跨境电商配置流程
微信小程序制作网站有哪些,微信小程序需要做网站吗?
建站之星24小时客服电话如何获取?
如何快速完成中国万网建站详细流程?
建站之星会员如何解锁更多建站功能?
,网站推广常用方法?
企业宣传片制作网站有哪些,传媒公司怎么找企业宣传片项目?
php能控制zigbee模块吗_php通过串口与cc2530 zigbee通信【介绍】
建站之星如何助力企业快速打造五合一网站?
打鱼网站制作软件,波克捕鱼官方号怎么注册?
如何规划企业建站流程的关键步骤?
昆明网站制作哪家好,昆明公租房申请网上登录入口?
黑客入侵网站服务器的常见手法有哪些?
Android滚轮选择时间控件使用详解
如何选购建站域名与空间?自助平台全解析
深圳防火门网站制作公司,深圳中天明防火门怎么编码?
香港服务器网站推广:SEO优化与外贸独立站搭建策略
如何快速搭建个人网站并优化SEO?
如何配置FTP站点权限与安全设置?
网站建设制作、微信公众号,公明人民医院怎么在网上预约?
建站之星如何快速解决建站难题?
较简单的网站制作软件有哪些,手机版网页制作用什么软件?
网站制作话术技巧,网站推广做的好怎么话术?
如何快速重置建站主机并恢复默认配置?
*请认真填写需求信息,我们会在24小时内与您取得联系。