在 Python 中,json.dumps()
函数会将 Python 对象序列化为 JSON 字符串,并默认使用 UTF-8 编码来处理非 ASCII 字符。虽然在 Python 3 中,字符串是默认以 Unicode 形式存储的,但是当 json.dumps()
将 Python 字符串转换为 JSON 格式时,非 ASCII 字符会自动被转义为 Unicode 码点(例如 \uXXXX
)。
这是 json.dumps()
默认行为之一,目的是确保生成的 JSON 数据是有效的 ASCII 字符串,因此它会将非 ASCII 字符(例如中文)转为 Unicode 转义序列(如 \u4e2d
表示中文字符 "中")。
如果你希望避免这种 Unicode 转义并直接输出原始字符串,可以使用 ensure_ascii=False 参数。例如:
import json
data = {
"name": "中文字符"
}
# 序列化时避免 Unicode 转义
json_str = json.dumps(data, ensure_ascii=False)
print(json_str)
输出结果:
{"name": "中文字符"}
标签:__,字符,.__,转义,dumps,json,Unicode,ASCII From: https://www.cnblogs.com/jarico/p/18404169[!TIP]
ensure_ascii=False
的作用就是确保json.dumps()
不会将非 ASCII 字符转义为 Unicode 编码,直接保留原始字符。