2.如果是字符集出现错误,建议多选择几种字符集测试一下: 选择的经验是: 如果是爬取到的网页文件,可以查看网页文件的meta标签下的charset属性值。
例如:
<meta charset="UTF-8">
1
也可以使用notepad++打开,查看下右下角的部位,会指示该文件是那种编码。
用一个例子来演示会更加清晰
2.如果是字符集出现错误,建议多选择几种字符集测试一下: 选择的经验是: 如果是爬取到的网页文件,可以查看网页文件的meta标签下的charset属性值。
例如:
<meta charset="UTF-8">
1
也可以使用notepad++打开,查看下右下角的部位,会指示该文件是那种编码。
用一个例子来演示会更加清晰