• 2024-06-16汉字是如何编码的
    本文我们简单聊聊汉字编码方案,例如GB2312。‍GB2312的字符集字符编码,是对字符进行的编码,那么首先得有一个字符集,然后再去编码,就像ASCII码也是对ASCII字符集进行的编码。那中国的字符集怎么设定呢?以GB2312为例,国家标准局用了分区管理的方式,将公布的6763个两级汉字分
  • 2024-06-08java小记
    今天学了一些计算机存储数据的原理:文本,图片,声音等存储编码:gb2312,Unicode,gbk等等。数据类型相关遇到了一些问题:解决办法大概是:但是对于我来说是无效的,最后还是照着下面来:成功
  • 2024-04-16公文相关字体下载
    为提高党政机关公文的规范化、标准化水平,2012年6月29日,国家质量监督检验检疫总局、国家标准化管理委员会发了《党政机关公文格式》国家标准(GB/T9704-2012),该标准于2012年月7月1日起正式实施,该份文件可以在国家标准全文公开系统中查看。       仿宋,是一种中文字体。
  • 2024-04-13关于PHP编码的选用
    半知半觉地到了老而不肖的年纪,过往点滴,是有那么十数件要么心亏,要么愤慨,要么算了,要么绮望...诸等反复嚼陈的,选专业就是其一,写码刮不出水链会叹基础差,好多概念糊涂不清,要是有在计算机系挨过,是否捉窘就能少一些呢。说起文件编码,打从业就没怎么关注过,乱码吗?用记事本打开二进制文件就
  • 2024-04-11day15 文件操作
    一.文件路径路径:绝对路劲和相对路径相对路径:相对简短的路径(大致的位置:比如住在杭州临平区)绝对路径:完整的路径(就是完整的地址,比如H:\软件存储12378911wy\向日葵远程控制\SunloginClient).....相对路径:./--代表当前文件夹../--代表返回到上一层文件夹二.字
  • 2024-02-21如何让.NET Core支持GB2312和GBK
    在.NETCore中,默认是不支持GB2312和GBK编码的。若果强制使用Encoding.GetEncoding(“GB2312”)的时候会抛出异常。所以在.NETCore中如果我们要使用GB2312和GBK编码,需要给项目引入一个Nuget包:包安装可以使用以下方法来添加System.Text.Encoding.CodePages:VisualStudio
  • 2024-02-03[转帖]彻底搞明白 GB2312、GBK 和 GB18030
    https://www.zhihu.com/people/lion-89 日常工作的过程中,关于字符编码的问题经常让人头疼不已,这篇文章就来捋一捋关于GB2312、GBK、GB18030相关的知识以及它们和Unicode的关系简介GB23121980年,中国发布了第一个汉字编码标准,也即GB2312,全称《信息交换用汉字
  • 2024-01-29.Net Core报“‘GB2312‘ is not a supported encoding name. For information on defining a custom encod”的错误
    1、
  • 2024-01-23[转帖]彻底搞明白 GB2312、GBK 和 GB18030
    https://zhuanlan.zhihu.com/p/453675608 日常工作的过程中,关于字符编码的问题经常让人头疼不已,这篇文章就来捋一捋关于GB2312、GBK、GB18030相关的知识以及它们和Unicode的关系简介GB23121980年,中国发布了第一个汉字编码标准,也即GB2312,全称《信息交换用汉
  • 2023-12-22 如何解决在 Linux 中 WPS 字体缺失问题(安装常用的 Windows 中文字体)
    所需文件的下载链接在末尾Symbol字体安装wsp-font-symbols即可Windows字体安装Win10Fonts即可常用字体文件内容包括仿宋GB2312、楷体GB2312、方正小标宋简安装方式首先下载你所需要的字体文件在字体文件所在的目录下右键点击在命令行中打开或OpeninTerminal
  • 2023-10-22C#中如何根据GB2312字符集区位码获得汉字?
    一、GB2312字符集汉字编码间的转换1、区位码转换为国标码方法如下:国标码高位字节=(区号)H+20H国标码低位字节=(位号)H+20H区位码转换为国标码的方法是加2020H 2、国标码转换为机内码方法如下:机内码高位字节=(国标码)H+80H机内码低位字节=(国标码)H+80H国标码转换为机内
  • 2023-10-21C#中如何获得GB2312字符集汉字的区位码?
    一、GB2312字符集汉字编码间的转换1、区位码转换为国标码方法如下:国标码高位字节=(区号)H+20H国标码低位字节=(位号)H+20H区位码转换为国标码的方法是加2020H 2、国标码转换为机内码方法如下:机内码高位字节=(国标码)H+80H机内码低位字节=(国标码)H+80H国标码转换为机内
  • 2023-10-19各类编码之间的关系
    面试遇到的问题,发现我对编码字符集还没系统总结过,今天来学习一下主要是ASCII、UTF-8、Unicode、gkb等ASCII1.AmericanStandardCodeforInformationInterchange,美国信息交换标注码2.ASCII字符集是单字节存储,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号
  • 2023-09-28HTML Tidy 将HTML转换为XHTML的开源工具
    基本信息软件名称:HTMLTidy开发者主页:tidy.sourceforge.net软件大小:112K安装环境:有多平台版本,本站提供MicrosoftWindows95/98/Me/2000/xp平台版本版本:2005年8月由W3C香港分部提供此版本增加了对gb2312编码的支持软件说明我们现在的网站大部分都是HTML的,如果希望将它们标
  • 2023-09-25C#中实现校验是否包含中文与http接口地址中解析ip和端口号
    场景Winform/CSharp中实现对Http接口地址、IP地址字符串格式/合法性校验:https://blog.csdn.net/BADAO_LIUMANG_QIZHI/article/details/129616161在上面的基础上对某http接口地址(ip加端口号,示例http://127.0.0.1:9092)进行校验是否包含中文以及解析该地址获取ip和端口号博客:h
  • 2023-08-21解决python错误 UnicodeDecodeError: 'gb2312' codec can't decode byte 0x8b in position 1: i
    报错的代码:url='http://kaijiang.500.com/shtml/ssq/19001.shtml'page=urllib.request.urlopen(url)content=page.read().decode('gb2312')报这个错的原因是获取到的网页内容是经过压缩了的,打开url可以看到请求headAccept-Encoding:gzip,deflate一种方式是请求时把
  • 2023-08-15UTF-8和GBK等中文字符编码格式介绍及相互转换
    我们有很多时候需要使用中文编码格式,比如gbk、gb2312等,但是因为主要针对中文编码设置,因此并不完全通用,这样一来就有了在各编码间相互转换的需求,比如和UTF8的转换。可是在我使用的过程中,却发现编码转换并没有想象中的简单,或者说可能会出错,即使你使用的系统API。我在使用中,产生一些
  • 2023-08-02逆向——字符与字符串,中文字符GB2312编码由来
    字符与字符串在之前的课程中我们了解到变量的定义决定两个事情,第一是决定存储的数据宽度,第二是决定了存储的数据格式,那么我们来看下下面的代码:inta=123;//变量x,数据宽度为4个字节,里面存储的是补码(在计算机系统中,数值一律用补码来存储)intfloatb=123.4F;//IEEE编码(浮点)
  • 2023-07-19整个好活:micropython utf-8转gb2312
    classgb2312(object):def__init__(self):self.f=open('utf2gb2312.bin','r',encoding='utf-8')defb2i(self,byte):#bytes转intr=0foriinrange(len(byte)):r=(r<<
  • 2023-07-04iframe编码为utf-8.嵌入页面为gb2312 ,word导出默认为gb2312 格式
    1、使用记事本打开html,另存为,保存类型选择:"所有文件"、编码选择:“UTF-8” 2、打开保存后文件编码类型改成utf-8<metacharset="utf-8"/>第一个步骤是为了把内容改成utf-8,然后直接执行第二步改编码可能会报乱码
  • 2023-07-03文件的编码
    概述字符必须编码后才能被计算机处理计算机使用的缺省编码方式就是计算机的内码早期的计算机使用7位的ASCII编码为了处理汉字程序员设计了用于简体中文的GB2312和用于繁体中文的big5ANSIGB23121980年一共收录了7445个字符包括6763个汉字和682个其它符号汉字区的内码
  • 2023-07-02将以%号开头的gb2312编码转化为汉字
    解码importurllib.parsemao='%C3%AB%CF%FE%CD%AE'#此编码格式为gb2312mao=urllib.parse.unquote(mao,encoding='gb2312')#urllib.parse.unquote()的默认编码格式为‘utf-8’print(mao)guan='%E5%85%B3%E6%99%93%E5%BD%A4'
  • 2023-06-30关于HTML页以Get方法向asp.net页面传值乱码的解决
    这个问题是最近偶然发现的,朋友说我个人做那个基于Lucene的搜索引擎,存在一个问题,就是只能搜索英文,不能搜索中文。我把代码仔细看了一下,没发现问题,但是在测试的时候确实存在这样的问题。我查看传值之后的参数,全部是乱码或者空格,立即觉得是传递过程中编码的问题。后来在web.config中添
  • 2023-06-30做网站用UTF-8还是GB2312?
    经常我们打开外国网站的时候出现乱码,又或者打开很多非英语的外国网站的时候,显示的都是口口口口口的字符,WordPress程序是用的UTF-8,很多cms用的是GB2312。●为什么有这么多编码?●UTF-8和GB2312有什么区别?●我们在国内做网站是用UTF-8编码格式还是GB2312编码格
  • 2023-06-26python练习-爬虫(续)
    接下来就是查询数据了。#识别图片中的文字#image=Image.open('captcha.png')image=Image.open('G:\Python爬虫\captcha.png')code=pytesseract.image_to_string(image)#从用户输入获取用户名、身份证号码和验证码username='XXX'#input("请输入用户名:")id_c