首页 > 其他分享 >【GiraKoo】常用编码的对比(ASCII,GB2312,GBK,GB18030,UCS,Unicode)

【GiraKoo】常用编码的对比(ASCII,GB2312,GBK,GB18030,UCS,Unicode)

时间:2024-10-30 15:44:41浏览次数:6  
标签:GB18030 GiraKoo UCS GB2312 GBK Unicode TF ASCII

甯哥敤缂栫爜鐨勫姣旓紙ASCII锛孏B2312锛孏BK锛孏B18030锛孶CS锛孶nicode锛�

鍦ㄧ▼搴忓紑鍙戜腑锛屾枃瀛楃紪鐮佷竴鐩存壆婕旂潃浜虹暅鏃犲锛屽嵈鑳屽悗鎹呬竴鍒€鐨勮鑹层€�

  • 鍙兘鍦ㄦ簮浠g爜鏂囦欢涓紝娉ㄩ噴鑾悕鍏跺鍦板彉鎴愪簡涔辩爜銆�
  • 鍙兘鏄彂閫佺粰鍒汉鐨勬枃鏈紝鎵撳紑閮芥槸鈥滈敓鏂ゆ嫹鈥濄€�
  • 鍙兘鏄粠涓€涓▼搴忔嫹璐濆埌鍙︿竴涓▼搴忥紝鑾悕鍏跺鐨勪涪澶卞唴瀹广€�
  • 鍙兘鏄疺S缂栬瘧鏃讹紝涓嶅仠鐨勬彁绀衡€渨arning C4819: The file contains a character that cannot be represented in the current code page (936). Save the file in Unicode format to prevent data loss鈥�
  • 鍦ㄦ煇浜涘瓧浣撲笅闈紝鏄庢槑鏄剧ず鐨勫緢濂界殑绗﹀彿锛屾洿鎹㈠瓧浣撳氨鏄剧ず鐨勪贡涓冨叓绯熴€傜敋鑷崇洿鎺ユ槸鏂规銆�

鍙楅檺浜庢棭鏈熺郴缁熻璁$殑鐧捐姳榻愭斁锛屽悇澶ц瑷€涓轰簡婊¤冻鑷繁鐨勯渶瑕佸彂鏄庝簡鏈浗鏂硅█銆�
涓轰簡缁熶竴搴﹂噺琛★紝Unicode搴旇繍鑰岀敓銆�
浣嗘槸鍗充娇鏄疷nicode锛屼篃鍑虹幇浜哢TF-8锛孶TF-16锛孶TF-32杩欐牱缁嗗垎缂栫爜銆�

鍦˙绔欎笂锛屾湁涓€涓潪甯歌缁嗙殑瀛楃缂栫爜璁茶В瑙嗛銆傚叾涓秹鍙婂埌缂栫爜鐨勫彂灞曞彶锛岀粺涓€鍘嗙▼锛屼互鍙婇敓鏂ゆ嫹杩欐牱鐨勪贡鐮佺┒绔熸椂鎬庝箞鏍蜂骇鐢熺殑銆傞潪甯告帹鑽愬ぇ瀹舵洿鍔犵洿瑙傜殑浜嗚ВUnicode缂栫爜鏄浣曚竴缁熷ぉ涓嬬殑銆�

鏈夊叴瓒g殑鍙互绉绘瑙傜湅銆傗啌鈫撯啌
閿熸枻鎷凤拷鈯犳槸鎬庢牱鐐兼垚鐨勨€斺€斾腑鏂囨樉绀衡€溾紛鈥濋棬鎸囧崡銆愭煷鐭ラ亾銆戙€�

涓€銆佺紪鐮佸姣�

1. ASCII

  • 姣忎釜瀛椾互1涓瓧鑺傛潵缁勬垚銆�
  • ASCII绗竴娆′互瑙勮寖鏍囧噯鐨勭被鍨嬪彂琛ㄦ槸鍦�1967骞达紝鏈€鍚庝竴娆℃洿鏂板垯鏄湪1986骞达紝鍒扮洰鍓嶄负姝㈠叡瀹氫箟浜�128涓瓧绗︺€�

2. GB2312 / GBK / GB18030 / Big5

  • 绠€浣撲娇鐢℅B2312鏈€骞�
  • 绻佷綋浣跨敤Big5鏈€骞�
  • GB18030鏈€鍏紝鍩烘湰鍏煎GBK銆侴BK瀹屽叏鍏煎GB2312銆�

鈶� GB2312

  • 姣忎釜瀛椾互2涓瓧鑺傛潵缁勬垚銆�
  • 鍏辨敹褰�6763涓眽瀛楋紝鍏朵腑涓€绾ф眽瀛�3755涓紝浜岀骇姹夊瓧3008涓紱鎷変竵瀛楁瘝銆佸笇鑵婂瓧姣嶃€佹棩鏂囧钩鍋囧悕鍙婄墖鍋囧悕瀛楁瘝銆佷縿璇タ閲屽皵瀛楁瘝鍦ㄥ唴鐨�682涓叏瑙掑瓧绗︺€�

鈶� GBK

  • 姣忎釜瀛椾互2涓瓧鑺傛潵缁勬垚銆�
  • 鍏辨敹褰曚簡21003涓眽瀛楋紝瀹屽叏鍏煎GB2312-80鏍囧噯锛屾敮鎸佸浗闄呮爣鍑咺SO/IEC10646-1鍜屽浗瀹舵爣鍑咷B13000-1涓殑鍏ㄩ儴涓棩闊╂眽瀛楋紝骞跺寘鍚簡BIG5缂栫爜涓殑鎵€鏈夋眽瀛椼€�

鈶� GB18030

  • 姣忎釜瀛楀彲浠ョ敱1涓€�2涓垨4涓瓧鑺傜粍鎴愩€�
  • GB18030-2005锛屼互姹夊瓧涓轰富骞跺寘鍚绉嶆垜鍥藉皯鏁版皯鏃忔枃瀛楋紙濡傝棌銆佽挋鍙ゃ€佸偅銆佸綕銆佹湞椴溿€佺淮鍚惧皵鏂囩瓑锛夌殑瓒呭ぇ鍨嬩腑鏂囩紪鐮佸瓧绗﹂泦寮哄埗鎬ф爣鍑嗭紝鍏朵腑鏀跺叆姹夊瓧70000浣欎釜銆�

鈶� Big5

  • 姣忎釜瀛椾互2涓瓧鑺傛潵缁勬垚銆�
  • 浣跨敤绻佷綋涓枃锛堟浣撲腑鏂囷級绀惧尯涓渶甯哥敤鐨勭數鑴戞眽瀛楀瓧绗﹂泦鏍囧噯锛屽叡鏀跺綍13,060涓眽瀛椼€�

3. UCS

  • 閫氱敤澶氬叓浣嶇紪鐮佸瓧绗﹂泦锛圲niversal Multiple-Octet Coded Character Set锛変篃鍙€氱敤瀛楃闆嗭紙Universal Character Set, UCS锛夛紝鏄敱ISO鍒跺畾鐨処SO 10646锛堟垨绉癐SO/IEC 10646锛夋爣鍑嗘墍瀹氫箟鐨勬爣鍑嗗瓧绗﹂泦銆�
  • 鐢卞浗闄呮爣鍑嗗寲缁勭粐锛圛SO锛夊埗瀹氥€�

4. Unicode锛圲TF-8锛孶TF-16锛孶TF-32)

鈶� 鍗犵敤绌洪棿涓嶅悓

  • UTF-8锛屾瘡涓瓧鍙互鐢�1涓€�2涓垨4涓瓧鑺傜粍鎴愩€傚崰鐢ㄧ┖闂村皬锛岄€傚悎浼犺緭銆�
  • UTF-16锛屾瘡涓瓧鍙互鐢�2涓垨4涓瓧鑺傜粍鎴愩€�
  • UTF-32锛屾瘡涓瓧鍙互鐢�4涓瓧鑺傜粍鎴愩€傚崰鐢ㄧ┖闂村ぇ锛屽瓨鍦ㄦ氮璐广€�

鈶� 鏌ユ壘閫熷害涓嶅悓

  • 鐢变簬UTF-8鍜孶TF-16鏄彉闀跨紪鐮併€傝绠�1000涓枃瀛楃殑size闇€瑕侀亶鍘嗘瘡涓€涓瓧绗﹁繘琛岃绠椼€傞殢鏈鸿闂€熷害鎱€€�
  • UTF-32鏄浐瀹氶暱搴︾紪鐮併€傝绠�1000涓枃瀛楃殑size锛屽彲浠ョ洿鎺�*4锛岄殢鏈鸿闂€熷害蹇€�

浜屻€乂S缂栫爜杞崲鎻掍欢鎺ㄨ崘

FileEncoding

璇ユ彃浠跺彲浠ュ湪鏂囨湰缂栬緫鍣ㄥ彸涓嬭鐩存帴鏌ョ湅褰撳墠鏂囦欢缂栫爜锛岀偣鍑绘洿鎹㈠彲鐩存帴杩涜缂栫爜杞崲銆傞潪甯告柟渚裤€�

瀹夎璺緞锛歔Visual Studio MarketPlace](https://marketplace.visualstudio.com/items?itemName=genrwoody.FileEncodingVS2022&ssr=false#review-details)

涓夈€佸弬鑰冭祫鏂�

标签:GB18030,GiraKoo,UCS,GB2312,GBK,Unicode,TF,ASCII
From: https://www.cnblogs.com/girakoo/p/18515953

相关文章

  • 【GiraKoo】C++编译中常用的内置宏
    开源项目:https://girakoo.com/联系方式:[email protected]简介针对不同的平台,很多头文件,函数名称,类型占用空间不一致。为了保证跨平台可编译,经常需要在项目中使用宏进行区分系统宏操作系统可使用的宏Windows32位_WIN32Windows64位_WIN32;_WIN64Linux__linu......
  • 【GiraKoo】Android系统版本代号一览
    Android系统版本代号一览VersionCodeNameAPI时间13.0Tiramisu332022.0812.0SnowCone31,322021.1011.0R/11302020.0910.0Q/10292019.059.0P/(Pie)282018.088.1O_MR1272017.128.0O/(Oreo)262017.087.1N_MR125201......
  • 【GiraKoo】C++中static关键字的作用
    C++中static关键字的作用在程序中良好的使用static,const,private等关键字,对于代码的健壮性有很大的帮助。本文介绍的就是C++中static关键字的一些常见用法与区别。适合萌新程序员理解static的作用。一、在类内修饰变量限制变量的存储位置(保存在静态区),所有类对象共享一份数据。......
  • 【GiraKoo】C++多线程消息分发架构
    【开源需求】C++多线程消息分发架构项目【gi_messager】在多线程环境中,为每个线程提供独立的消息队列MessageLoop。注:主线程默认自动创建消息队列。MessageLoopCenter提供MessageLoop的查询功能。能够获得指定MessageLoop的句柄。同一个MessageLoop可以绑定多个......
  • 【GiraKoo】PowerShell美化笔记
    【GiraKoo】PowerShell美化笔记oh-my-poshinitpwsh--config"$env:POSH_THEMES_PATH/powerlevel10k_lean.omp.json"|Invoke-Expression#-------------------------------ps-read-line-------------------------------#引入ps-read-lineImport-ModulePSReadLi......
  • GEE 案例:利用UCSB-CHG/CHIRPS/DAILY数据采用非监督分类实现某区域的降水区域的划分
    目录简介数据函数ee.Clusterer.wekaKMeans(nClusters, init, canopies, maxCandidates, periodicPruning, minDensity, t1, t2, distanceFunction, maxIterations, preserveOrder, fast, seed)Arguments:Returns: Clusterer代码结果简介利用UCSB-CHG......
  • 【GiraKoo】Android Studio替换gradle中的JCenter源
    由于JCenter关闭,一些陈旧的库需要替换Jcenter源。在C://users/xxxx/.gradle/init.gradle(如果没有,需自行创建)中更新以下内容。allprojects{repositories{defALIYUN_REPOSITORY_URL='https://maven.aliyun.com/repository/public'defALIYUN_JCENTER_U......
  • 【权威出版】2024年城市建设、智慧交通与通信网络国际会议(UCSTCN 2024)
    2024年城市建设、智慧交通与通信网络国际会议2024InternationalConferenceonUrbanConstruction,SmartTransportation,andCommunicationNetworks【1】会议简介    2024年城市建设、智慧交通与通信网络国际会议即将盛大召开,这是一次聚焦城市建设、智慧交......
  • autocad.net 图元Delta属性居然受UCS影响
    今天在进行几何运算时,发现在UCS非世界坐标系的时候运算结果不正确这与我以往的认知出现了冲突,我个人的经验,只有在用户交互的时候(如GetPoint,GetEntity),才用得到ucs。当一个图元已经从id拿到,转化为Entity时,从改图元属性上取出的属性应该为均为世界坐标系。经过我的排查后发现,Li......
  • 如何让.NET Core支持GB2312和GBK
    在.NETCore中,默认是不支持GB2312和GBK编码的。若果强制使用Encoding.GetEncoding(“GB2312”)的时候会抛出异常。所以在.NETCore中如果我们要使用GB2312和GBK编码,需要给项目引入一个Nuget包:包安装可以使用以下方法来添加System.Text.Encoding.CodePages:VisualStudio......