首页 > 其他分享 >CRLF、UTF-8这些编辑器右下角的选项的意思

CRLF、UTF-8这些编辑器右下角的选项的意思

时间:2024-10-25 16:16:09浏览次数:3  
标签:字符 UTF 字节 编码 字符集 编辑器 CRLF Unicode

经常使用编辑器的小伙伴应该经常能看到右下角会有这么两个选项,下图是VScode中的示例,那么这两个到底是啥作用呢?
在这里插入图片描述

目录

字符编码

此部分参考博文
在计算机中,所有数据都是以二进制数的形式存储的,字符 char 也不例外。通过建立一套“字符集”,规定每个字符和二进制数之间的一一对应关系,这样计算机就可以通过查表完成二进制数到字符的转换。

ASCII 字符集

使用 7 位二进制数(一个字节的低 7 位)表示一个字符,最多能够表示 128 个不同的字符。ASCII 码包括英文字母的大小写、数字 0 ~ 9、一些标点符号,以及一些控制字符(如换行符和制表符)。(无中文字符)

GBK 字符集

GBK 字符集是在 GB2312 的基础上扩展得到的,它共收录了 21886 个汉字。在 GBK 的编码方案中,ASCII 字符使用一个字节表示,汉字使用两个字节表示

Unicode 字符集

Unicode 的中文名称为“统一码”,理论上能容纳 100 多万个字符。它致力于将全球范围内的字符纳入统一的字符集之中,提供一种通用的字符集来处理和显示各种语言文字,减少因为编码标准不同而产生的乱码问题。在庞大的 Unicode 字符集中,常用的字符占用 2 字节,有些生僻的字符占用 3 字节甚至 4 字节。
当多种长度的 Unicode 码点同时出现在一个文本中时,系统如何解析字符?例如给定一个长度为 2 字节的编码,系统如何确认它是一个 2 字节的字符还是两个 1 字节的字符?对于以上问题,一种直接的解决方案是将所有字符存储为等长的编码。如下图所示,“Hello”中的每个字符占用 1 字节,“算法”中的每个字符占用 2 字节。我们可以通过==高位填 0 ==将“Hello 算法”中的所有字符都编码为 2 字节长度。这样系统就可以每隔 2 字节解析一个字符,恢复这个短语的内容了。
在这里插入图片描述

UTF-8 编码

UTF-8 已成为国际上使用最广泛的 Unicode 编码方法。它是一种可变长度的编码,使用 1 到 4 字节来表示一个字符,根据字符的复杂性而变。ASCII 字符只需 1 字节,拉丁字母和希腊字母需要 2 字节,常用的中文字符需要 3 字节,其他的一些生僻字符需要 4 字节。UTF-8 的编码规则并不复杂,分为以下两种情况。

  • 对于长度为 1 字节的字符,将最高位设置为 0,其余 7 位设置为 Unicode 码点。值得注意的是,ASCII 字符在 Unicode 字符集中占据了前 128 个码点。也就是说,UTF-8 编码可以向下兼容 ASCII 码。
  • 对于长度为 n(n>1)字节的字符,将首个字节的高n位都设置为 1,第 n+1位设置为0;从第二个字节开始,将每个字节的高 2 位都设置为10(校验符);其余所有位用于填充字符的 Unicode 码点。
    在这里插入图片描述

除了 UTF-8 之外,常见的编码方式还包括以下两种。

  • UTF-16 编码:使用 2 或 4 字节来表示一个字符。所有的 ASCII 字符和常用的非英文字符,都用 2 字节表示;少数字符需要用到 4 字节表示。对于 2 字节的字符,UTF-16 编码与 Unicode 码点相等。
  • UTF-32 编码:每个字符都使用 4 字节。这意味着 UTF-32 比 UTF-8 和 UTF-16 更占用空间,特别是对于 ASCII 字符占比较高的文本。

从存储空间占用的角度看,使用 UTF-8 表示英文字符非常高效,因为它仅需 1 字节;使用 UTF-16 编码某些非英文字符(例如中文)会更加高效,因为它仅需 2 字节,而 UTF-8 可能需要 3 字节。
从兼容性的角度看,UTF-8 的通用性最佳,许多工具和库优先支持 UTF-8

换行

CRLF (Carriage Return Line Feed):回车换行符,由CR字符后跟LF字符组成,即\r\n\r是回车符,\n是换行符。在Windows操作系统以及基于DOS的系统中使用CRLF作为行结束符。CRLF的作用是先执行回车操作(回到行首),再执行换行操作(移动到下一行),从而在文本数据流中创建一个新行。各个系统的换行标志:

  • windows 用 \r\n
  • linux/unix 用 \n
  • Mac OS 用 \r

在不同操作系统下时,需注意这个行尾序列,也就是换行符的表示。
❗️❗️❗️从linux随便取一个有多行内容的文件到windows,用记事本打开,在linux下换行的内容会不换行,如果有N行,会变成一行显示,原因是linux取下来的文件只有\n,但没有\r

标签:字符,UTF,字节,编码,字符集,编辑器,CRLF,Unicode
From: https://blog.csdn.net/qq_51706641/article/details/143235646

相关文章

  • 如何保存并退出各大编辑器
    输入update-alternatives--listeditor查看当前系统下有什么编辑器。将list改为config(或display)可以看到输出的某一行是当前的默认编辑器。很可惜你并没有sudo权限将默认编辑器改为你最喜欢的。以下是NOILinux2.0下存在的部分编辑器:update-alternatives--confige......
  • 【北京迅为】itop-龙芯2k1000开发指南Linux基础入门vim 编辑器
     龙芯2K1000处理器集成2个64位GS264处理器核,主频1GHz,以及各种系统IO接口,集高性能与高配置于一身。支持4G模块、GPS模块、千兆以太网、16GB固态硬盘、双路UART、四路USB、WIFI蓝牙二合一模块、MiniPCIE等接口、双路CAN总线、RS485总线,扩展能力更强。龙芯2K1000已经广泛应用于工控......
  • AM05 AUT24 Outfit Of The Day Recommendation
    AM05AUT24FinalProjectAssignment:OutfitOfTheDayRecommendationSystem1AM05AUT24FinalProjectAssignment:OutfitOfTheDayRecommendationSystemIntroductionWelcometoyourfinalprojectfortheDataManagementcourse.Thisprojectisdesigned......
  • PbootCMS自带百度编辑器插入视频不显示怎么办?
    PbootCMS自带的百度编辑器(UEditor)在插入视频时有时会出现不显示的问题。这可能是由于多种原因造成的,包括视频格式不支持、路径错误、配置问题等。以下是一些常见的解决方法:解决方法1.检查视频格式支持的视频格式:UEditor支持的视频格式包括:mp4, flv, webm 等。确保你......
  • pbootcms网站后台编辑器加载不出来怎么办?
    当遇到PbootCMS网站后台编辑器加载不出来的问题时,可以尝试以下几种解决方法:检查网络连接:确保服务器与客户端之间的网络连接正常。尝试刷新页面或重新登录后台。清理缓存:清理浏览器缓存和cookies,有时候旧的缓存数据会导致加载问题。在PbootCMS后台尝试清空系统缓存。......
  • django的富文本编辑器
    书和视频都是CKEditor,但是安装配置好了,发现好像他有pro版本,所以改成了wangEditor,国产的,文档很全。所以记录之。第一步:安装,在pypi.python.org,搜索上面的关键字;pipinstalldjango-wangeditor第二步:在settings.py,加入INSTALLED_APPS,名字是'wangeditor';第三步:在模型中,那些想......
  • 开发常用编辑器,你知道几个?
    以下是Python最受欢迎的10个编辑器:pyCharm由捷克公司JetBrains开发,是使用最广泛的PythonIDE之一。它分为社区版和专业版,社区版免费且功能足够满足日常基本需求,专业版功能更强大但需付费。 优势在于智能代码补全、代码分析、快速修复错误、图形化的调试器、项目管......
  • 一款灵活免费的文档编辑器Tiptap
    Tiptap是一款功能强大且灵活的富文本编辑器,以下是对其的详细介绍:一、技术基础与特点技术基础:Tiptap基于ProseMirror构建,后者是一个用于构建富文本编辑器的JavaScript库。ProseMirror提供了强大的文档模型和高效的编辑性能,为Tiptap打下了坚实的基础。无头设计:Tiptap采用了无......
  • vue+wangEditor编辑器,上传图片请求后台接口
    来吧,先给大家看一下,是否是你想要的简单轻便编辑器的效果。父组件:<EditorView:content="value"@change="grtUrl"/><script>importEditorViewfrom"@/components/EditorView";exportdefault{components:{EditorView}},dat......
  • IntelliJ IDEA 快捷键大全(也适用全家桶其他编辑器)
    以下是IntelliJIDEA的常用功能快捷键大全,适用于Windows/Linux系统(Mac用户可将Ctrl替换为Cmd,Alt替换为Option):功能分类功能描述快捷键(Windows/Linux)基本操作显示所有快捷键Ctrl+J显示主菜单Alt+Home全局搜索(任何内容)DoubleShift打开设置Ctrl+Alt+S保存所......