首页 > 其他分享 >编码格式UTF8下中文长度

编码格式UTF8下中文长度

时间:2024-07-02 18:30:57浏览次数:20  
标签:编码 字节 UTF8 length SUBSTRING 001 格式 bit select

首先理解一下基本概念,

字符:一种符号,ABCD,中文,都是文字符号,所以叫字符

字节:Byte简写B, 跟字节跳动Byte Dance一个东西。计算机的基本存储单位

二进制位:bit(Binary Digits)简写b,是比特币BitCoin的bit一个东西,计算机最小传输单位---0/1

三者对应关系如下表:

字符一个中文或标点一个英文或标点1个阿拉伯数字一个
字节 byte2(其他编码)~3(UTF)111
位bit*8888

常用总结:1字节(byte)=8 位 bit, 1024 byte= 1KB 1024KB = 1MB ……

MYSQL中统计字符串长度可以用Length 和char_length,英文都是1的长度,中文区别如下表:

函数统计单位例子长度返回值
char_length字符数量1
length字节数量2 or 3 看编码格式
select length('赵:某001') as len,CHAR_LENGTH('赵:某001') as char_len

对于Subtring,实践显示中文是统计的字符数:

select SUBSTRING('赵:某001',1,1) as lastname,SUBSTRING('赵:某001',3,1) as firstname;--指定两个参数表示开始位子,截取长度
select SUBSTRING('赵:某001',1) as lastname ,SUBSTRING('赵:某001',3) as firstname; --指定一个参数表示开始位子到结束
select SUBSTR('赵:某001',1,1) as lastname ,SUBSTR('赵:某001',3,1) as firstname--跟第一个一样的,开始,长度

基于以上结果,substring的时候截取,如果截取始末位子用到以上两个length函数,要小心开始结束position才能获取正确的值。

标签:编码,字节,UTF8,length,SUBSTRING,001,格式,bit,select
From: https://blog.csdn.net/weixin_47082271/article/details/140132718

相关文章

  • 公文格式排版规范
    规范化建设,结合区委办印发《党政机关公文格式》(坛委办字〔2015〕1号)新标准的要求,现将有关事项通知如下:1.各科室及下属事业单位要严格按照《党政机关公文格式》新标准的要求进行公文拟稿、排版、印发。2.根据有关文件要求,公文中文字体使用方正GBK字库(主要有:方正小标宋_G......
  • vmdk to vhdx 虚拟磁盘格式转换qemu-img
    qemu-img是创建、转换、修改磁盘映像的工具,我们可以用它非常方便的转换虚拟磁盘格式,比如在vmdk、vhdx、qcow2、vdi之间相互转换,它在流行的Linux、macOS、Windows平台上都发布有对应的版本。本文介绍的是Windows版本,它支持下图中所示的格式。转换格式需要使用它的convert命令,为......
  • 如何在Oracle、MySQL、PostgreSQL中改变SQL提示格式
    HowtoChangeinSQLPromptformatinOracle,MySQL,PostgreSQL像UNIX的PS1环境变量可以改变shell操作提示符,在日常工作环境中可以提升一些效率可以防止一些误操作,很多年前在看tom关于在练习oracle操作前的一些环境配置像login.sql,比起”SQL>”还可以显示当前的用......
  • ros2 - slam - 直流电机-编码器脉冲测量与校准
    这一节我们编写代码来尝试下是否能够读取到电机上编码器的脉冲数,并通过实验测试出小车的输出轴转速和编码器脉冲的比值。一、新建工程并导入开源库新建example25_encoder添加依赖[env:featheresp32];这是一个环境配置标签,指定了代码将运行的硬件平台和框架platform=esp......
  • ros2 - slam - 使用编码器测量轮子最大速度
    新建example26_max_speed_measurement 添加依赖[env:featheresp32];这是一个环境配置标签,指定了代码将运行的硬件平台和框架platform=espressif32;指定了使用的平台为Espressif32board=featheresp32;指定使用的硬件板为FeatherESP32framework=arduino;......
  • ros2 - slam - 编码器测速原理
    上节做完小车,遥控时小车前进时你应该会发现,小车很难走一条直线,但明明我们给到两个电机的PWM占空比都是相同的,原因在于每一个电机的硬件参数并不能完全的保证一致,所以当我们采用开环控制时,即使我们给到每个电机相同的电压,也不能让两个电机保持相同的转速。要解决这个问题我们就要......
  • 【Hex编码】
    Hex编码是一种将数据转换为十六进制形式的方法。每个十六进制字符表示4个二进制位。它常用于显示二进制文件的内容,使其更易于阅读和传输。Hex编码的转换规则如下:将数据拆分为每4位一组的二进制数。将每组二进制数转换为十六进制字符。例如,将文本字符串"hello"转换为Hex编......
  • java 将jpg格式图片提出成txt文件 。
    importjavax.imageio.ImageIO;importjava.awt.image.BufferedImage;importjava.io.*;publicclassImageConvertTool{privatestaticStringimagePath,txtPath;privatestaticintimageHeight,imageWidth;privatestaticStringreplaceString=......
  • FFmpeg 命令行 音视频格式转换
    ......
  • x264 编码器x264.h文件中结构体详细介绍
    x264_picture_t定义:在x264.h文件中定义typedefstructx264_picture_t{/*In:forcepicturetype(ifnotauto)*Ifx264encodingparametersareviolatedintheforcingofpicturetypes,*x264willcorrecttheinputpicture......