首页 > 其他分享 >emoji字符的范围、正则替换Emoji字符

emoji字符的范围、正则替换Emoji字符

时间:2024-02-27 09:02:30浏览次数:27  
标签:字符 UTF 范围 编码 Unicode emoji Emoji

Emoji与Unicode、UTF8

Emoji是一种特殊的字符,而不是像QQ表情一样的普通字符的转义表示。在Unicode编码中,占用了U+1F300U+1F64F中的部分范围

Emoji字符的特殊之处在于,其使用的Unicode字符超出了通常使用的三字节UTF-8编码的Unicode范围,即BMP范围U+0000U+FFFF。按照UTF-8编码规范,Emoji字符属于辅助平面范围,通常对应4字节的UTF-8编码。

hive sql正则替换Emoji字符

select regexp_replace('abch

标签:字符,UTF,范围,编码,Unicode,emoji,Emoji
From: https://www.cnblogs.com/jqccan/p/18036092

相关文章

  • 【算法】【字符串】无重复字符的最长子串
    1 题目给定一个字符串 s ,请你找出其中不含有重复字符的 最长连续子字符串 的长度。示例 1:输入:s="abcabcbb"输出:3解释:因为无重复字符的最长子字符串是"abc",所以其长度为3。示例2:输入:s="bbbbb"输出:1解释:因为无重复字符的最长子字符串是"b......
  • 反转字符串
    思路1、建立双指针,一个指最前的元素,一个指最后的元素。将它们两两交换设长度是n,反转可以看成s[0]=s[n-1],top指针指向s[0],end指针指向s[n-1],交换完毕后,top指针++,end指针--,交换s[1]=s[n-2],依次推类。结束循环的条件:如果n是奇数,循环的条件为top=end=n/2如果n是偶数,最后......
  • 掌握字符与字符串:C语言中的神奇函数解析(一)
    ✨✨欢迎大家来到贝蒂大讲堂✨✨......
  • 438. 找到字符串中所有字母异位词C
    今天出成绩了,感觉徘徊在被刷的边缘,要好好努力了。这题我想法试建立hash映射成有序的数字,只要字符串个数相同,并且映射和相同那么就是异位串。后来这个想法是错的。以为假设已经已知一个和,和组成这个和的个数,但这个子数并不唯一,比如10=1+2+7。10=2+3+5。这样就会误判。就算能找......
  • [oeasy]python0008_输出h字符_REPL_引号_括号_什么是函数
    输出h字符_REPL_引号_括号_什么是函数......
  • tomorin的字符串迷茫值
    tomorin的字符串迷茫值题目描述tomorin定义一个字符串的迷茫值为该字符串包含"mygo"连续子串的个数。例如"mygomygo"、"itsmygo"的迷茫值分别为2,1,而"bangdream"的迷茫值为0。现在tomorin有一个字符串,她准备删除一些字符,但不能删除两个连续字符。tomorin想知道在所有删除方案......
  • bitmap 位图 底层原理标记的字符串放在哪
    在Redis中,位图(bitmap)是通过字符串(string)类型来实现的,具体来说,位图是存储在Redis字符串中的二进制位数据。Redis字符串一般采用动态字符串实现,最大长度可以达到512MB。对于位图来说,每个二进制位代表一个状态或标记,可以表示非常多的状态信息,同时占用的存储空间很小。当使用......
  • Python 字符串格式化输出
    数字n:int=1000000000print(f'{n:_}')#1_000_000_000print(f'{n:,}')#1,000,000,000对齐var:str='var'#右对齐,使用_填充print(f'{var:_>20}')#_________________var#左对齐,使用#填充print(f'{var:#<20}�......
  • JavaScript语法-字符串模板
    [TOC]##JavaScript模板字符串###代码以下是index.js的部分代码:```onShareAppMessage({const{toName,mainText,fromName}=this.data;debugger;return{title:'叮,您收到一张贺卡~',path:'pages/index/index?toname=${toName}&mai......
  • 3. 无重复字符的最长子串C++
    思路就是从头开始找,然后每次在从重复节点的后一个找。classSolution{public:intlengthOfLongestSubstring(strings){inti=0,j=0,nowmax=1;intmax=1;if(s.size()==0||s.size()==1)returns.size();map<char,int>m;......