内容来自 DOC https://q.houxu6.top/?s=在JavaScript中移除字符串中的重音符号/变音符号
如何从字符串中移除重音符号?
特别是在IE6中,我曾经使用过以下代码:
accentsTidy = function(s){
var r=s.toLowerCase();
r = r.replace(new RegExp(/\s/g),"");
r = r.replace(new RegExp(/[àáâãäå]/g),"a");
r = r.replace(new RegExp(/æ/g),"ae");
r = r.replace(new RegExp(/ç/g),"c");
r = r.replace(new RegExp(/[èéêë]/g),"e");
r = r.replace(new RegExp(/[ìíîï]/g),"i");
r = r.replace(new RegExp(/ñ/g),"n");
r = r.replace(new RegExp(/[òóôõö]/g),"o");
r = r.replace(new RegExp(/œ/g),"oe");
r = r.replace(new RegExp(/[ùúûü]/g),"u");
r = r.replace(new RegExp(/[ýÿ]/g),"y");
r = r.replace(new RegExp(/\W/g),"");
return r;
};
但是IE6会报错,似乎它不喜欢我的正则表达式。
使用ES2015/ES6的String.prototype.normalize()
方法,
const str = "Crème Brulée"
str.normalize("NFD").replace(/[\u0300-\u036f]/g, "")
> "Creme Brulee"
注意:如果需要将\uFB01
(fi
)规范化为fi
,请使用NFKD
。
这里发生了两件事:
- 将字符串归一化为NFD Unicode规范形式,将组合字形分解为简单字形的组合。Crème中的
è
变为e
+̀
。 - 使用正则表达式字符类匹配U+0300 → U+036F范围,现在可以全局去除变音符号,这些变音符号由Unicode标准方便地归类为组合变音符号 Unicode块。
截至2021年,还可以使用Unicode属性转义符:
str.normalize("NFD").replace(/\p{Diacritic}/gu, "")
有关性能测试的评论。
或者,如果您只想要排序
Intl.Collator对~95%的字符集提供了足够的支持,而且还有一个polyfill可用here,但我没有测试过它。
const c = new Intl.Collator();
["creme brulee", "crème brulée", "crame brulai", "crome brouillé",
"creme brulay", "creme brulfé", "creme bruléa"].sort(c.compare)
["crame brulai", "creme brulay", "creme bruléa", "creme brulee",
"crème brulée", "creme brulfé", "crome brouillé"]
["creme brulee", "crème brulée", "crame brulai", "crome brouillé"].sort((a,b) => a>b)
["crame brulai", "creme brulee", "crome brouillé", "crème brulée"]
标签:me,JavaScript,replace,移除,creme,RegExp,new,brul,重音符号
From: https://www.cnblogs.com/xiaomandujia/p/17806272.html