本文档译自 joelonsoftware.com 的文章"The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)",作者 joel,原文参见此处
概述 - Overview
你是否在某一个平凡的日子,思考过那个神秘的 Content-Type 标签?你知道你应该把它放在 HTML 中,但却一直不知道它应该写成什么(以及为什么)?
你是否收到过远在国外的朋友的邮件,而邮件的标题是“???? ?????? ??? ????”?
我很沮丧地发现,有相当多的软件开发人员并没有真正完全跟上字符集、编码、Unicode 等神秘世界的发展速度。在许多年前,FogBUGZ 的一个测试者想知道它是否能处理收到的日文电子邮件。当我仔细观察我们用来解析 MIME 电子邮件的商业 ActiveX 控件时,我们发现它对字符集做了完全错误的事,所以我们不得不编写代码来拯救它所做的错误转换并使用正确方案。当我研究另一个商业库时,它同样有支离破碎的字符处理代码。我和那个库的开发者联系过,他认为他们对此无能为力。像许多程序员一样,他只希望能早日从混沌中解脱。
但是它不可能自己变好。当我发现流行的 web 开发工具 PHP 几乎完全无视字符编码问题,无忧无虑地使用 8 位字符,导致它几乎不可能开发出好的国际 web 应用程序时,我想,我 TM 受够了。
所以我要在这里宣布:如果你是一个在 2003 年工作的程序员,而且你还不知道字符、字符集、编码和 Unicode 的基础知识的话,如果被我抓住,我会狠狠地惩罚你,让你在潜艇里剥 6 个月的洋葱。我发誓我会的
标签:编码,字节,字符,字母,基本知识,字符集,Unicode,码点 From: https://www.cnblogs.com/Code-For-What/p/17839709.html