首页 > 其他分享 ># ApacheCN 校对活动参与手册

# ApacheCN 校对活动参与手册

时间:2023-04-22 23:12:42浏览次数:46  
标签:u4e00 翻译 ApacheCN 手册 引擎 u9fff 校对 x20


目的

本文档旨在为一般贡献者提供社区校对活动的参与指南。

本手册充分研究了神经翻译引擎的特点,结合了社区成员的先进经验,使单人可在一周内校对完五本书,而无需逐字阅读。

版本信息

版本

日期

编辑人

v1.0

2022.5.8

飞龙

译后编辑简介

ApacheCN 是立足于自动化的社区,采用了【神经机器翻译】引擎来做中文文档和教程的本地化。

https://docs.apachecn.org/

如你所见,这种方法效率出类拔萃的高,已完成了我们的 70% 的工作量。得益于这种方法,大量技术教程得到翻译,一些技术在中文技术全有了扎根的土壤。

翻译引擎不会改动原文的逻辑,并且在语句通顺程度上可做到 90%。也就是说,一个具有正常读写能力但不懂编程技术的人,在不理解部分专业术语的情况下,可以通读翻译的文章。

然而,翻译引擎由于训练语料的杂乱,领域不单一,对于专业术语往往把握不准,需要译者来把关。由于翻译引擎是个黑盒,无法在翻译过程中提供定制,业界普遍采用【译后编辑】策略。

这种策略被李笑来老师高度赞扬,见《当翻译变成了文本编辑》,他指出在全职状态下,一个熟练的译者一天就能完成一本书。

翻译引擎的错误是结构性的。换句话说,可以通过编辑器的搜索来将其全部发现。一部分甚至可以批量替换来改掉。

在我们的校对活动中,如果你没有时间通读全文,这样也是可以接受的。因为,你不是一个人在战斗,前一个人的疏漏总有后一个人来将其改掉。

校对活动工作流程

在校对活动中,贡献者需要校对三个方面:(1)格式(2)专业术语(3)部分语法。

在每个步骤,经过我们的多次试验,最快方式是通过使用正则表达式来找出译文中的错误。然后把它改正,就是这么简单。

下面列出了所有用到的正则表达式:

格式

链接:

(?<!!)\[[^\]]*\]

表格:

^\|

中文间空格:

中文间空格一般是翻译引擎出错的地方。

[\u4e00-\u9fff]\s+[\u4e00-\u9fff]

未翻译段落:

^[a-zA-Z0-9][^\u4e00-\u9fff]+$
^\s*([\+\-\*]\x20{3}|\d+\.\x20{2})[^\u4e00-\u9fff]+$

内联代码:

在 Markdown 中,内联代码需要用反引号括起来,但一些教程并没有这样做。于是,需要检查中英文边界,将没有用反引号括起来的内联代码改掉。

[\u2018-\u201d\u3001-\u301c\u4e00-\u9fff\uff01-\uff65]\x20*[A-Za-z0-9]|[A-Za-z0-9]\x20*[\u2018-\u201d\u3001-\u301c\u4e00-\u9fff\uff01-\uff65]

粗体/斜体:

\*\*[^\*]+\*\*|(?<!\*)\*[^\*]+\*(?!\*)

术语

请见我们收集的术语列表。校对过程中可能还有需要补充的新项目,欢迎补充。

https://github.com/apachecn/home/blob/master/docs/translate/trans-table.md

部分语法

标题:

^#+\x20

列表(二十字以内):

短的列表由于没有上下文非常容易出错。

^\s*([\+\-\*]\x20{3}|\d+\.\x20{2}).{1,20}$


标签:u4e00,翻译,ApacheCN,手册,引擎,u9fff,校对,x20
From: https://blog.51cto.com/wizardforcel/6215678

相关文章

  • ORB305与CISCO路由器构建L2TP over IPSec VPN操作手册
    1、网络拓扑在思科路由器与ORB305之间建立一个安全隧道,对客户路由器端设备子网,与思科路由器端服务器子网之间的数据流进行安全保护,组网拓扑图如图所示。2、思科路由器端配置指导(此处以多数客户使用专线上网形式为例)Cisco(AR1)配置配置1.AAA配置aaanew-model//启用AAAaaaaut......
  • OpenCV 图像处理学习手册:1~5
    原文:LearningImageProcessingwithOpenCV协议:CCBY-NC-SA4.0译者:飞龙本文来自【ApacheCN计算机视觉译文集】,采用译后编辑(MTPE)流程来尽可能提升效率。当别人说你没有底线的时候,你最好真的没有;当别人说你做过某些事的时候,你也最好真的做过。一、处理图像和视频文件本......
  • OpenCV 图像处理学习手册:6~7
    原文:LearningImageProcessingwithOpenCV协议:CCBY-NC-SA4.0译者:飞龙本文来自【ApacheCN计算机视觉译文集】,采用译后编辑(MTPE)流程来尽可能提升效率。当别人说你没有底线的时候,你最好真的没有;当别人说你做过某些事的时候,你也最好真的做过。六、计算摄影计算摄影是指......
  • db2高可用基础-主从hadr实践手册
    db2高可用基础-主从hadr实践手册(centos8)环境说明:服务器地址:primary192.168.247.128secondary192.168.247.168数据库版本:db2高级企业版V10.5+环境需求:主备两侧关闭系统防火墙,信任网络互通,scp、ssh可正常跳转查看状态systemctlstatusfirewalld.service关闭防火墙syste......
  • 自己项目用到的Nginx环境部署手册
    nginxsticky基于cookie的负载均衡googler开发的google-perftools优化Nginx管理,性能将会有一定程度的提升[/size]([/size][size=10.5pt;font-family:'Calibri',sans-serif;"lang="EN-US]64位[/size]操作系统请先安装libunwind库,32位操作系统不要安装。libunwind库为基于64......
  • 东用科技路由器连接上云助手配置指导手册
    一、上云助手操作步骤1.安装“Devicecontrolcenter”并启动。2.点击“服务器设置”后设置端口号:1-65535,传输协议:TCP/UDP。##路由推送功能默认不勾选。其功能为将填写的远端子网及掩码信息推送给客户端,客户端就会生成一条目的网段为此“远端子网”,下一跳为上云助手的静态路由,从而......
  • Kibana查询语法使用手册【转】
    阅读目录全文搜索按字段搜索通配符搜索匹配单一字符匹配任意多个字符范围搜索布尔搜索分组搜索转义特殊字符速查全文搜索在搜索栏输入login,会返回所有字段值中包含login的文档使用双引号包起来作为一个短语搜索"likeGecko" 也可以按页面左侧显示的字段搜索限定......
  • Pandas 学习手册中文第二版:1~5
    原文:Learningpandas协议:CCBY-NC-SA4.0译者:飞龙一、Pandas与数据分析欢迎来到《Pandas学习手册》!在本书中,我们将进行一次探索我们学习Pandas的旅程,这是一种用于Python编程语言的开源数据分析库。pandas库提供了使用Python构建的高性能且易于使用的数据结构和分......
  • Pandas 学习手册中文第二版:6~10
    原文:Learningpandas协议:CCBY-NC-SA4.0译者:飞龙六、索引数据索引是用于优化查询序列或数据帧中的值的工具。它们很像关系数据库中的键,但是功能更强大。它们为多组数据提供了对齐方式,还带有如何处理数据的各种任务(如重采样到不同频率)的语义。您将对Pandas执行的许多建......
  • Pandas 学习手册中文第二版:11~15
    原文:Learningpandas协议:CCBY-NC-SA4.0译者:飞龙十一、合并,连接和重塑数据数据通常被建模为一组实体,相关值的逻辑结构由名称(属性/变量)引用,并具有按行组织的多个样本或实例。实体往往代表现实世界中的事物,例如一个人,或者在物联网中,是一个传感器。然后,使用单个数据帧对每个......