首页 > 其他分享 >如何翻译 Markdown 文件?-2-几种商业及开源解决方案介绍

如何翻译 Markdown 文件?-2-几种商业及开源解决方案介绍

时间:2023-06-17 14:34:18浏览次数:46  
标签:API 翻译 markdown 解决方案 translator 开源 Markdown Azure

背景

近期在搭建英文博客-<e-whisper.com>, 需要对现有的所有中文 Markdown 翻译为英文。

需求如下:

  • 将 Markdown 文件从中文 (zh-CN) 翻译为英文 (en)
  • 翻译后要保留 Markdown 的完整格式
  • 部分 Markdown block 不需要翻译,如:front-matter、代码块 等

但是实际使用中,试了好几款翻译(包括 Google,DeepL,Azure), 结果发现效果都不理想。

也找到了一些专门针对 markdown 的翻译方案,基本上都是这种方案:将 Markdown 拆分为"段".

一起看看吧。

Markdown 商业及开源解决方案

  • simpleen: 商业版
  • GT4T: 商业版
  • markdown-translator: GitHub 开源项目,基于 JavaScript 和 Azure Translate 收费 API
  • Markdown Docs Translator: GitHub 开源项目,基于 Python 和 主流免费翻译 API (Yandex/Google/Bing/Deepl)
  • ChatGPT + Prompt(markdown+翻译) ?

Simpleen

Simpleen 是个在线翻译服务,你可以通过不同的方式使用 Simpleen 来翻译和本地化你的软件: 使用在线 web 翻译器,在本地使用 CLI(连续翻译)或通过 API 自定义使用。其后端是调用 Deppl 的翻译服务。

以下是使用其翻译的效果:

Simpleen 翻译效果

可以看到,翻译除了将`` 翻译为 \ 之外,其他都完全准确。

另外上图也可以看到,Simpleen 定位非常准确,就是针对开发者群体的,还有 Variable 相关功能。

Simpleen 一大特色功能是:Custom Translator, 如:

  • Python-i18n
  • Vue I18n
  • YAML
  • JSON
  • Markdown
  • ...

同时 Simpleen 也支持自定义词库功能,称为:Glossaries. 可以自定义个人词库。

Simpleen 就是将完整的 markdown 文档,按照 markdown 语法格式,将其拆分为一个个的 Segment. 并对每一个 Segment 进行翻译,如下:

Simpleen Segments

通过 Segments 也可以看出,Simpleen 是将上篇提到的 2 种方法结合起来实现:

  1. 将 Markdown 转换为 html
  2. 将 html 拆分为 Segments
  3. 将 Segment 逐一翻译
  4. 将翻译后的 Segment html 转换为 markdown.

Simpleen 使用总结

优点:

  • 准确度高
  • 实用的特色功能:Custom Translator
  • 实用的特色功能:Variable 支持
  • 实用的特色功能:Glossaries
  • 底层基于 Deepl, Deepl 的翻译效果是最自然的。
  • 多种使用方式:web/api/cli

缺点:

  • 贵,基于 Segment 收费,价格也贵的厉害。
    • 最便宜的月费也得 $15, 并且只有 1,000 Text Segments

Simpleen Price

GT4T

标签:API,翻译,markdown,解决方案,translator,开源,Markdown,Azure
From: https://blog.51cto.com/ewhisper/6504871

相关文章

  • 如何翻译 Markdown 文件?-2-几种商业及开源解决方案介绍
    背景近期在搭建英文博客-<e-whisper.com>,需要对现有的所有中文Markdown翻译为英文。需求如下:将Markdown文件从中文(zh-CN)翻译为英文(en)翻译后要保留Markdown的完整格式部分Markdownblock不需要翻译,如:front-matter、代码块等但是实际使用中,试了好几款翻译......
  • 开源大型语言模型(llm)总结
    大型语言模型(LLM)是人工智能领域中的一个重要研究方向,在ChatGPT之后,它经历了快速的发展。这些发展主要涉及以下几个方面:模型规模的增长:LLM的规模越来越大,参数数量显著增加。这种扩展使得模型能够处理更复杂、更长的输入序列,并生成更准确、更具连贯性的输出。同时,更大规模的模型还......
  • 《安富莱嵌入式周报》第315期:开源USB高速分析仪,8GHz示波器开发, 600行C编写RISC-V内
    周报汇总地址:http://www.armbbs.cn/forum.php?mod=forumdisplay&fid=12&filter=typeid&typeid=104 视频版:https://www.bilibili.com/video/BV1gV4y117UD/1、开源USB2.0高速分析仪https://github.com/ataradov/usb-snifferusb-sniffer-main.zip(2.05MB)分析仪上位机......
  • ICT应用解决方案实验02-IPv6专题
    ICT应用解决方案实验02-IPv6专题1项目概况1.1项目拓扑1.2项目概况IPv4迄今为止已经使用了30多年,并于2019年11月25日,被官方宣布所有剩余可用IPv4地址已全部分配完。随着IPv4地址的耗尽,而互联网依旧在发展,互联网接入设备也继续增多。企业和运营商为了从IPv4网络迁移到IPv6网......
  • 解决方案 | pyautogui实现等待特定图片(对话框)出现(可设置等待超时时间)
    1、问题为了等待某个【转换完毕】的图片(对话框)出现,如何设置?   2、解决方案代码如下下面代码实现的是:设置超时时间为10s,当你在完成前序工作以后,代码开始进入等待,一旦你的特定图片出现了,马上探测到它的位置并且实现点击按钮。(注意:如果等待时间超过了10s,那么就会返回提示:T......
  • Windows server使用无线网卡无效的解决方案——在「功能」中启用「无线 LAN服务」
    大致步骤在「功能」中,安装「无线LAN服务」后重启计算机;在「服务」中,开始「WlanSvc」服务。至此,问题解决。点击桌面右下角的网络图标,选择要连接的无线网络进行连接即可。详细步骤截图安装「无线LAN服务」功能:图一:图二:开始「WlanSvc」服务:效果......
  • Beamr:CABR(闭环内容自适应编码解决方案)
    ContentAwareABR技术本文将简要介绍一下编码优化领域的一位新贵—Beamr的技术动态。Beamr是内容自适应视频编码与优化解决方案的提供商,致力于为MSO(Multi-SystemOperator,多系统运营商)和OTT(OverTheTop,流媒体服务商)提供视频技术支持,如Hollywoodstudios以及视频......
  • 计讯物联小型水库水雨情和大坝安全监测解决方案:以数字之力,促水利建设智慧化
    政策背景根据《“十四五”水库除险加固实施方案》要求,到“十四五”末,全部完成现有及新增的约1.94万座病险水库除险加固;实施55370座小型水库雨水情测报设施和47284座小型水库大坝安全监测设施建设;对分散管理的48226座小型水库全面实行专业化管护模式。今年,水利部将会同财政部,继续......
  • PPT| 工厂数字化MES解决方案
    PPT总共有47页,受篇幅有限,有需要PPT的同学可以关注:智能制造数字化咨询PPT总共有47页,受篇幅有限,有需要PPT的同学可以关注:智能制造数字化咨询......
  • PPT| 集成供应链管理解决方案(可下载)
    PPT总共有165页,受篇幅有限,有需要PPT的同学可以关注:智能制造数字化咨询PPT总共有165页,受篇幅有限,有需要PPT的同学可以关注:智能制造数字化咨询......