首页 > 其他分享 >中文文本纠错相关经典论文、数据集、系统等资源分享

中文文本纠错相关经典论文、数据集、系统等资源分享

时间:2023-06-23 13:36:10浏览次数:34  
标签:中文 文本 拼写 语法 纠错 资源


中文文本纠错相关经典论文、数据集、系统等资源分享_前端

    中文文本纠错又分为中文拼写纠错(Chinese Spelling Check, CSC)和语法纠错(Grammatical Error Correction, GEC)。中文拼写纠错任务对中文文本中的拼写纠错(别字、别词)进行检测和纠正。语法纠错任务纠正文本中不同类型的错误,包括拼写、标点、语法等类型错误。

    本资源整理了中文文本纠错相关经典论文、数据集、系统等资源,需要自取。

    资源整理自网络,源地址:https://github.com/destwang/CTCResources/blob/main/README_ZH.md#%E5%AE%9A%E4%B9%89

目录

中文文本纠错相关经典论文、数据集、系统等资源分享_数据库_02

内容截图

中文文本纠错相关经典论文、数据集、系统等资源分享_数据库_03

中文文本纠错相关经典论文、数据集、系统等资源分享_资源整理_04

中文文本纠错相关经典论文、数据集、系统等资源分享_数据集_05

标签:中文,文本,拼写,语法,纠错,资源
From: https://blog.51cto.com/u_13046751/6537907

相关文章

  • 23年自然语言处理系统性入门学习指南中文版分享
    本教程致力于帮助同学们快速入门NLP,并掌握各个任务的SOTA模型。1.系统入门方法2.各任务模型list汇总:文本分类、文本匹配、序列标注、文本生成(todo)、语言模型3.各任务综述&技巧:文本分类、文本匹配、序列标注、文本生成、语言模型如何系统地入门机器学习是一门既重理论又......
  • 千万级中文公开免费聊天语料数据分享
        分享一个包含千万级聊天语料的资源。地址:https://github.com/codemayq/chaotbot_corpus_Chinese    该库是对目前市面上已有的开源中文聊天语料的搜集和系统化整理工作    该库搜集了包含        · chatterbot        · 豆瓣多轮      ......
  • NLP面试高频知识点整理分享(附详细中文答案)
       本项目是作者们根据个人面试和经验总结出的自然语言处理(NLP)面试准备的学习笔记与资料,该资料目前包含自然语言处理各领域的面试题积累。    资源整理自网络,源地址:https://github.com/km1994/NLP-Interview-Notes    内容涉及多次跳转,点击文末“阅读原文“”查看......
  • NLP实战必读-基于Python的文本分析实战
    本书介绍   从新闻和演讲到社交媒体上的非正式聊天,自然语言是最丰富、利用最少的数据来源之一。它不仅源源不断地供给,总是在环境中变化和适应;它还包含传统数据源无法传达的信息。解锁自然语言的关键是通过文本分析的创造性应用。本书展示了数据科学家用应用机器学习模型构建语......
  • 21互联网从业必读中文-C++ 模板(第二版)
    本书介绍    本书第一版大约出版于15年前。起初我们的目的是编写一本对C++工程师有帮助的C++模板权威指南。目前该项目从以下几个方面来看是成功的:它的作用得到了不少读者的认可,也多次被推荐为参考书目,并屡获好评。 第一版已经很老了,虽然其中不少内容对modernC++工......
  • 21年最新-自然语言处理系统性入门学习指南中文版分享
        本教程致力于帮助同学们快速入门NLP,并掌握各个任务的SOTA模型。    1. 系统入门方法    2.各任务模型list汇总:文本分类、文本匹配、序列标注、文本生成(todo)、语言模型    3.各任务综述&技巧:文本分类、文本匹配、序列标注、文本生成、语言模型 如何系统地......
  • 2021年机器学习面试核心知识点中文版整理分享
        本资源主要是为了整理机器学习面试相关知识点的有用链接(注:目前不打算将一些基础算法的内容加入这个repo里,比如LR、SVM算法在《统计学习方法》里已经得到了很好的解释,面试时可能考到的手推公式在书里已经写的很好了,所以推荐直接看书即可)    资源整理自网络,源地址:https:......
  • 中文版-可解释的机器学习-黑盒模型可解释性理解指南
        本书向你介绍了如何使(监督)机器学习模型可解释。虽然本书中包含⼀些数学公式,但是即使没有公式,你也需要能够理解这些⽅法背后的思想。本书不适合机器学习初学者。如果你不熟悉机器学习,则有很多书籍和其他资源可以学习基础知识。关于机器学习的⼊门学习,我推荐在线学习平台......
  • 中文自然语言处理医疗、法律等公开数据集整理分享
        本文整理了一批医疗、法律等相关的公开数据集,涉及医疗相关的专业词汇分词、问答和医疗实体识别,以及法律文本分类、情感分析和评价相关的数据集。     资源整理自网络,源地址:https://github.com/OYE93/Chinese-NLP-Corpus 分词、词性标注实体识别法律文本分类情感分析......
  • 算法岗必读中文-0天吃掉pyspark实战
    pyspark......