首页 > 其他分享 >一键语法错误增强工具 ChineseErrorCorrector

一键语法错误增强工具 ChineseErrorCorrector

时间:2024-07-29 09:28:25浏览次数:9  
标签:小明 语法错误 NLP tool 一键 cged ChineseErrorCorrector GrammarErrorDat

一键语法错误增强工具

欢迎使用一键语法错误增强工具,该工具可以进行14种语法错误的增强,不同行业可以根据自己的数据进行错误替换,来训练自己的语法和拼写模型,可以支持的14种不同语法错误增强,分别为:

 

每种错误类型,对应的使用方法,如下所示:

环境的安装

pip install ChineseErrorCorrector

  

不同类型的数据增强

1.缺字漏字

 

from ChineseErrorCorrector.dat import GrammarErrorDat

cged_tool = GrammarErrorDat()
print(cged_tool.lack_word("小明住在北京"))

# 输出:小明在北京

  

 

2.错别字错误

from ChineseErrorCorrector.dat import GrammarErrorDat

cged_tool = GrammarErrorDat()
print(cged_tool.wrong_word("小明住在北京"))
# 输出:小明住在北鲸

 

 

3.缺少标点

from ChineseErrorCorrector.dat import GrammarErrorDat

cged_tool = GrammarErrorDat()
print(cged_tool.lack_char("小明住在北京,热爱NLP。"))
# 输出:小明住在北京热爱NLP。

  

 

4.错用标点

from ChineseErrorCorrector.dat import GrammarErrorDat

cged_tool = GrammarErrorDat()
print(cged_tool.wrong_char("小明住在北京"))
# 输出:小明住在北京。热爱NLP。

  

 

5.主语不明

from ChineseErrorCorrector.dat import GrammarErrorDat

cged_tool = GrammarErrorDat()
print(cged_tool.unknow_sub("小明住在北京"))
# 输出:住在北京

  

 

6.谓语残缺

from ChineseErrorCorrector.dat import GrammarErrorDat

cged_tool = GrammarErrorDat()
print(cged_tool.unknow_pred("小明住在北京"))
# 输出:小明在北京

  

 

7.宾语残缺

from ChineseErrorCorrector.dat import GrammarErrorDat

cged_tool = GrammarErrorDat()
print(cged_tool.lack_obj("小明住在北京,热爱NLP。"))
# 输出:小明住在北京,热爱。

  

 

8.其他成分残缺

from ChineseErrorCorrector.dat import GrammarErrorDat

cged_tool = GrammarErrorDat()
print(cged_tool.lack_others("小明住在北京,热爱NLP。"))
# 输出:小明住北京,热爱NLP。

  

 

9.虚词多余

from ChineseErrorCorrector.dat import GrammarErrorDat

cged_tool = GrammarErrorDat()
print(cged_tool.red_fun("小明住在北京,热爱NLP。"))
# 输出:小明所住的在北京,热爱NLP。

  

 

10.其他成分多余

from ChineseErrorCorrector.dat import GrammarErrorDat

cged_tool = GrammarErrorDat()
print(cged_tool.red_component("小明住在北京,热爱NLP。"))
# 输出:小明住在北京,热爱NLP。,看着

  

 

11.主语多余

from ChineseErrorCorrector.dat import GrammarErrorDat

cged_tool = GrammarErrorDat()
print(cged_tool.red_sub("小明住在北京,热爱NLP。"))
# 输出:小明住在北京,小明热爱NLP。

  

 

12.语序不当

from ChineseErrorCorrector.dat import GrammarErrorDat

cged_tool = GrammarErrorDat()
print(cged_tool.wrong_sentence_order("小明住在北京,热爱NLP。"))
# 输出:热爱NLP。,小明住在北京

  

 

13.动宾搭配不当

from ChineseErrorCorrector.dat import GrammarErrorDat

cged_tool = GrammarErrorDat()
print(cged_tool.wrong_ver_obj("小明住在北京,热爱NLP。"))
# 输出:None ,即无法进行此类错误的增强

  

 

14.其他搭配不当

from ChineseErrorCorrector.dat import GrammarErrorDat

cged_tool = GrammarErrorDat()
print(cged_tool.other_wrong("小明住在北京,热爱NLP。"))
# 输出:None, 即无法进行此类错误的增强

  

标签:小明,语法错误,NLP,tool,一键,cged,ChineseErrorCorrector,GrammarErrorDat
From: https://www.cnblogs.com/TW-NLP/p/18329367

相关文章

  • PPT模板替换秘籍:一键撤销原模板,轻松更换新风格!
    将PPT中的模板换成另一个模板,可以通过几种不同的方法实现。以下是几种常用的方法:方法一:使用PowerPoint内置的设计选项卡打开PowerPoint:首先,打开你想要更改模板的PPT文件。选择“设计”选项卡:在PowerPoint的顶部菜单栏中,找到并选择“设计”选项卡。选择新模板:在“设计”选项......
  • 当 Visual Studio 检测到代码没有问题时,无法弄清楚为什么它返回“语法错误”
    fromkivy.appimportAppfromkivy.uix.gridlayoutimportGridLayoutfromkivy.uix.labelimportLabelclasstest(App):defbuild(self):self.window=GridLayout()self.label=Label(text="hello")self.window.add_widge......
  • 【shell脚本快速一键部署项目】
    目录一、环境拓扑图二、主机环境描述三、注意四、需求描述五、shell代码的编写六、总结一、环境拓扑图二、主机环境描述主机名主机地址需要提供的服务content.exam.com172.25.250.101提供基于httpd/nginx的YUM仓库服务ntp.exam.com172.25.250.102提供基于Chrony......
  • 掌握Conda:一键更新所有包的终极指南
    ......
  • 思维导图工具MindMap本地docker一键安装详细教程
    文章目录前言1.Docker一键部署思维导图2.本地访问测试3.Linux安装Cpolar4.配置公网地址5.远程访问思维导图6.固定Cpolar公网地址7.固定地址访问前言本文主要介绍在Linux系统以docker方式一键部署思维导图工具SimpleMindMap,并结合cpolar内网穿透工具实现远程......
  • 一键退出苹果手机恢复模式?你学会了吗?
    iPhone的恢复模式是一个用于修复或重新安装iOS系统的特殊状态。然而,如果不小心进入了恢复模式,而你又不知道如何退出,你可能回感到不知所措。下面,小编将给大家分享如何一键退出iPhone的恢复模式,一起来看看吧!一、强制重启强制重启iPhone是最简单也是最常用的退出恢复模式的方......
  • 超火爆AI工具——Vozo:一键重写视频脚本、重新配音!
    最近有一款短视频工具——VozoAI非常火热,上线即登ProductHunt榜首,且已蝉联3天。它的全名是VozoRewrite&Redub,Rewrite意味着重新编写,Redub代表重新配音,它能够根据提示词,重新生成视频脚本并能够通过克隆原说话人声音,为视频生成新的配音,外加同步口型!今天就带大家一起来了解......
  • 刚刚!Stable diffusion 4.8+ComfyUI升级版终于来了!(一键安装包,感谢大佬)
    如果这个世界有上帝,那么祂一定是程序员。国内SD绘画启动器第一人是我认为是B站的秋葉aaaki因为制作了这款StableDiffusion启动器,降低了国内使用SD的门槛且分文不收,秋叶被粉丝戏称赛博菩萨。1背景信息▍****StableDiffusion是什么?StableDiffusion(简称SD)是一种生......
  • QQ音乐VIP歌曲批量下载后,一键全自动转换+ogg批量转码Mp3
    那天隔壁大妈笑眯眯地找到我,说:“阿星啊,大妈想学几首新的广场舞,你能不能帮大妈从QQ音乐里下几首歌?”我一听,这简单啊,立马答应下来。结果,一动手才发现,QQ音乐的VIP歌曲居然都是加密的,下载下来不是mgg就是mflac,根本没法直接听!于是,阿星开始了一场“解密+格式转换”的大冒险。经过......
  • 一键优化工厂运营:免费可视化工具打造产线管理新看板
    工业4.0时代,智能制造已成为企业转型升级的关键驱动力。面对复杂多变的市场需求和日益精细化的生产管理要求,如何快速、直观地掌握产线动态,优化资源配置,提升生产效率,成为了每一家制造企业亟需解决的问题。 在众多解决方案中,使用可视化工具成为众多工厂管理者的首选。 如山海鲸......