首页 > 其他分享 >公司名/机构名语料库(Company-Names-Corpus)

公司名/机构名语料库(Company-Names-Corpus)

时间:2022-10-26 14:01:26浏览次数:44  
标签:badcase Company 语料库 Names 清洗 语料 Corpus



向AI转型的程序员都关注了这个号????????????

机器学习AI算法工程   公众号:datayx


公司名语料库(Company-Names-Corpus)

数据大小:480万。

语料来源:多个词典汇总。

数据清洗:已清洗,但仍存有大量badcase。


机构名语料库(Organization-Names-Corpus)

数据大小:110万。

语料来源:多个词典汇总。

数据清洗:已清洗,但仍存有大量badcase。



公司简称、品牌词等(Company-Shorter-Form)

数据大小:28万。

语料来源:多个词典汇总。

数据清洗:已清洗,但仍存有大量badcase。



标签:badcase,Company,语料库,Names,清洗,语料,Corpus
From: https://blog.51cto.com/u_15404184/5797844

相关文章