向AI转型的程序员都关注了这个号????????????
机器学习AI算法工程 公众号:datayx
公司名语料库(Company-Names-Corpus)
数据大小:480万。
语料来源:多个词典汇总。
数据清洗:已清洗,但仍存有大量badcase。
机构名语料库(Organization-Names-Corpus)
数据大小:110万。
语料来源:多个词典汇总。
数据清洗:已清洗,但仍存有大量badcase。
公司简称、品牌词等(Company-Shorter-Form)
数据大小:28万。
语料来源:多个词典汇总。
数据清洗:已清洗,但仍存有大量badcase。