首页 > 其他分享 >文本相似度,文本匹配模型归纳(附代码)

文本相似度,文本匹配模型归纳(附代码)

时间:2022-11-03 11:35:14浏览次数:40  
标签:匹配 训练 归纳 python 模型 py 测试 文本 向量

人工智能大数据与深度学习  公众号:datayx


本文将会整合近几年来比较热门的一些文本匹配模型,并以​​QA_corpus​​为测试基准,分别进行测试,代码均采用tensorflow进行实现,每个模型均会有理论讲解与代码实现。


文本相似度,文本匹配模型归纳(附代码)_词向量


数据集为QA_corpus,训练数据10w条,验证集和测试集均为1w条

其中对应模型文件夹下的​​args.py​​文件是超参数

训练: ​​python train.py​

测试: ​​python test.py​

词向量:不同的模型输入不一样,有的模型的输入只有简单的字向量,有的模型换成了字向量+词向量,甚至还有静态词向量(训练过程中不进行更新)和 动态词向量(训练过程中更新词向量),所有不同形式的输入均以封装好,调用方法如下

静态词向量,请执行 ​​python word2vec_gensim.py​​,该版本是采用gensim来训练词向量

动态词向量,请执行 ​​python word2vec.py​​,该版本是采用tensorflow来训练词向量,训练完成后会保存embedding矩阵、词典和词向量在二维矩阵的相对位置的图片, 如果非win10环境,由于字体的原因图片可能保存失败


测试集结果对比:

文本相似度,文本匹配模型归纳(附代码)_词向量_02




不断更新资源

深度学习、机器学习、数据分析、python

 搜索公众号添加: datayx  

文本相似度,文本匹配模型归纳(附代码)_深度学习_03



机大数据技术与机器学习工程

 搜索公众号添加: datanlp

文本相似度,文本匹配模型归纳(附代码)_深度学习_04

标签:匹配,训练,归纳,python,模型,py,测试,文本,向量
From: https://blog.51cto.com/u_15404184/5819236

相关文章