首页 > 其他分享 >对相似的句子两两配对

对相似的句子两两配对

时间:2023-03-06 11:34:58浏览次数:29  
标签:combination sentence list same 相似 line 配对 句子 append

from itertools import combinations
import pandas as pd

# %% 获取不同意图的双列表
f = open("same_sentence.txt", encoding="utf-8")

single_sentence_list = []
same_sentence_list = []
while True:
    line = f.readline()
    if line:
        line = line.replace("\n", "")
        if "----" in line:
            same_sentence_list.append(line.split("----"))
        else:
            single_sentence_list.append(line)
    else:
        break
f.close()

same_sentence_list.append(single_sentence_list)


# %% 对每个意图进行组合
combination_list = []
for sentence_list in same_sentence_list:
    temp = combinations(sentence_list, 2)
    temp_list = list(temp)
    combination_list.append(temp_list)


# %% 将组合转换为csv文件
csv_list = []
for i in combination_list:
    for j in i:
        csv_list.append(j)

pd.DataFrame(data=csv_list).to_excel("combination.xlsx", index=None)

标签:combination,sentence,list,same,相似,line,配对,句子,append
From: https://www.cnblogs.com/tiansz/p/17183140.html

相关文章

  • Python利用模糊哈希实现对比文件相似度详解
    导读对比两个文件相似度,python中可通过difflib.SequenceMatcher/ssdeep/python_mmdt/tlsh实现,在大量需要对比,且文件较大时,需要更高的效率,可以考虑模糊哈希,本文就来和大......
  • 多平台图片相似度检测算法
    目录多平台图片相似度检测算法Android.NETPython多平台图片相似度检测算法甲方最终选择的是:平均值检测算法Android使用的是opencv-3.4.15.aartry......
  • 2363. 合并相似的物品 (Easy)
    问题描述2363.合并相似的物品(Easy)给你两个二维整数数组items1和items2,表示两个物品集合。每个数组items有以下特质:items[i]=[valueᵢ,weightᵢ]其中val......
  • 2363. 合并相似的物品
    classSolution{structmy_cmp{booloperator()(constvector<int>&ite1,constvector<int>&ite2){returnite1[0]<ite2[0];//升序......
  • 力扣---2363. 合并相似的物品
    给你两个二维整数数组items1和items2,表示两个物品集合。每个数组items有以下特质:   items[i]=[valuei,weighti]其中valuei表示第i件物品的价值,weighti......
  • 合并相似的物品
    //给你两个二维整数数组 items1 和 items2 ,表示两个物品集合。每个数组 items 有以下特质:items[i]=[valuei,weighti] 其中 valuei 表示第 i 件物品的 价......
  • 03_17_JavaWeb||day20_JQuery基础||day20_JQuery基础(选择器:筛选具有相似特征的元素(
    今日内容1.JQuery基础:1.概念2.快速入门3.JQuery对象和JS对象区别与转换4.选择器5.DOM操作6.案例JQuery基础:概念:一个JavaScript框架。简化JS开发jQuer......
  • 如何实现蓝牙配对方法混淆攻击
    背景蓝牙技术是一种无线数据和语音通信开放的全球规范,它是基于低成本的近距离无线连接,为固定和移动设备建立通信环境的一种特殊的近距离无线技术连接。蓝牙具有无线、短程......
  • 评价指标:相似度、GAS消耗
    【代码注释自动生成方法综述】这些评测指标主要来自机器翻译和文本总结等研究领域,可以评估候选文本(即基于代码注释自动方法而生成)和参考文本(即基于手工方式而生成)的......
  • 【线性代数复习笔记】矩阵特征值,特征向量,相似对角化与实对称矩阵
    【线性代数复习笔记】矩阵特征值,特征向量,相似对角化与实对称矩阵线代好难-_-特征值与特征向量:1.求解特征值与特征向量:​ 先计算特征多项式f(ʎ)=|ʎI-A|,求出根,再根据......