比较两段文本的相似度
该方法的原理:逐行查找第二个文本是否有第一个文本内该元素的匹配序列,有则认为是重复的,最终输出一个匹配度
from difflib import SequenceMatcher
def file_similarity_checker(f1,f2):
checking = SequenceMatcher(None,f1,f2).ratio()
print(f'文本相似度为{checking*100}%')
return checking
标签:f1,f2,两段,checking,相似,文本
From: https://www.cnblogs.com/dewei233/p/16892385.html