首页 > 其他分享 >酒店评论情感判断模型训练(非神经网络)

酒店评论情感判断模型训练(非神经网络)

时间:2024-03-15 15:46:19浏览次数:21  
标签:酒店 word text vectors 情感 texts 神经网络 words test

hotel.txt

1,距离川沙公路较近,但是公交指示不对,如果是蔡陆线的话,会非常麻烦
1,商务大床房,房间很大,床有2M宽,整体感觉经济实惠不错!
1,酒店比较新,装潢和设施还不错,只是房间有些油漆味。
0,房间设施还可以,但酒店内非常的冷,冬天不推荐入住。
0,太令人失望了。太差劲了。
0,什么电力宾馆呀?!根本就象私人的“大车店”!
import jieba
import re
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import MultinomialNB

pattern = re.compile(r'[^\u4e00-\u9fa5a-zA-Z0-9]+')
# 读取数据集文件并解析每行数据
with open('hotel.txt', 'r', encoding='utf-8') as f:
    lines = f.readlines()
    labels = []
    texts = []
    for line in lines:
        label, text = line.strip().split(',',1)
        labels.append(int(label))
        text = pattern.sub('', text)
        texts.append(text)

# 对于中文文本数据进行预处理,使用jieba分词,去停用词
stop_words = [line.strip() for line in open('stopwords.txt', 'r', encoding='utf-8').readlines()]
texts_tokenized = []
for text in texts:
    words = jieba.cut(text)
    words_cleaned = [word for word in words if word not in stop_words]
    texts_tokenized.append(' '.join(words_cleaned))


# 将清洗和预处理后的数据转化成模型所需要的向量格式,使用词袋模型
vectorizer = TfidfVectorizer()
vectors = vectorizer.fit_transform(texts_tokenized)
vectors = vectors.toarray()

# print(vectors)
# 建立一个分类模型来训练数据,使用朴素贝叶斯分类器
clf = MultinomialNB()
clf.fit(vectors, labels)

# 对新的评论进行预测
test_texts = ['这间房间很干净,创业很舒服','很早就到了,但是服务员半天才给打开房间,真是没法说','虽然来晚了,但是房间一直留着呢,还安排了汽车从机场接回','早饭有两个鸡蛋,一个香肠。午饭也安排了好吃的自助,唯一不足的就是肉有点少,哈哈哈','洗澡水温度不错,但是没有浴巾,这可怎么办,总不能让我拿衣服擦吧','临走的时候互相加了微信,我会推荐给好友的']

for test_text in test_texts:
    test_text_tokenized = jieba.cut(test_text)
    test_text_cleaned = [word for word in test_text_tokenized if word not in stop_words]
    test_text_processed = ' '.join(test_text_cleaned)
    test_vector = vectorizer.transform([test_text_processed]).toarray()
    test_prediction = clf.predict(test_vector)

    if test_prediction[0] == 0:
        print('[负面]' + test_text)
    else:
        print('[正面]' + test_text)

标签:酒店,word,text,vectors,情感,texts,神经网络,words,test
From: https://www.cnblogs.com/netstat/p/18075569

相关文章

  • WOA-GRU多输入回归预测 | 鲸鱼优化算法-门控循环单元神经网络 | Matlab
    目录一、程序及算法内容介绍:基本内容:亮点与优势: 二、实际运行效果: 三、部分程序:四、完整程序下载:一、程序及算法内容介绍:基本内容:本代码基于Matlab平台编译,将WOA(鲸鱼群算法)与GRU(门控循环单元神经网络)结合,进行多输入数据回归预测输入训练的数据包含7个特征,1个......
  • MATLAB神经网络——如何自定义属于自己的训练流程
    网络上大部分matlab神经网络训练流程都应用matlab内置的相关训练函数进行训练,如何让matlab神经网络训练过程拥有像pytorch一样的训练过程呢?本文将通过一个案例介绍如何利用matlab自定义自己的训练流程,希望对你有所启迪,让我们开始吧!clear,clc加载并处理原始数据  我们使用......
  • 小白学视觉 | 神经网络训练trick总结
    本文来源公众号“小白学视觉”,仅用于学术分享,侵权删,干货满满。原文链接:神经网络训练trick总结来自|知乎  作者|Anticoder链接|https://zhuanlan.zhihu.com/p/59918821本文仅作学术交流,如有侵权,请联系删除神经网络构建好,训练不出好的效果怎么办?明明说好的拟合任......
  • Python实现BOA蝴蝶优化算法优化循环神经网络分类模型(LSTM分类算法)项目实战
    说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取。1.项目背景蝴蝶优化算法(butterflyoptimizationalgorithm,BOA)是Arora等人于2019年提出的一种元启发式智能算法。该算法受到了蝴蝶觅食和交配行为的启发,......
  • Python实现BOA蝴蝶优化算法优化循环神经网络回归模型(LSTM回归算法)项目实战
    说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取。1.项目背景蝴蝶优化算法(butterflyoptimizationalgorithm,BOA)是Arora等人于2019年提出的一种元启发式智能算法。该算法受到了蝴蝶觅食和交配行为的启发,......
  • java毕设jsp酒店预约管理系统毕业设计
    简介基于JavaJSP的酒店预约管理系统是一个利用Java技术和JSP页面实现的酒店在线预约平台。该系统通过简洁明了的界面,为用户提供酒店信息查询、房间预约及管理等功能,同时支持管理员对酒店及预约信息进行高效管理。采用JSP技术,使得系统具备良好的扩展性和可维护性,为用户提......
  • 基于酒店文本描述来推荐相似酒店
    在旅行规划中,选择合适的酒店是一个重要的决策。然而,面对众多的酒店选择,如何找到与个人偏好相匹配的酒店成为一个挑战。本文将介绍如何构建一个基于描述内容相似度的酒店推荐系统,通过分析Seattle_Hotels数据集,为用户提供个性化的酒店推荐。为其推荐相似度高的Top10个其他酒店......
  • 酒店需要用堡垒机的几个理由以及堡垒机品牌推荐
    酒店,一个大家都熟悉的地方,工作旅游吃喝玩乐都可以实现的地方。对于客人而言,酒店安全至关重要,不仅需要酒店保障人身安全,也需要酒店保障客户信息安全。因此酒店行业也是需要做好数据安全运维的。这里给酒店行业推荐使用堡垒机。酒店需要用堡垒机的几个理由1、统一管理;2、提......
  • 深度学习——LeNet卷积神经网络初探
    LeNet--卷积神经网络初探模型介绍:简单介绍:从网络结构可以看出LeNet对于现在的大模型来说是一个非常小的神经网络,他一共由7个层顺序连接组成。分别是卷积层、pooling层、卷积层、pooling层和三个全连接层。用现代的深度学习框架来实现代码如下:代码实现和解读:net=nn.Sequent......
  • C语言数据结构实现酒店管理
    #include<stdio.h>#include<windows.h>#include<stdlib.h> #include<string.h>//用于用户验证 #defineMAX100//最大房间容量 #defineStytm20#definemAX1024//文件读取字符长 intfileHang(FILE*fp);intlength=0;//房间顺序 typedefintDataType;typ......