首页 > 其他分享 >SciTech-BigDataAIML-Statistical Model-Topics Model主题模型-LDA(Latent Dirichilet Allocation, 潜在狄利克雷分布)

SciTech-BigDataAIML-Statistical Model-Topics Model主题模型-LDA(Latent Dirichilet Allocation, 潜在狄利克雷分布)

时间:2024-11-11 12:30:00浏览次数:4  
标签:LDA Latent Topics 主题 Allocation Model Dirichilet

SciTech-BigDataAIML-Algorithm-Heuristic启发式-

Statistical Model(统计概率模型) 的一种
Topics Model(主题模型)

LDA(Latent Dirichilet Allocation) Topics Model主题模型。

LDA(Latent Dirichilet Allocation, 潜在狄利克雷分布)是一种 Topics Model(主题模型),
用于在Large Scale Docs(大量文档)自动发现Hidden Topics(隐藏主题)
在NLP和Text Analysis上, LDA被广泛应用于文本分类、文档聚类、信息检索等场景。

LDA的核心思想

Doc(每篇文档) 看作由 Topics(多个主题)构成,
Topic(每个主题)又由 Terms(一组单词)按一定Distribution(概率分布)生成.

from gensim import corpora,models
#假设已经有文本数据
texts=[ ["human","interface","computer"],
        ["survey","user","computer","system","response"] ]

#创建词典和语料库
dictionary=corpora.Dictionary(texts)
corpus=[dictionary.doc2bow(text) for text in texts]

#使用LDA进行主题分析
lda_model=models.LdaModel(corpus, num_topics=2, id2word=dictionary, passes=10)
topics=lda_model.print_topics(num_words=3)
for topic in topics:
    print(topic)


得到Output(输出)

[(0, '0.177*"computer" + 0.176*"user" + 0.176*"survey"'),
 (1, '0.230*"computer" + 0.228*"interface" + 0.228*"human"')]

标签:LDA,Latent,Topics,主题,Allocation,Model,Dirichilet
From: https://www.cnblogs.com/abaelhe/p/18539454

相关文章

  • LLMOps Essentials: A Practical Guide to Operationalizing Large Language Models
    LLMOpsEssentials:APracticalGuidetoOperationalizingLargeLanguageModelshttps://www.datacamp.com/blog/llmops-essentials-guide-to-operationalizing-large-language-models Whenwe,asusers,interactwithChatGPT,wesimplytypeapromptintothewe......
  • 【论文笔记】VCoder: Versatile Vision Encoders for Multimodal Large Language Mode
    ......
  • InDepth Guide to Denoising Diffusion Probabilistic Models DDPM:DDPM扩散概率模型去
    AnIn-DepthGuidetoDenoisingDiffusionProbabilisticModelsDDPM–TheorytoImplementation中文翻译:DDPM扩散概率模型去噪深度指南——理论到实现https://learnopencv.com/denoising-diffusion-probabilistic-models/#forward-diffusion-equationhttps://github.com/......
  • 【论文阅读】您的 AI 生成的代码真的安全吗?Evaluating Large Language Models on Secu
    IsYourAI-GeneratedCodeReallySafe?EvaluatingLargeLanguageModelsonSecureCodeGenerationwithCodeSecEval标题:您的AI生成的代码真的安全吗?基于CodeSecEval对LLMs代码生成的安全性进行评估摘要:*【Background】大语言模型(LLMs)在代码生成和代码修复方面取......
  • 智谱BigModel研习社|搭建 AI 搜索引擎 - 使用免费的Web-Search-Pro+脑图Agent智能体
    作者:Cartman文章:多智能体AI搜索引擎点击链接,更多实践案例等你探索~ #智谱BigModel研习社是专业的大模型开发者交流平台,欢迎在评论区与我们互动! 传统搜索引擎如今的问题在于输出很多不相关结果(大量垃圾信息+SEO操纵的标题党内容),大模型也面临着幻觉问题。在网......
  • 制作并量化GGUF模型上传到HuggingFace和ModelScope
    llama.cpp是Ollama、LMStudio和其他很多热门项目的底层实现,也是GPUStack所支持的推理引擎之一,它提供了GGUF模型文件格式。GGUF(GeneralGaussianU-NetFormat)是一种用于存储模型以进行推理的文件格式,旨在针对推理进行优化,可以快速加载和运行模型。llama.cpp还支持量......
  • 制作并量化GGUF模型上传到HuggingFace和ModelScope
    llama.cpp是Ollama、LMStudio和其他很多热门项目的底层实现,也是GPUStack所支持的推理引擎之一,它提供了GGUF模型文件格式。GGUF(GeneralGaussianU-NetFormat)是一种用于存储模型以进行推理的文件格式,旨在针对推理进行优化,可以快速加载和运行模型。llama.cpp还支持量......
  • Introduction_Optimization Models_Giuseppe C. Calafiore, Laurent El Ghaoui
    Balabala我想读完GiuseppeC.Calafiore,LaurentElGhaoui版本的《OptimizationModels》。1.Introduction作者列举了若干个例子,并阐述了优化问题的一般形式,最主要的洞见有:一些具有特定性质的问题是tractable的:Thefocusofthisbookisontractablemodels,andak......
  • Nginx接入LDAP
    一、nginx添加ldap模块接入ldap,nginx服务需要添加nginx-auth-ldap-master模块,我是用的yum安装的nginx,没有这个模块1.1查看nginx现有模块]#nginx-Vnginxversion:nginx/1.24.0builtbygcc4.8.520150623(RedHat4.8.5-44)(GCC)builtwithOpenSSL1.0.2k-fips26J......
  • ModelMaker 7由pas逆向类图
    下载通过百度网盘分享的文件:ModelMaker_v7.20.rar链接:https://pan.baidu.com/s/1-jc39uRv5X96HqrkeDs5ZA提取码:i9pb逆向工程逆向工程在MM中十分简单。但是要提醒,先备份一下你的旧代码。1.【单元视图】(Units)选“ImportUnit..”2.选择你要导入的.pas文件。3.ok后你在【......