• 2024-09-24【大模型专栏—实战篇】从0到1带你QLoar微调
    大模型专栏介绍
  • 2024-09-20【Python机器学习】NLP信息提取——提取人物/事物关系
    目录词性标注实体名称标准化实体关系标准化和提取单词模式文本分割断句断句的方式使用正则表达式进行断句词性标注词性(POS)标注可以使用语言模型来完成,这个语言模型包含词及其所有可能词性组成的字典。然后,该模型可以使用已经正确标注好词性的句子进行训练,从而识别
  • 2024-09-19大模型-提示词工程-句子对语义匹配-03
    目录1.提示工程2.代码1.提示工程[('现在你需要帮助我完成文本匹配任务,当我给你两个句子时,你需要回答我这两句话语义是否相似。只需要回答是否相似,不要做多余的回答。','好的,我将只回答”是“或”不是“。'),('句子一:公司ABC发布了季度财报,显示盈利增长。\n句子二
  • 2024-09-19通过CLIP引导解码减轻大型视觉-语言模型中的幻觉问题
    人工智能咨询培训老师叶梓转载标明出处大型视觉-语言模型(LVLMs)因其在视觉推理方面的能力而备受瞩目,被视为实现自主操作智能体的重要里程碑。但它在生成文本时容易出现对象幻觉问题,即描述中包含不存在的对象,这严重限制了它们的可靠性和实用性。标题为了解决这一
  • 2024-09-18英语长难句解析:考研英语阅读理解的突破点
    导语:考研英语阅读理解部分一直是考生们头疼的难题,尤其是面对那些长难句时,往往让人摸不着头脑,本文将围绕如何通过掌握关键词,攻克长难句,从而突破考研阅读理解的难点展开论述。关键词在长难句中的作用1、理解句意的关键长难句中往往包含许多专业术语、抽象概念等,这些词汇往往
  • 2024-09-13个人项目
    这个作业属于哪个课程https://edu.cnblogs.com/campus/gdgy/CSGrade22-34/homework/13228这个作业要求在哪里https://edu.cnblogs.com/campus/gdgy/CSGrade22-34/homework/13228这个作业的目标<实现论文查重,学会使用PSP表格,使用Github管理项目>作业要求:1.在Git
  • 2024-09-121个案例,让你的提示词告别平淡无奇
    前言在职场中,沟通能力,协调能力,组织能力等一直是岗位的硬性要求,这些能力,时时刻刻体现在我们日常的工作中。什么是沟通能力,协调能力,组织能力?能够把一个人说服,让他听你的,就叫沟通能力,能够把矛盾的一方或者几方说服,让他们搁置争议,听你指挥,就叫协调能力,能够把一大群人说服,让他们统
  • 2024-09-09[NLP] TextRank 算法
    1概述:TextRank算法1.1TextRank算法:源于PageRank算法感兴趣PageRank的朋友,请转阅:[机器学习/Python]PageRank原理与实现-博客园/千千寰宇TextRank算法基于PageRank,用于为文本生成关键字、摘要、计算语句(短语或者词汇)的重要性排名,而PageRank最初是因Google搜索
  • 2024-09-08【NLP自然语言处理】文本的数据分析------迅速掌握常用的文本数据分析方法~
    目录
  • 2024-09-043种提高内容写作的反套路方法
    空洞的词句就像内容创作中的“空热量”。它们也许能增加你的字数,但却会让你的信息变得毫无意义。一小点空洞的词句可能对读者来说只是个小小的分心——但如果过多,就会迅速失控。冗长的表达会让你的内容变得难以阅读、不可信,甚至显得像垃圾信息。是什么让写作变得空洞?写作中
  • 2024-09-02SCKG:Reliable Semantic Communication System Enabled by Knowledge Graph——智能化选择所发送的三元组集合
    1.语义通信的背景和重要性1.1.传统通信vs.语义通信        传统的通信技术关注的是比特和符号的准确传输,即如何在不丢失信息的前提下将数据从发送端传输到接收端。然而,随着数据量的爆炸性增长和对通信带宽的需求增加,传统通信方式逐渐接近香农容量的上限,难以满足
  • 2024-08-31掌握 BERT:自然语言处理 (NLP) 从初级到高级的综合指南(1)
    简介BERT(来自Transformers的双向编码器表示)是Google开发的革命性自然语言处理(NLP)模型。它改变了语言理解任务的格局,使机器能够理解语言的上下文和细微差别。在本文[1]中,我们将带您踏上从BERT基础知识到高级概念的旅程,并配有解释、示例和代码片段。BERT简介什么
  • 2024-08-30元气日语 Genki-1 第 7 课 家庭照片
    家族の写真课文Iゆい:これはソラさんの家族の写真ですか。ソラ:ええ。ゆい:ソラさんはどれですか。ソラ:これです。高校の時はめがねをかけていました。ゆい:かわいいですね。ソラ:これは父です。ニューヨークの会社で働いています。ゆい:背が高いくて、かっこい
  • 2024-08-21如何用 word2vec 计算两个句子之间的相似度
    源代码示例可供参考https://pan.quark.cn/s/aeb85eaf95e2用Word2Vec计算两个句子之间的相似度主要涉及以下几个步骤:将句子分词、获取词向量、计算句子向量、计算句子向量之间的相似度。其中,获取词向量是基础也是关键,它直接影响后续句子向量的计算准确性和相似度计算的效果。
  • 2024-08-13摘要生成—通过摘要风格控制摘要的生成/抽取,原文阅读与理解:GEMINI: Controlling The Sentence-Level Summary Style in Abstractive Te
    GEMINI:ControllingTheSentence-LevelSummaryStyleinAbstractiveTextSummarizationGEMINI:在抽象文本摘要中控制句子级摘要风格paper:https://arxiv.org/abs/2304.03548github:https://github.com/baoguangsheng/gemini本文介绍了一种自适应摘要抽取/生成方
  • 2024-08-12深度学习--数据增强总结
    1.数据增强简介数据增强(DataAugmentation)是一种通过对现有数据进行多种转换和变换,从而生成更多样本的方法。其主要目的是通过增加数据量和多样性,帮助模型更好地泛化,减少过拟合现象。数据增强方法广泛应用于计算机视觉、自然语言处理、语音识别等领域。在深度学习中,由于模型
  • 2024-08-12124. 项目74:简易句子结构分析器——《跟老吕学Python·新手》
    124.项目74:简易句子结构分析器——《跟老吕学Python·新手》124.项目74:简易句子结构分析器124.1目标124.2功能124.3设计124.4实现步骤124.5代码实现124.6测试124.7注意事项124.8小结124.项目74:简易句子结构分析器124.1目标开发一个
  • 2024-08-12【python学习】使用 jieba和 rank_bm25进行文本相似度计算
    介绍如何使用jieba分词库和rank_bm25库中的BM25Okapi算法来计算文本相似度。我们将通过一个简单的示例,展示如何实现这一过程。准备句子列表首先,我们准备一个包含多个句子的列表:sentences=["这是一个测试句子","温格高赢得了2023环法冠军","北京奥
  • 2024-08-12中英文的思维差异——代码的命名方式不同
    中英文在叙述上很大的差别,在于语序的不同。就中文的表达而言,我们习惯经由一连串的铺陈来得出最后的结论,我们通常会先在句子的前半段找到一些背景资讯或者理由,来支撑后面的重点。然而,以英文的习惯来说,重要的地方就要必需要开门见山、一目了然地点明出来,也就是说,先果后因、先重点
  • 2024-08-10openai 的各个模型比较(关于英语句子解析)
    最近在使用chatgpt帮助学习英语,主要是进行语法分析和难点解释。为了找到最适合的模型,我比较了多个模型的回答。语法分析问题这是我在实际中理解有困难的句子,尽管比较简短,但从内容上理解,它涉及了倒装。各个模型回答gpt-3.-5-turbo-1106是经过微调的3.5-turbogpt-4o-m
  • 2024-08-09nlp基础之词、子词或字符
    在文本处理过程中,分词可以将文本拆解成不同层次的基本单元:词、子词或字符。这些基本单元在自然语言处理(NLP)任务中有不同的应用场景和效果。以下是对词、子词、字符的解释和举例说明:1.词(Word)定义:词是文本中由空格或标点符号分隔的最基本的语义单元。每个词通常代表一种独立的
  • 2024-08-05《Advanced RAG》-05-探索语义分块(Semantic Chunking)
    摘要文章首先介绍了语义分块在RAG中的位置和作用,并介绍了常见的基于规则的分块方法。然后,阐述了语义分块的目的是确保每个分块包含尽可能多的独立语义信息。接着,文章分别介绍了三种语义分块方法的原理和实现方法,并对每种方法进行了总结和评估。文章观点语义分块是R
  • 2024-08-04最长最短单词【原创】
    最长最短单词描述输入1行句子(不多于200个单词,每个单词长度不超过100),只包含字母、空格和逗号。单词由至少一个连续的字母构成,空格和逗号都是单词间的间隔。试输出第1个最长的单词和第1个最短单词。输入一行句子。输出
  • 2024-08-02Transformer 工作流程(大白话版)
    Transformer工作流程:通俗易懂的解释想象一下,你在参加一个创意写作班,你和其他几位同学一起写一篇故事。老师会让每个人轮流写一段,但在写之前,你们可以参考之前同学写的内容。这有点像Transformer的工作流程。让我们一步步来解释。编码器(Encoder)1.输入嵌入层(InputEmbed
  • 2024-08-02句子向量表示(Sentence2Vec)
    句子向量表示(Sentence2Vec)是一种将句子转换为向量表示的技术。它的主要目的是将文本中的句子转换为数值向量,以便在机器学习和自然语言处理任务中进行处理和分析。通过将句子表示为向量,可以使用向量之间的距离或相似度来衡量句子之间的语义相似性。例如,在文本分类任务中,可