• 2024-09-30大模型驱动的自主智能体全面调研
    人工智能咨询培训老师叶梓转载标明出处基于LLMs构建的自主智能体,有望实现类似人类的决策能力。图1展示了LLMs驱动的自主智能体领域的增长趋势。从2021年1月到2023年8月,不同颜色代表不同类别的智能体。例如,游戏智能体旨在模拟游戏玩家,而工具智能体主要关注工具使用。然而,
  • 2024-09-30Minstrel自动生成结构化提示,让AI为AI写提示词的多代理提示生成框架
    在人工智能快速发展的今天,如何有效利用大型语言模型(LLMs)成为了一个普遍关注的话题。这是9月份的一篇论文,提出了LangGPT结构化提示框架和Minstrel多代理提示生成系统,为非AI专家使用LLMs提供了强大支持。对于非人工智能专家来说,构建高质量的提示以充分利用LLMs的能力仍然是一个巨大
  • 2024-09-29将 LLMs 精调至 1.58 比特: 使极端量化变简单
    随着大语言模型(LLMs)规模和复杂性的增长,寻找减少它们的计算和能耗的方法已成为一个关键挑战。一种流行的解决方案是量化,其中参数的精度从标准的16位浮点(FP16)或32位浮点(FP32)降低到8位或4位等低位格式。虽然这种方法显著减少了内存使用量并加快了计算速度,但往往
  • 2024-09-25大语言模型(LLM)入门学习路线图
    Github项目上有一个大语言模型学习路线笔记,它全面涵盖了大语言模型的所需的基础知识学习,LLM前沿算法和架构,以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份资料重点介绍了我们应该掌握哪些核
  • 2024-09-23大型语言模型在学术界的影响:从写作到演讲
    引言
  • 2024-09-23大语言模型在学术界的影响:从书写到口头表达
  • 2024-09-23OpenAI o1模型揭秘:通过LLMs学习推理能力
    OpenAI推出了o1,这是一种通过强化学习训练的大型语言模型,专门用于进行复杂的推理任务。o1在回答问题之前会“思考”,能够在响应用户之前生成一条长的内部思维链。在编程竞赛问题(Codeforces)中,OpenAIo1的排名在89%分位,位列美国数学奥林匹克预选赛(AIME)前500名学生之列,并且在物理、生
  • 2024-09-23OpenAI o1模型揭秘:通过LLMs学习推理能力
    OpenAI推出了o1,这是一种通过强化学习训练的大型语言模型,专门用于进行复杂的推理任务。o1在回答问题之前会“思考”,能够在响应用户之前生成一条长的内部思维链。在编程竞赛问题(Codeforces)中,OpenAIo1的排名在89%分位,位列美国数学奥林匹克预选赛(AIME)前500名学生之列,并且在物理、生
  • 2024-09-20大模型面试必备:100 道精选八股文题目及其详解
    前言算法暑期实习机会快结束了,校招大考即将来袭。当前就业环境已不再是那个双向奔赴时代了。求职者在变多,岗位在变少,要求还更高了。最近,我们陆续整理了很多大厂的面试题,帮助球友解惑答疑和职业规划,分享了面试中的那些弯弯绕绕。分享100道大模型面试八股文,喜欢记得点赞
  • 2024-09-19大模型 LLMs 入门指南:小白的学习之路
    前言很明显,这是一个偏学术方向的指南要求,所以我会把整个LLM应用的从数学到编程语言,从框架到常用模型的学习方法,给你捋一个通透。也可能是不爱学习的劝退文。通常要达到熟练的进行LLM相关的学术研究与开发,至少你要准备数学、编码、常用模型的知识,还有LLM相关的知识的准备
  • 2024-09-17计算机人工智能前沿进展-大语言模型方向-2024-09-17
    计算机人工智能前沿进展-大语言模型方向-2024-09-171.LargeLanguageModelsinBiomedicalandHealthInformatics:AReviewwithBibliometricAnalysisHYu,LFan,LLi,JZhou,ZMa,LXian,WHua,SHe…-JournalofHealthcare…,2024生物医学和健康信
  • 2024-09-16计算机人工智能前沿进展-大语言模型方向-2024-09-16
    计算机人工智能前沿进展-大语言模型方向-2024-09-161.SecuringLargeLanguageModels:AddressingBias,Misinformation,andPromptAttacksBPeng,KChen,MLi,PFeng,ZBi,JLiu,QNiu-arXivpreprintarXiv:2409.08087,2024保护大型语言模型:解决偏见、
  • 2024-09-14大模型书籍推荐:从头开始构建一个大型语言模型(含PDF免费)《Build a Large Language Model (From Scratch)》
    通过从头开始构建一个大型语言模型,了解如何创建、训练和调整大型语言模型(LLMs)!一、构建大型语言模型(从头开始)在《构建大型语言模型(从头开始)》中,你将了解如何LLMs从内到外工作。在这本富有洞察力的书中,畅销书作家塞巴斯蒂安·拉施卡(SebastianRaschka)将指导你逐步创建
  • 2024-09-14大语言模型(LLM)入门学习路线图
    Github项目上有一个大语言模型学习路线笔记,它全面涵盖了大语言模型的所需的基础知识学习,LLM前沿算法和架构,以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份资料重点介绍了我们应该掌握哪些核
  • 2024-09-14GitHub狂飙3万star的LLM公开资料
    先用一张图片说明这篇blog多火热!本篇大型语言模型(LLM)课程分为三个部分:
  • 2024-09-13借助 LLMs 分析上市公司电话会议,提高股票波动性预测精度
    作者:老余捞鱼原创不易,转载请标明出处及原作者。写在前面的话:    今天摘选了一篇论文分享给大家。该论文介绍了一个名为ECCAnalyzer的新框架,它利用大型语言模型(LLMs)从电话会议(ECCs)中提取更丰富、更细粒度的信息,以提高股票波动性预测的性能。研究者们采用了一种
  • 2024-09-13【Preference Learning】Chain of Preference Optimization: Improving Chain-of-Thought Reasoning in LLMs
    问题背景在推理过程中使用TOT方式可以增加推理性能,但由于增加了推理次数,导致耗时过大。目前待解决的问题是如何能在推理时既保持很好的推理能力,又保持推理耗时不会过大。本文方法文章提出CPO(ChainofPreferenceOptimization)方式。该方法使用TOT方式来探索推理路径得到
  • 2024-09-1351c大模型~合集52
    #Carpentopod当代版木牛流马?国外网友造出「会走路的桌子」,引百万人围观你想喝瓶啤酒,于是就把桌子叫了过来。这不是吃了菌子才有的场景,而是国外网友的一项发明,名叫Carpentopod。整个桌子有12条腿,里面内置了电机,是木工、电子和编程结合的产物。只要按下遥控器,桌子就会向你走来,像一
  • 2024-09-12已成功入职字节,总结精选50个大模型高频面试题(附答案)
    觉得中大厂面试太难的,完全就是自己没准备充分,技术不到位,没准备的面试完全是浪费时间,更是对自己的不负责!.今天我给大家分享一下我整理的《精选50个大模型高频面试题》大模型面试专题和答案,其中大部分都是面试常问的面试题,可以对照这查漏补缺奥!祝大家早日上岸呀!1.简述GP
  • 2024-09-11RAG系统的7个检索指标:信息检索任务准确性评估指南
    大型语言模型(LLMs)作为一种生成式AI技术,在近两年内获得了显著的关注和应用。但是在实际部署中,LLMs的知识局限性和幻觉问题仍然是一个挑战。检索增强生成(RetrievalAugmentedGeneration,RAG)通过为LLM提供额外的外部知识和上下文,有效地解决了这些问题。截至2024年RAG已经成为应用生成
  • 2024-09-10PDF下载,理解大语言模型:学习基础概念和技术共145页
    前言本书将向您介绍大型语言模型(LLM)的基本概念,以及与之相关的技术。这本书首先介绍了ChatGPT等对话式AI的兴起,以及它们与更广泛的大型语言模型的关系。从那里,您将了解自然语言处理(NLP)、其核心概念以及它如何导致LLM的兴起。接下来,您将深入了解转换器及其特征(例如自我注意)
  • 2024-09-09C#整合Ollama实现本地LLMs调用
    前言    近两年AIGC发展的非常迅速,从刚开始的只有ChatGPT到现在的很百家争鸣。从开始的大参数模型,再到后来的小参数模型,从一开始单一的文本模型到现在的多模态模型等等。随着一起进步的不仅仅是模型的多样化,还有模型的使用方式。大模型使用的门槛越来越低,甚至现在每个人都可
  • 2024-09-06【RAG】LongRAG:利用长上下文LLMs增强检索增强生成
    前言现有的RAG框架通常使用100词的短段落作为检索单元,这种设计使得检索器需要在大量语料库中搜索,增加了工作负担,并且容易引入难负样本,影响性能。LongRAG框架为了解决这一问题,该框架使用长检索单元(最多4K词),显著减少了语料库的大小(从22M减少到600K),从而减轻了检索器的负担,并提
  • 2024-09-06大型语言模型(LLMs)是怎样“学习”的?一封给网络工程师的大模型指南
    数字时代,人工智能(AI)及其相关技术正日益成为许多领域的热门话题。其中,生成式人工智能(GenAI)和大型语言模型(LLMs)引起了广泛的兴趣和讨论。然而,尽管这些术语在科技界和专业领域中频繁出现,网络工程师对其的理解却不多。什么是生成式人工智能和大型语言模型?本文将为大家介绍大
  • 2024-09-05三星的MobileQuant:将高性能语言模型带到你的口袋中
    大型语言模型(LLMs)在语言处理方面取得了显著成果,并广泛应用于各种场景。然而,在移动设备(如手机)上实现LLMs存在许多挑战,特别是在内存、能耗和计算需求方面的限制。这些制约因素阻碍了LLMs在此类设备上的广泛应用。一种有前景的解决方案是减少权重和激活的位宽,使8位激活成为在设备