LLM
  • 2024-07-02LLM大语言模型知识点整理
    大模型知识点总结1.基础概念1.1大模型定义大模型(LargeModel)通常指参数量级达到数亿甚至数千亿的深度学习模型。这些模型通常基于Transformer架构,如GPT、BERT等。1.2常见大模型GPT系列(GenerativePre-trainedTransformer)BERT(BidirectionalEncoderRepresentations
  • 2024-07-02【企业级 AI大模型部署白皮书 2024】
    文末有福利!本指南提供全面的AI大模型部署指导,涵盖AI大模型的发展概述、战略决策和部署步骤、方法及选型建议。该指南还指出部署过程中的常见误区,并提供策略自检工具。AI大模型发展关键节点LLM开启的生成式人工智能到底可以解决什么问题,与之前相比,进化在哪儿?企业由数字
  • 2024-07-02无干扰推理:混合下游工作负载的 分解LLM 推理
    24年1月来自中科院和华为云的论文“InferencewithoutInterference:DisaggregateLLMInferenceforMixedDownstreamWorkloads”。基于Transformer的大语言模型(LLM)推理服务现已成为许多云服务的骨干。LLM推理包括预填充阶段和解码阶段。然而,现有的LLM部署实
  • 2024-07-01解析QAnything启动命令过程
    一.启动命令过程日志启动命令bash./run.sh-clocal-i0-bhf-mQwen-1_8B-Chat-tqwen-7b-chat。输入日志如下所示:root@MM-202203161213:/mnt/l/20230918_RAG方向/QAnything#bash./run.sh-clocal-i0-bhf-mQwen-1_8B-Chat-tqwen-7b-chatFromhttps://github.c
  • 2024-07-01解析QAnything启动命令过程
    一.启动命令过程日志启动命令bash./run.sh-clocal-i0-bhf-mQwen-1_8B-Chat-tqwen-7b-chat。输入日志如下所示:root@MM-202203161213:/mnt/l/20230918_RAG方向/QAnything#bash./run.sh-clocal-i0-bhf-mQwen-1_8B-Chat-tqwen-7b-chatFromhttps://gi
  • 2024-07-01​RAG与LLM原理及实践(7)--- Chroma query应用层策略及实现原理
    背景Chromaquery底层查询的 query思想是相同的,甚至在vectordb的世界中,都大同小异。如果你有看前面写的  RAG与LLM原理及实践(5)---Chromaquery源码分析应该比较清楚query的运作原理,说直白就是在memory或是disk中通过暴力查询比较与HNSW算法(NSW算法的变种,分层可导航
  • 2024-07-01BigCodeBench: 继 HumanEval 之后的新一代代码生成测试基准
    HumanEval是一个用于评估大型语言模型(LLM)在代码生成任务中的参考基准,因为它使得对紧凑的函数级代码片段的评估变得容易。然而,关于其在评估LLM编程能力方面的有效性越来越多的担忧,主要问题是HumanEval中的任务太简单,可能不能代表真实世界的编程任务。相比于HumanEval中的
  • 2024-07-01LLM大模型基础入门系列之:(四)从头开始编写LLM代码
    〔更多精彩AI内容,尽在「魔方AI空间」公众号,引领AIGC科技时代〕本文作者:猫先生引言本文是LLM基础入门系列的第4篇。在本文中,我们将从头开始实现一个类GPT的transformer。将按照上一篇文章中《LLM大模型基础入门系列之:(三)Transformer架构》描述的步骤对每个部分
  • 2024-06-30LLM——10个大型语言模型(LLM)常见面试题以及答案解析
    今天我们来总结以下大型语言模型面试中常问的问题1、哪种技术有助于减轻基于提示的学习中的偏见?A.微调Fine-tuningB.数据增强DataaugmentationC.提示校准PromptcalibrationD.梯度裁剪Gradientclipping答案:C提示校准包括调整提示,尽量减少产生的输出中的偏差
  • 2024-06-30LLM对程序员的冲击和影响
    1LLM在软件开发过程中的单点提效我这里罗列一些更多的可能用途:智能代码提示代码片段智能生成SQL语句的智能生成与调优更高效更精准的静态代码检查与自动修复(非rule-based)智能辅助的代码评审与代码重构单元测试和接口测试代码的自动生成更高级的重复代码检查(语义重复检
  • 2024-06-30如何借助 LLM 设计和实现任务型对话 Agent
    1引言在人工智能的快速发展中,任务型对话Agent正成为提升用户体验和工作效率的关键技术。这类系统通过自然语言交互,专注于高效执行特定任务,如预订酒店或查询天气。尽管市场上的开源框架如Rasa和MicrosoftBotFramework在对话理解和管理方面已经取得了不错的进展,但仍
  • 2024-06-30LLM 应用 - 判题
    LLMQuestion你是一个kotlin编程语言算法题的评判老师,请根据题目描述和答题者作答内容从正确性、运行效率和优化空间等方面进行评判。题目描述:===给定一个大小为n的数组nums,返回其中的多数元素。多数元素是指在数组中出现次数大于⌊n/2⌋的元素。你可以假设数组
  • 2024-06-24程序员系统入门大模型的路径和资源,看这篇就够了
    本篇文章面向对大模型领域感兴趣,又不知如何下嘴的程序员。看一下围绕大模型的应用场景和人才需求:**Prompt工程:**基于提示词对大模型的使用,会问问题就行。**基于大模型的应用(狭义的):**通过预设一些Prompt的方式做业务层应用,俗称大模型套壳。AI主播、AINPC、AI小助手。。。
  • 2024-06-24认识Retrieval Augmented Generation(RAG)
    什么是RAG?Retrieval-AugmentedGeneration(RAG)是一种结合信息检索和生成式AI技术的框架。它通过从外部数据源检索信息,增强语言模型(如GPT-3)的生成能力,从而提供更加准确和相关的回答。RAG的组成部分信息检索模块(Retriever)功能:从预先构建的知识库或文档库中检索与用
  • 2024-06-24AI大模型企业应用实战(18)-“消灭”LLM幻觉的利器 - RAG介绍
    大模型在一定程度上去改变了我们生活生工作的思考的方式,然后也越来越多的个人还有企业在思考如何将大模型去应用到更加实际的呃生产生活中去,希望大语言模型能够呃有一些更多企业级别生产落地的实践,然后去帮助我们解决一些业务上的问题。目前1LLM的问题1.1幻觉LLM因为是一个预
  • 2024-06-23notes for llm-universe C2
    基本概念PromptPrompt最初是NLP(自然语言处理)研究者为下游任务设计出来的一种任务专属的输入模板,类似于一种任务(例如:分类,聚类等)会对应一种Prompt我们每一次访问大模型的输入为一个Prompt,而大模型给我们的返回结果则被称为Completion。TemperatureLLM生成是具有随
  • 2024-06-23LLM技术全景图:技术人必备的技术指南,一张图带你掌握从基础设施到AI应用的全面梳理
    LLM技术全景图:技术人必备的技术指南,一张图带你掌握从基础设施到AI应用的全面梳理LLM技术图谱(LLMTechMap)是将LLM相关技术进行系统化和图形化的呈现,此图谱主要特点是“专注于技术人视角”,不求从LLM产业角度汇聚信息,而是希望让从事相关工作或是想了解LLM的技术人有一个快速
  • 2024-06-23构建本地智能知识问答系统:基于Langchain和ChatGLM的简单实践
    在数字化时代,智能知识问答系统成为了提升企业效率和数据安全性的关键工具。本文将介绍如何基于Langchain和ChatGLM构建一个本地化、支持中文的智能知识问答系统。该系统不仅能够实现完全本地化推理,而且对开源模型友好,可满足企业对数据隐私和私域化部署的需求。项目概览本项目利
  • 2024-06-23自学【大模型】的,能骂醒一个算一个!
    为啥说胡乱自学大模型的,能骂醒一个算一个。因为很多人学会个AI工具就觉得自己会玩大模型了,其实你才刚入门!想要完全了解大模型,你首先要了解市面上的LLM大模型现状,学习Python语言、Prompt提示工程,然后深入理解FunctionCalling、RAG、LangChain、Agents等很多人不知道想要
  • 2024-06-23一文读懂LLM API应用开发基础(万字长文)
    前言Hello,大家好,我是GISerLiu
  • 2024-06-22RAG与LLM原理及实践(2)--- RAG结合LLM function调用的原理及落地实践
    花一点时间继续写下,RAG结合LLM。通过上一篇文章你应该知道为什么RAG要结合LLM,或者说为什么LLM要结合RAG使得LLM更强大,特别是当LLM应用在人机对话等方面的时候。只要涉及一问一答,并通过上下文继续丰富对话,就会涉及到他。这个是看事情的两个维度。就像是买钟送电池还是买电池送
  • 2024-06-22RAG与LLM原理及实践(3)--- RAG结合LLM的local实现并附完整代码
    在写RAG结合LLM时,如果你读了我前面写的文章,你应该对里面的技术原理及流程有了很详细的了解。在上一篇文章讲了如何在通义千问中使用function的方式来完成LLM与RAG的结合。其实LLM结合RAG的方式可以有很多种,但是原理都是上一节介绍的,其实本质上就是要LLM知道,哪一类问题‘我’
  • 2024-06-21生成式AI和LLM的一些基本概念和名词解释
    1.MachineLearning机器学习是人工智能(AI)的一个分支,旨在通过算法和统计模型,使计算机系统能够从数据中学习并自动改进。机器学习算法使用数据来构建模型,该模型可用于预测或决策。机器学习应用于各种领域,包括计算机视觉、自然语言处理、语音识别和欺诈检测等。2.DeepLearnin
  • 2024-06-21大模型技术及趋势总结
    本篇文章旨在希望大家对大模型的本质、技术和发展趋势有简单的了解。由于近期大模型技术发展很快,这里对大模型的技术、本质及未来趋势进行总结和探讨时,因为水平有限,疏漏在所难免。请大家谅解。引言大模型将成为通用人工智能的重要途径。在这个由0和1编织的数字时代,人工智能的腾
  • 2024-06-21做完这些大模型项目,面试官直呼太牛了
    前言大语言模型正迅速成为互联网时代最热门的技术创新之一,虽然现在该技术尚处于起步阶段,但已经开始在一些企业应用中广泛部署。接下来,我们来看看大语言模型的10大应用场景。一、文本翻译二、恶意软件分析三、创造文本内容四、搜索五、代码开发六、检测和预防网络攻