LLM
  • 2024-11-21一文搞懂什么是AI Agent
    目录一、AIAgent发展历程二、什么是AIAgent三、AIAgent的定义四、AIAgent的核心组件五、AIAgent的工作原理六、AIAgent的应用领域和框架七、AIAgent与LLM、RAG的区别八、总结一、AIAgent发展历程AIAgent的发展历程可以分为几个阶段:早期阶段(1950s-1960s
  • 2024-11-21LLM2CLIP:使用大语言模型提升CLIP的文本处理,提高长文本理解和跨语言能力
    在人工智能迅速发展的今天,多模态系统正成为推动视觉语言任务前沿发展的关键。CLIP(对比语言-图像预训练)作为其中的典范,通过将文本和视觉表示对齐到共享的特征空间,为图像-文本检索、分类和分割等任务带来了革命性突破。然而其文本编码器的局限性使其在处理复杂长文本和多语言任务时
  • 2024-11-20大语言模型及其应用,学习大语言模型,收藏这一篇就够了!
    机器学习机器学习(MachineLearning,ML)是指从数据中自动学习规律和模式,并利用这些规律和模式,在新的数据中完成类似任务的技术和方法。它属于人工智能(ArtificialIntelligence)的一个分支。前排提示,文末有大模型AGI-CSDN独家资料包哦!机器学习的核心思想是使用数据来训练计算
  • 2024-11-20LLM:互联网世界的隐形建模师?
    基于模型规划的网络智能体研究我将以幽默风趣且严谨的方式,带领读者一起探索这篇开创性的研究。
  • 2024-11-20信任的大型语言模型:通过知识库和双解码器定制和基于事实的文本生成
    在人工智能的世界中,大型语言模型(LLMs)的表现如同一位天才演员,尽管它们在内容生成方面技艺非凡,却常常因生成内容的领域限制而“演过了头”。就像《哈利·波特》中的榴莲糖,味道总是让人意外。为了让这些模型“脚踏实地”,我们需要确保其生成的内容基于一个经过验证的背景。这就
  • 2024-11-20【架构设计篇】LLM应用架构实战:基于LangChain的企业级最佳实践
    前言随着ChatGPT等大语言模型的广泛应用,越来越多的企业开始将LLM整合到其业务系统中。然而,从概念验证(PoC)到生产环境的转换过程中,往往会遇到诸多技术挑战。本文将基于实际项目经验,分享LLM应用开发中的架构设计、性能优化、成本控制等关键环节和解决方案。1.LLM应用的特殊性在
  • 2024-11-20Unlocking the Potential: Benchmarking Large Language Models in Water Engineering and Research
    本文是LLM系列文章,针对《UnlockingthePotential:BenchmarkingLargeLanguageModelsinWaterEngineeringandResearch》的翻译。释放潜力:对水工程和研究中的大型语言模型进行基准测试摘要1引言2方法3实验设置4实验结果摘要大型语言模型(LLM)的最新
  • 2024-11-20DISCOVERYBENCH: Towards Data-Driven Discovery with Large Language Models
    本文是LLM系列文章,针对《DISCOVERYBENCH:TowardsData-DrivenDiscoverywithLargeLanguageModels》的翻译。DISCOVERYBENCH:使用大型语言模型实现数据驱动的发现摘要1引言2相关工作3公式化4DISCOVERYBENCH5实验6结论摘要使用大型语言模型(LLM)的
  • 2024-11-20RT-Surv: Improving Mortality Prediction After Radiotherapy with Large Language Model Structuring
    本文是LLM系列文章,针对《RT-Surv:ImprovingMortalityPredictionAfterRadiotherapywithLargeLanguageModelStructuringofLarge-ScaleUnstructuredElectronicHealthRecords》的翻译。RT-Surv:通过大规模非结构化电子健康记录的大型语言模型结构改进放疗后死
  • 2024-11-20Impact of Non-Standard Unicode Characters on Security and Comprehension in Large Language Models
    本文是LLM系列文章,针对《ImpactofNon-StandardUnicodeCharactersonSecurityandComprehensioninLargeLanguageModels》的翻译。非标准Unicode字符对大型语言模型中安全性和理解性的影响摘要1引言2背景和相关工作3方法4对大语言模型的影响5跨语
  • 2024-11-19基于 LLM 的智能运维 Agent 系统设计与实现
    摘要本文详细介绍了一个基于大语言模型(LLM)的智能运维Agent系统的设计与实现。该系统采用多Agent协同的架构,通过事件驱动的方式实现了自动化运维流程。系统集成了先进的AI能力,能够实现故障自动诊断、预测性维护、知识沉淀等核心功能。一、运维Agent架构设计在设计智能
  • 2024-11-19哋它亢在LLM的优势应用
    转自https://datacon-14259.xyz/“哋它亢”编程语言的优势高性能计算低延迟与高效率:“哋它亢”被设计为针对机器学习与深度学习等高性能计算任务进行优化,能够充分利用现代硬件资源,如GPU和TPU,提供低延迟、高效率的计算性能。并行与分布式处理:它内置了高效的并行与分布式处理机
  • 2024-11-19AI大模型实现图片OCR识别
    背景    OCR(OpticalCharacterRecognition,光学字符识别)是一种将图像中的文字转换为机器编码文本的技术。这项技术可以自动读取纸质文档上的文字信息,并将其转换成电子格式,便于编辑、存储和检索。OCR技术在很多领域都有广泛应用,比如数据录入、文献数字化、辅助阅读设备等
  • 2024-11-19检索增强生成(RAG)应用构建的最佳实践
    RAG,也就是检索增强生成,已经证明是个挺管用的招儿,能让大型语言模型(LLM)的回答更靠谱,还能搞定它们有时候会“幻觉”的问题。简单来说,RAG就是给LLM们提供了一些上下文,帮它们生成更准确、更符合上下文的回答。这些上下文可以来自各种地方,比如你的内部文件、向量数据库、CSV文件、JS
  • 2024-11-18大型语言模型综述 A Survey of Large Language Models
    文章源自2303.18223(arxiv.org)如有侵权,请通知下线这是一篇关于大语言模型(LLMs)的综述论文,主要介绍了LLMs的发展历程、技术架构、训练方法、应用领域以及面临的挑战等方面,具体内容如下:摘要——自从图灵测试在20世纪50年代被提出以来,人类已经探索了机器对语言智能的
  • 2024-11-18使用 PyTorch 从头构建最小的 LLM 该项目构建了一个简单的字符级模型
    简介我开始尝试各种受Pokémon启发的猫名变体,试图赋予它独特、略带神秘感的氛围。在尝试了“Flarefluff”和“Nimblepawchu”等名字后,我突然想到:为什么不完全使用人工智能,让字符级语言模型来处理这个问题呢?这似乎是一个完美的小项目,还有什么比创建自定义Pokémon名
  • 2024-11-18基于大模型LLM(包括ChatGPT)的应用开发与辅助编程技能
    《基于大模型LLM(包括ChatGPT)的应用开发与辅助编程技能》在当今数字化飞速发展的时代,大模型LLM(大型语言模型)如ChatGPT等正掀起一场前所未有的技术革命,它们在应用开发与辅助编程领域展现出了巨大的潜力和影响力,正逐渐改变着开发者们的工作模式与思维方式。大模型LLM在应用
  • 2024-11-18多模态大模型LLM与AIGC前沿技术实战,基于训练数据和生成算法模型
    多模态大模型LLM与AIGC前沿技术实战,基于训练数据和生成算法模型在当今人工智能领域,多模态大模型LLM(大型语言模型)与AIGC(人工智能生成内容)正以前所未有的发展态势,引领着技术革新的浪潮。它们的强大能力背后,训练数据和生成算法模型起着至关重要的作用,深入探究这两方面并了解其在实
  • 2024-11-18LLM 链式架构基础:从入门到实践
    在构建复杂的LLM应用时,单一的模型调用往往无法满足业务需求。本文将详细介绍如何构建一个可靠的LLM链式架构,包括基础设计模式、提示词工程和错误处理机制。为什么需要链式架构?在开始深入技术细节之前,让我们先理解为什么需要链式架构:单一模型调用的局限性输入输出格式单
  • 2024-11-18LLM 应用中的数据流转:构建可靠的上下文管理系统
    核心要点理解上下文管理在LLM应用中的关键作用掌握高效的记忆机制设计方法实现可靠的状态管理系统构建智能对话控制流程上下文管理的重要性在LLM应用中,有效的上下文管理对于以下方面至关重要:维持对话连贯性提供个性化体验优化模型响应质量控制系统资源使用记忆
  • 2024-11-18打造智能路由的 LLM 应用:条件分支链详解
    核心要点掌握LLM应用中的动态路由策略实现健壮的错误处理机制构建实用的多语言内容处理系统学习降级策略的最佳实践动态路由机制解析在复杂的LLM应用中,不同的输入往往需要不同的处理路径。动态路由可以帮助我们:优化资源使用提高响应准确性增强系统可靠性控制处理
  • 2024-11-18LLM 并行处理实战:提升处理效率的关键技术
    核心要点掌握LLM应用中的并行处理策略实现高效的批量处理机制构建可扩展的文档处理系统优化系统性能和资源利用并行处理的适用场景在LLM应用中,以下场景特别适合使用并行处理:批量文档处理多模型并行推理大规模数据分析实时流处理批处理策略设计1.基础架构fro
  • 2024-11-17agent runtime
    GoEx:ARuntimeforAutonomousLLMApplicationshttps://gorilla.cs.berkeley.edu/blogs/10_gorilla_exec_engine.html MovingfromChatbotstoAutonomousAgents
  • 2024-11-17基于大语言模型的自治代理综述 《A Survey on Large Language Model based Autonomous Agents》
    图2基于LLM的自治代理架构设计的统一框架基于大语言模型的自治代理综述《ASurveyonLargeLanguageModelbasedAutonomousAgents》自治代理长期以来一直是学术界和工业界的研究热点。以前的研究往往侧重于在孤立的环境中训练知识有限的代理,这与人类的学习过程存
  • 2024-11-17RAG (Retrieval-Augmented Generation) 与 iRAG (image based Retrieval-Augmented Generation)
    RAG{Retrieval-AugmentedGeneration}与iRAG{imagebasedRetrieval-AugmentedGeneration}1.RAG(Retrieval-AugmentedGeneration,检索增强生成)1.1.LLM存在的问题1.2.RAG带来的好处1.3.RAG的工作原理1.4.检索增强生成和语义搜索2.iRAG(image