LLM

2025-01-212025年大厂AI大模型面试题精选及答案解析，非常详细！
前言随着AI市场，人工智能的爆火，在接下来的金九银十招聘高峰期，各大科技巨头和国有企业将会对AGI人才的争夺展开一场大战，为求职市场注入了新的活力。前排提示，文末有大模型AGI-CSDN独家资料包哦！为了助力求职者在面试中展现最佳状态，深入理解行业巨头的选拔标准变得至关重要。
2025-01-20AI与药学 | Med-Pal：轻量级大型语言模型在药物咨询领域的应用
随着新冠疫情的催化，数字医疗正以前所未有的速度发展，传统的面对面医疗服务模式逐渐向线上转移。数字健康工具的普及提升了患者的健康素养，也为医护人员带来了更沉重的文书工作和认知负担。大型语言模型(LLMs)的出现，为解决这一矛盾提供了新的可能。LLMs在经过优化后，有望成为总
2025-01-20使用LangChain快速构建LLM应用程序指南
LangChain新手指南：快速构建LLM应用程序在这篇文章中，我们将深入探讨如何使用LangChain快速上手LLM应用开发。从基础应用到高级功能，我们将通过代码实例帮助您理解并实现这些技术。技术背景介绍随着大语言模型（LLM）的发展，构建智能应用程序变得越来越普遍。LangChain作为一个强
2025-01-20【大模型面试必备】20道大模型经典问题及答案：助你成功通过面试！
我总结了可能会遇到的20个LLM面试问题。初级LLM面试问题Q1.简单来说，什么是大型语言模型（LLM）？大型语言模型（LLM）是一种通过大量文本材料训练的人工智能系统，能够像人类一样理解和生成语言。通过使用机器学习技术识别训练数据中的模式和关联，这些模型能够提供逻辑上和上下文上
2025-01-19大模型agent开发之toolkits使用
Toolkits用途toolkit提供了预定义工具集合，专注于某些特定服务，比如数据库查询、文件处理、Python代码执行、网络爬虫等任务。这些工具集为Agent提供了更高层次的抽象，简化了工具的使用过程。常见的ToolkitSQLDatabaseToolkit：使用场景主要是要通过自然语言对数据库执行查询，可
2025-01-18【LLM】Openai-o1及o1类复现方法
note可以从更为本质的方案出发，通过分析强化学习的方法，看看如何实现o1，但其中的核心就是在于，如何有效地初始化策略、设计奖励函数、实现高效的搜索算法以及利用强化学习进行学习和优化。文章目录note一、Imitate,Explore,andSelf-Improve:AReproductionReportonS
2025-01-17LLM大模型实践12-评估输入—分类
简介本章聚焦评估输入任务的重要性，其对系统质量与安全性意义重大。处理多种独立指令集任务时，先对查询类型分类，再据此确定所用指令，好处众多。实现方式是定义固定类别，硬编码特定类别任务相关指令。比如构建客户服务助手，查询类型分类及指令确定尤为关键：用户要求关闭账户，二级
2025-01-17LLM大模型实践14-处理输入-思维链推理
语言模型在回答问题时匆忙下结论易在推理链中出错，“思维链推理”策略要求语言模型先给出相关推理步骤、深度思考后再给答案，更接近人类解题思维。此方法能减少语言模型匆忙犯错，生成更准确可靠的响应，是提升回答质量的重要策略。本章将探讨如何处理语言模型输入以生成高质量输出，
2025-01-17基于LLM大语言模型的知识库问答系统（FastGPT）
FastGPT是一个基于LLM大语言模型的知识库问答系统。一、功能特点数据处理能力强：提供开箱即用的数据处理功能，支持手动输入、直接分段、LLM自动处理和CSV等多种数据导入途径，可处理PDF、WORD、Markdown和CSV等多种格式的文档，自动对文本数据进行预处理、向量化和QA分割，节省手
2025-01-16热门开源Ai搜索引擎对比分析
汇总lepton●项目地址：https://github.com/leptonai/search_with_lepton●简介：比较早期的AiSearch，由贾扬清团队项目开源，整个项目含前后端在内仅需不到500行代码。●搜索引擎：支持两种默认搜索引擎：Bing和Google。●LLM：官方提供的API，可自行替换其他厂商API。●其他：提供
2025-01-16一文读懂：大模型RAG（检索增强生成）含高级方法
RAGRAG检索增强生成（RetrievalAugmentedGeneration），已经成为当前最火热的LLM应用方案。理解不难，就是通过自有垂域数据库检索相关信息，然后合并成为提示模板，给大模型生成漂亮的回答。业界不知道大模型的基本没有，大家对大模型的能力也有一定的了解，但是当我们将大模型应用于实际
2025-01-15Proj CJI Paper Reading: A Wolf in Sheep’s Clothing: Generalized Nested Jailbreak Prompts can Fool La
Abstractbackground:本文认为现有的jailbreaking方法要么需要人力，要么需要大模型，本文不需要本文:ReNELLMTask:JailbreakingLLMblackboxMethod:PromptRewriting,ScenarioNesting，利用被攻击的LLM来生成jailbreakpromptsPromptWriting似乎是每次iterate都
2025-01-15Python中LLM的模型动态深度调整：早退机制
文章目录引言早退机制的基本原理1.1早退机制的工作流程1.2退出分数的计算1.3早退机制的优点早退机制的实现2.1模型结构设计2.2早退模块的设计2.3早退决策的实现2.4训练与推理早退机制的应用场景3.1实时推理3.2边缘计算3.3自适应模型早退机制的优化与挑战4.1
2025-01-15为什么人工智能会导致更大的社会不平等……至少在开始时如此
为什么人工智能会导致更大的社会不平等……至少在开始时如此一次巨大变革的不对称性来源：作者使用GPT-4o撰写虽然每一次技术革命都创造了比毁掉的工作岗位更多的就业机会，人工智能也不会例外。然而，我们正迎来向那个世界转变的
2025-01-15AI应用开发先了解这些概念：智能体、LLM、RAG、提示词工程
什么是智能体(Agent)一种基于LLM（LargeLanguageModel）的能够感知环境、做出决策并执行行动以实现特定目标的自主系统。与传统人工智能不同，AlAgent模仿人类行为模式解决问题，通过独立思考和调用工具逐步完成给定目标，实现自主操作。通用智能体平台以Agent为核心技术驱动，
2025-01-152025年最新大模型学习路径，从入门到精通，学完即就业【LLM学习路线】
LLMFundamentals基础1.机器学习的数学基础在掌握机器学习之前，理解支撑这些算法的基本数学概念非常重要。线性代数：这是理解许多算法（特别是深度学习算法）的关键。主要概念包括向量、矩阵、行列式、特征值和特征向量、向量空间以及线性变换。微积分：许多机器学习算法涉
2025-01-14Python中LLM的模型稀疏化训练：L0正则化与彩票假设
文章目录引言1.模型稀疏化的背景与意义1.1模型稀疏化的动机1.2稀疏化的主要方法2.L0正则化2.1L0正则化的理论基础2.2L0正则化的实现2.3L0正则化的优缺点3.彩票假设3.1彩票假设的理论基础3.2彩票假设的实现3.3彩票假设的优缺点4.L0正则化与彩票假设的结合5
2025-01-14必读的100篇生成式AI论文清单
2024年真是生成式人工智能研究大放异彩的一年！最让我们惊讶的是，整个领域的焦点发生了翻天覆地的变化。尤其是在2023年和2024年，情况开始变得截然不同，由于大模型模型已经能够做很多事情，因此也更加关注应用层面的研究。论文集合地址：https://github.com/aishwaryanr/aweso
2025-01-14Agent学习
最新AIAgent万字综述分享！Anthropic最新：AIAgents2024年度总结！AIAgent=大模型+记忆+规划+工具使用两种思维方式：CoT和ReAct，都可以通过Prompt的设计来控制构建块、工作流和Agent构建块：增强型LLM工作流程：提示链接工作流程：路由工作流程：并行化工作流程：Orchestrator
2025-01-14用于与多个数据库聊天的智能 SQL 代理问答和 RAG 系统（4） —— 利用大型语言模型（LLM）生成和执行SQL查询，并通过语言模型处理查询结果生成最终答案
实现一个与旅行相关的SQL数据库交互的工具，利用大型语言模型（LLM）生成和执行SQL查询，并通过语言模型处理查询结果生成最终答案。完整代码：fromlangchain_core.toolsimporttoolfromlangchain_community.utilitiesimportSQLDatabasefromlangchain.chainsimportcreate_
2025-01-14让 LLM 来评判 | 选择 LLM 评估模型
基础概念这是让LLM来评判系列文章的第一篇，敬请关注系列文章:基础概念选择LLM评估模型设计你自己的评估prompt评估你的评估结果奖励模型相关内容技巧与提示什么是评估模型？评估模型(Judgemodels)是一种用于评估其他神经网络的神经网络。大多数情况下它们用
2025-01-14京东广告生成式召回基于 NVIDIA TensorRT-LLM 的推理加速实践
作者：京东零售陈航0000生成式推荐系统优势介绍推荐系统的主要任务是根据用户的历史行为预测其兴趣点，并向其推荐相应的商品。传统的推荐系统在处理用户请求时，会触发多个召回模块（包括热门商品召回、个性化召回、深度召回等），以召回大量候选商品。随后，系统通过相对简单的粗排模型对
2025-01-14初学者怎么入门大语言模型（LLM）？
大语言模型（LLM）是一门博大精深的学科，涉及到高等数学、python编程、PyTorch/Tensorflow/Onnx等深度学习框架……然而奇妙的是，越是看上去难得要死、一辈子都学不完的技术，入门起来却越是容易。正如阿瑟·克拉克的名言：足够先进的科技看上去与魔法无异。大语言模型先进得如同魔法
2025-01-14LLM大模型入门必读免费白皮书《从头训练大模型最佳实践》免费pdf分享
本书介绍《CurrentBestPracticesforTrainingLLMsfromScratch》是由Weights&Biases（W&B）提供的一份关于从头开始训练大型语言模型（LLMs）的权威指南。这份白皮书深入剖析了LLMs训练的最佳实践，内容覆盖了从数据收集与处理、模型架构选择、训练技巧与优化策略，到模型评估
2025-01-142025年35+程序员，是否有机会转型 AI 大模型应用开发？
对于35岁以上的程序员来说，转型到AI大模型应用开发领域不仅是可能的，而且在很多方面还具有独特的优势。随着人工智能技术的发展，特别是大规模预训练模型（如GPT系列、LLaMA系列等）的应用日益广泛，AI行业迎来了新的发展机遇。对于希望在这个新领域寻找职业发展的成熟程序员而言，这是