• 2024-11-19Qwen2.5-0.5B-Instruct搭建
    模型地址https://huggingface.co/Qwen/Qwen2.5-0.5B-Instruct简介通义千问新一代开源模型Qwen2.5,旗舰模型Qwen2.5-72B性能超越Llama405B,再登全球开源大模型王座。Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本
  • 2024-11-05简易CPU设计入门:译码模块(一)
    项目代码下载还是请大家首先准备好本项目所用的源代码。如果已经下载了,那就不用重复下载了。如果还没有下载,那么,请大家点击下方链接,来了解下载本项目的CPU源代码的方法。下载本项目代码准备好了项目源代码以后,我们接着去讲解。本节前言有一段时间没写本专栏的教程了。在之
  • 2024-10-29GraphRAG原理及部署实战(GraphRAG系列第一篇)
        RAG在大模型时代,被寄予了厚望,但在近一年多各大小公司的实施过程中,其效果远没有抖音中宣传的那么振奋人心,其原因是多方面的。这篇文章就RAG中的一个弱项--局部性来展开讨论。一、RAG原理       图1描述了RAG的原理,用户输入了一个指令Instruct,RAG将其与Docu
  • 2024-10-27Llama 越狱探索 Llama-3.1-8B-Instruct去除限制过程
    探索Llama-3.1-8B-Instruct模型的越狱过程,即解除其限制,以实现更为灵活的使用,涉及对模型的行为约束、输入输出过滤器及整体指令的定制化调整。Llama模型家族由Meta研发,通常带有一定的指令集和约束,以确保其安全、可靠地运行,尤其是在指令模型中,这些限制可能会抑制其生成内
  • 2024-10-22中文Mixtral大模型: 开启中文大规模语言模型新篇章
    中文Mixtral大模型:开启中文大规模语言模型新篇章近年来,大规模语言模型(LargeLanguageModels,LLMs)在自然语言处理领域取得了突破性进展,展现出强大的语言理解和生成能力。然而,大多数主流LLMs主要针对英语进行训练,在中文等其他语言上的表现相对较弱。为了推动中文大模型的
  • 2024-10-19简易CPU设计入门:验证取指令模块
    项目代码下载还是请大家首先准备好本项目所用的源代码。如果已经下载了,那就不用重复下载了。如果还没有下载,那么,请大家点击下方链接,来了解下载本项目的CPU源代码的方法。下载本项目代码准备好了项目源代码以后,我们接着去讲解。本节前言想要学习本节,前提是,你得是学习过我讲
  • 2024-10-19英伟达发布了个70B的新AI模型,碾压GPT-4和Claude3.5
    Nvidia悄然推出了一款新型人工智能模型,名为Llama-3.1-Nemotron-70B-Instruct,表现出色,已经超越了OpenAI的GPT-4和Anthropic的Claude3.5,标志着人工智能领域竞争格局的重大变化。这款模型在知名AI平台HuggingFace上发布,虽然没有太大的宣传,但其卓越的性能迅速引起
  • 2024-10-13阿里云的Qwen2.5-Coder 和 Qwen2.5-Math专有模型怎么样?
    阿里云发布Qwen2.5 系列模型,最新发布的Qwen2.5系列中包括普通的大语言模型(LLM)以及针对编程和数学的专用模型:Qwen2.5-Coder 和 Qwen2.5-Math。包括:Qwen2.5:0.5B、1.5B、3B、7B、14B、32B和72BQwen2.5-Coder:1.5B、7B和32B(即将发布)Qwen2.5-Math:1.5B、7B和72
  • 2024-10-12Qwen2.5-Coder——专门从事代码生成、完成和数学推理任务的 LLM
    1.概述论文地址:https://arxiv.org/pdf/2409.12186源码地址:https://github.com/qwenlm/qwen2.5-coderQwen2.5-Coder是其前身CodeQwen1.5的重大演进,专门设计用于执行代码生成和代码修改等编程相关任务。该系列包括两个型号,参数分别为15亿(15亿)和70亿(70亿)。2.算法
  • 2024-09-22vscode使用continue插件连接LM studio的模型
    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录一、步骤1.LMstudio加载模型2.启动api服务3.修改continue配置文件4.测试二、总结一、步骤1.LMstudio加载模型根据需求设置系统提示词,根据设备显卡和模型大小设置上下文长度和n_gpu_la
  • 2024-09-14开源模型应用落地-qwen2-7b-instruct-LoRA微调-unsloth(让微调起飞)-单机单卡-V100(十七)
    一、前言  本篇文章将在v100单卡服务器上,使用unsloth去高效微调QWen2系列模型,通过阅读本文,您将能够更好地掌握这些关键技术,理解其中的关键技术要点,并应用于自己的项目中。  使用unsloth能够使模型的微调速度提高2-5倍。在处理大规模数据或对时间要求较高的场景下
  • 2024-09-10Base/chat/instruct in LLM
    Base/chat/instructhttps://blog.csdn.net/qq_43127132/article/details/140447880大模型库中的base、chat、instruct和4bit通常指的是不同类型或配置的预训练语言模型。它们的区别主要在于训练目标、用途和模型参数的精度。以下是对这些术语的解释:1.Base模型(base)   
  • 2024-09-03谢谢微软,又又又Open了!一口气发布3款Phi-3.5新模型,领先Llama3.1和谷歌同级模型
    前言家人们!微软又用爱发电了!一觉醒来,微软发布了最新的小模型三兄弟:Phi-3.5-MoE-instructPhi-3.5-mini-instructPhi-3.5-vision-instruct三兄弟的表现可以说是相当的不错,其中,Phi-3.5-MoE在基准测试中击败了Llama3.18B、Mistral-Nemo-12B,Gemini1.5Flash。在推理能力方面它也优
  • 2024-09-03开源模型应用落地-qwen2-7b-instruct-LoRA微调&合并-ms-swift-单机多卡-RTX 4090双卡(十五)
    一、前言  本篇文章将使用ms-swift去合并微调后的模型权重,通过阅读本文,您将能够更好地掌握这些关键技术,理解其中的关键技术要点,并应用于自己的项目中。二、术语介绍2.1.LoRA微调  LoRA(Low-RankAdaptation)用于微调大型语言模型(LLM)。 是一种有效的自适应
  • 2024-08-28在AMD GPU上使用DBRX Instruct
    DBRXInstructonAMDGPUs—ROCmBlogs在这篇博客中,我们展示了DBRXInstruct,这是由Databricks开发的一个专家混合大型语言模型,在支持ROCm的系统和AMDGPU上运行。关于DBRXInstructDBRX是一个基于Transformer的仅解码大型语言模型,拥有1320亿参数,采用了细粒度的专家混合
  • 2024-08-24Qwen2-72B的vLLM部署
    今天尝试本地部署了Qwen2-72B-Instruct-GPTQ-Int4模型,这里记录一下操作的过程。参考:https://qwen.readthedocs.io/zh-cn/latest/deployment/vllm.htmlhttps://docs.vllm.ai/en/stable/serving/openai_compatible_server.htmlhttps://techdiylife.github.io/blog/blog.html?
  • 2024-08-23开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机单卡-V100(八)
    一、前言  本篇文章将使用LLaMA-Factory去高效微调(命令和界面方式)QWen2系列模型,通过阅读本文,您将能够更好地掌握这些关键技术,理解其中的关键技术要点,并应用于自己的项目中。二、术语介绍2.1.LoRA微调  LoRA(Low-RankAdaptation)用于微调大型语言模型(LLM)。
  • 2024-08-22微软的Phi-3.5系列发布三重威胁
    微软通过新的Phi-3.5系列在AI领域迈出了新的一步,提供了三种为不同任务设计的最先进模型。这些模型不仅功能强大,而且用途广泛,使开发人员能够轻松处理从基本编码到复杂问题解决,甚至视觉任务。无论您是使用有限资源,还是需要高级的人工智能功能,Phi-3.5系列模型都能满足您的
  • 2024-08-21微软发布功能强大的全新 Phi-3.5 机型,击败谷歌、OpenAI 等公司
    微软并没有因为与OpenAI的合作而满足于其在人工智能领域的成功。相反,这家因总部位于华盛顿州而被称为雷德蒙德(Redmond)的公司今天发布了其不断发展的语言/多模态人工智能Phi系列中的3个新模型。这三个模型分别针对基本/快速推理、更强大的推理和视觉(图像和视频分析)任
  • 2024-08-18最佳实践:在AvaloniaChat中接入SiliconCloud
    AvaloniaChat介绍AvaloniaChat是一个基于大语言模型用于翻译的简单应用。在看英文文献的过程中,比较喜欢对照着翻译看,因此希望一边是英文一边是中文,虽然某些软件已经自带了翻译功能,但还是喜欢大语言模型的翻译,但每次都要将英文复制粘贴过去还要自己手动添加prompt,还无法对照
  • 2024-08-16【课程总结】day24(下):大模型部署调用(vLLM+LangChain)
    前言在上一章【课程总结】day24(上):大模型三阶段训练方法(LLaMaFactory)内容中主要了解一个大模型的训练过程,无论是第三方的大模型还是自研的大模型,都需要部署到服务端,提供对应API接口供上层应用使用。所以,本章将主要了解vLLm+langchain的基本使用方法。大模型应用框架
  • 2024-08-07QWen2-72B-Instruct模型安装部署过程
    最近在给我们的客户私有化部署我们的TorchV系统,客户给的资源足够充裕,借此机会记录下部署千问72B模型的过程,分享给大家!一、基础信息操作系统:Ubuntu22.04.3LTSGPU:A800(80GB)*8内存:1TB二、软件信息Python:3.10Pytorch:2.3.0Transformers:4.43.0vLLM:0.5.0cuda:
  • 2024-08-01Self-Instruct:将语言模型与自我生成的指令对齐
    论文:SELF-INSTRUCT:AligningLanguageModelswithSelf-GeneratedInstructionsArxiv:https://arxiv.org/abs/2212.10560论文背景        大型“指令调整”语言模型(即微调以响应指令)已经证明了将零样本泛化到新任务的显着能力。然而,它们在很大程度上依赖于人类编
  • 2024-07-17windows11 使用pytorch transformers运行Qwen2-0.5B-Instruct模型 (基于anaconda python虚拟环境管理平台)
    吾名爱妃,性好静亦好动。好编程,常沉浸于代码之世界,思维纵横,力求逻辑之严密,算法之精妙。亦爱篮球,驰骋球场,尽享挥洒汗水之乐。且喜跑步,尤钟马拉松,长途奔袭,考验耐力与毅力,每有所进,心甚喜之。 吾以为,编程似布阵,算法如谋略,需精心筹谋,方可成就佳作。篮球乃团队之艺,协作共进,方显力
  • 2024-06-17英伟达最新发布:Nemotron-4-340B模型家族
        英伟达于2024年6月14日发布的一款开源大型语言模型(LLM)Nemotron-4340B模型家族(Nemotron-4-340B-Base(基础模型)、Nemotron-4-340B-Instruct(指令模型)、Nemotron-4-340B-Reward(奖励模型)),具有3400亿参数,在NVIDIA开放模型许可协议下开放访问,允许分发、修改和使用这些模型