llama

2025-01-04免费使用 Cursor ，且生成质量不降低的技巧
免费使用Cursor，用其他大模型替代Cursor，且生成质量不降低的技巧如下：————第一步，使用免费的API，比如OpenRouterAI提供的免费模型：1️⃣meta-llama/llama-3.1-405b-instruct:free2️⃣meta-llama/llama-3.2-90b-vision-instruct:free3️⃣meta-llama/llama-3.1-70b-instruc
2024-12-29Llama系列关键知识总结
系列文章目录第一章：LoRA微调系列笔记第二章：Llama系列关键知识总结文章目录系列文章目录Llama:OpenandEfficientFoundationLanguageModels关键要点LLaMa模型架构：Llama2分组查询注意力(GQA)Llama3关键信息引用：Llama:OpenandEfficientFoundationLang
2024-12-27Amazon Bedrock 实践 - 利用 Llama 3.2 模型分析全球糖尿病趋势
黄浩文资深开发者布道师亚马逊云科技拥有电信、互联网以及云计算等行业超过20年的丰富经验，曾任职于微软、Sun和中国电信。他目前专注于生成式AI、大型语言模型(LLM)、机器学习和数据科学等领域的技术内容创作和实践分享，致力于赋能全球开发者。本博客内容原文来自于作者
2024-12-25为什么 Llama 3.3 70B 比 GPT-4o 和 Claude 3.5 Sonnet 更优秀
过去七天的AI新闻如狂风暴雨般涌来，AI世界发生了许多重大变化。在这篇文章中，我们将深入探讨来自Llama3.370B、GPT-4o和Claude3.5Sonnet等主要参与者的最新AI动态。12月7日，Meta将发布其年度最后一个AI模型。而就在昨天（12月6日），Meta发布了拥有700亿参数的
2024-12-24Windows 系统下本地部署 LLaMA-Factory 成功
Windows系统下本地部署LLaMA-Factory成功1.本地部署LLaMA-Factory2.下载模型3.微调模型3-1.下载数据集3-2.配置参数3-3.启动微调3-4.模型评估3-5.模型对话1.本地部署LLaMA-Factory下载代码，gitclonehttps://github.com/hiyouga/LLaMA-F
2024-12-23Llama 3.2 900亿参数视觉多模态大模型本地部署及案例展示
Llama3.2900亿参数视觉多模态大模型本地部署及案例展示本文将介绍如何在本地部署Llama3.290B（900亿参数）视觉多模态大模型，并开发一些UseCase，展示其强大的视觉理解能力。Llama3.2介绍今年9月，Meta公司发布了Llama3.2版本，包括11B和90B的中小型视觉大语言模型，适用于边缘计
2024-12-22llama.cpp：Android端测试 MobileVLM -- Android端手机部署图生文大模型
llama.cpp：Android端测试MobileVLM1.环境需要2.构建项目3.Android测试1.环境需要以下是经实验验证可行的环境参考，也可尝试其他版本。（1）PC：Ubuntu22.04.4（2）硬件设备：Android手机（3）软件环境：如下表所示工具版本安装Anaconda2021.05参考：Anaconda3安装及使用cmake3.26.
2024-12-20自己搭建专属AI：Llama大模型私有化部署
前言AI新时代，提高了生产力且能帮助用户快速解答问题，现在用的比较多的是Openai、Claude，为了保证个人隐私数据，所以尝试本地（MacM3）搭建Llama模型进行沟通。Gpt4all安装比较简单，根据 https://github.com/nomic-ai/gpt4all 下载客户端软件即可，打开是这样的：然后选择并下载模型文
2024-12-18LLaMA (以LLaMA2为例，文末附加对比1 2 3 三个版本的变化）
一、背景LLaMA2和LLaMA2-Chat参数规模：70亿、130亿和700亿数据和训练规模：上下文长度训练资源性能表现：二、预训练pretraining1.预训练数据·训练语料来自公开课用的数据源，不包括Meta的产品或服务数据·在2万亿个数据tokens上进行了训练·对真实的数据源进行上采
2024-12-15使用Llama-3.2-1B遇到的bug
背景在使用Llama-3.2-1B时遇到一个关于pad_tokens经验不足的bug。没有指定pad_token的时候分词器会报错，这个使用有以下两种解决策略：配一个新的token。tokenizer.add_special_tokens({'pad_token':'[PAD]'})model.resize_token_embeddings(len(tokenizer))#如果添加了新
2024-12-14使用LLaMA-Factory对LLM大模型进行微调！训练专属于你的模型！
前言如今也是出现了各种各样的大模型，如果想要针对性的让他扮演某个角色我们通常采用的是给他输入prompt（提示词）。但是如果遇到一些"思想钢印"较深的大模型，使用提示词洗脑可能效果并不好。那我们有没有其他方法来解决这个问题？当然有，那就是自行微调一个大模型！本篇文章，就带
2024-12-14使用从HuggingFace上下载Llama模型
背景这里记录一下从HuggingFace上下载Llama模型的流程，方便后续使用。注册账号目前Llama的模型是需要提交申请才可以使用，因此需要先注册HuggingFace的账号。这里有两点需要注意。用户名会用来登录：用户名会用作后续下载模型使用，因此需要使用一个自己方便记忆的名称。用户名修
2024-12-11Unsloth更快训练大模型并导出GGUF - Windows
环境搭建系统环境需要Nvidia显卡，至少8G显存，且专用显存与共享显存之和大于20G建议将非安装版的环境文件都放到非系统盘，方便重装或移植以Windows11为例，非安装环境文件都放在E盘下设置自定义Path文件夹创建E:\mypath文件夹，将其添加进用户环境变量Path中，之后会用CMake下载
2024-12-06人工智能大模型培训讲师叶梓:Llama Factory 微调模型实战分享提纲
LLaMA-Factory——一个高效、易用的大模型训练与微调平台。它支持多种预训练模型，并且提供了丰富的训练算法，包括增量预训练、多模态指令监督微调、奖励模型训练等。LLaMA-Factory的优势在于其简单易用的界面和强大的功能。用户可以在不编写任何代码的情况下，在本地完成上百种预
2024-12-01从零开始的 CPT (Continual Pre-Training): 摆脱复杂的训练框架
由于要解决一些业务问题，需要将领域知识喂给大模型。之前只做过简单的finetuning（在GLM的框架上跑了一些lora，数据量也不大），但是现在要将整个细分工业领域的相关数据都收集起来训练，规模上比之前半手动构造的微调数据集要大了很多，调研了一圈，更适合在pre-train阶段去做训练。尝试
2024-12-01大语言模型---Llama不同系列的权重参数文件提取；Llama-7B权重文件提取；Llama-8B权重文件提取；主要代码功能解析
文章目录1.概要2.Llama-7B权重文件提取3.Llama-8B权重文件提取4.主要代码功能解析1.概要Llama系列模型（Meta发布的大语言模型）在开源社区广受欢迎，不同版本（前文已经介绍过7B和8B的区别，详情请点击链接）在应用场景和硬件需求上各有不同，其权重文件的提取方式也略有差
2024-11-30大语言模型（1）--LLaMA
LLaMA（LargeLanguageModelMetaAI）是由MetaAI于2023年2月发布的大语言系列模型，它应该是近两年来影响力最大的自然语言处理大模型。在它的带动下，雨后春笋般地涌现出来不同语言、不同领域下的各种大模型。值得注意的是，最早Meta在非商业许可的情况下发布了LLaMA的模型权重，仅
2024-11-30AI模型的开放与封闭：一场不断演化的博弈
AI模型的开放与封闭：一场不断演化的博弈黑智2024年11月18日17:17北京图片来源｜TIME编译｜杨雪涵目前，像ChatGPT和Claude这样的顶尖AI模型通常伴随着严格的使用限制。它们的开发者对模型的访问方式进行了严格控制，以防止其被滥用。与之形成鲜明对比的是，开放模型则允许任何
2024-11-29Llamaindex中的聊天记录存储和记忆memory使用教程
聊天存储（ChatStore）聊天存储（ChatStore）作为一个集中的接口，用于存储您的聊天记录。聊天历史与其他存储格式相比具有独特性，因为消息的顺序对于维持整个对话非常重要。聊天存储可以通过键（如用户ID或其他唯一标识字符串）来组织一系列的聊天消息，并处理删除、插入和获取等操作。
2024-11-29使用ROCm在AMD GPU上进行Llama 3.2视觉LLMs推理
InferencewithLlama3.2VisionLLMsonAMDGPUsUsingROCm—ROCmBlogsMeta的Llama模型现在支持多模态功能，扩展了其在传统文本应用之外的应用范围。Llama3.2模型有多种尺寸，包括用于视觉-文本推理任务的中型11B和90B多模态模型，以及为边缘和移动设备设计的轻量级1B和3B
2024-11-25介绍 GGUF-my-LoRA
随着llama.cpp对LoRA支持的重构，现在可以将任意PEFTLoRA适配器转换为GGUF，并与GGUF基础模型一起加载运行。为简化流程，我们新增了一个名为GGUF-my-LoRA的平台。什么是LoRA？LoRA（Low-RankAdaptation，低秩适配）是一种用于高效微调大型语言模型的机器学习技术。可以将LoR
2024-12-11中国网络空间安全协会发布用于大模型的首批中文基础语料库
中文基础语料库页面截图。澎湃新闻从中国网络空间安全协会获悉，12月20日，中国网络空间安全协会人工智能安全治理专业委员会在北京发布了用于大模型的首批中文基础语料库。中国网络空间安全协会相关负责人介绍，在中央网信办相关业务部门指导下，网安协会人工智能安全治理专委会会
2024-12-10在Windows环境下的rknn-toolkit环境搭建
首先安装好conda，我是用的是anaconda，miniconda也可以。下载rknn_toolkit的轮子。可以直接在瑞芯微的git仓库中下载，地址为：github.com/rockchip-linux/rknn-toolkit/releases。我这里下载的是1.7.5版本的。选择rknn-toolkit-v1.7.5-packages.zip下载，之后解压，pipinstallrknn_t
2024-12-09Redisson分布式锁如何实现可重入
Redisson分布式锁如何实现可重入本篇将从源码的角度去讲解Redisson分布式锁如何实现可重入的我们都知道Redisson的分布式锁比起我们自己用Redis实现的分布式锁有许多优点：可重入可重试超时续约当我们使用Redisson去获取一个分布式锁的时候，大致的代码如下：@Autowiredp
2024-12-06博物馆导览系统方案（一）背景需求分析与核心技术实现
维小帮提供多个场所的室内外导航导览方案，如需获取博物馆导览系统解决方案可前往文章最下方获取，如有项目合作及技术交流欢迎私信我们哦~撒花！一、博物馆导览系统的背景与市场需求在数字化转型的浪潮中，博物馆作为文化传承和知识传播的重要场所，正经历着深刻的变革。传统的静态