LLaMa

2025-01-21一镜到底，通过Llama大模型架构图看透transformers原理
一镜到底，通过Llama大模型架构图看透transformers原理LlamaNutsandBolts是Github上使用Go语言从零重写Llama3.18B-Instruct模型推理过程（80亿参数规模）的实战类开源项目，其作者是来自土耳其的AdilAlperDALKIRAN。如果你对于LLM（大语言模型）和Transformers的工作原理感兴趣，并
2025-01-19基于AutoDL 进行 Llama_Factory+LoRA大模型微调
其实这个环境的搭建比较容易，但是其中出现在AutoDL上访问WebUI界面是无法访问的，对该问题查阅了一些资料并记录.1.环境的配置及其校验Step1.使用Conda创建LLaMA-Factory的python虚拟环境condacreate-nllama_factorypython==3.11创建完成后，通过如下命令进入该
2025-01-17星海智算：Llama3.2 Vision使用教程
（一）前言1、磁盘空间占用33G磁盘，预留了近67G磁盘空间以供用户使用。2、模型介绍Llama3.2-Vision多模态大型语言模型(LLM)集合是一个包含11B和90B尺寸的指令微调图像推理生成模型的集合（文本+图像输入/文本输出）。Llama3.2-Vision指令微调模型针对视觉识别
2025-01-15搭建本地日中翻译服务
下载SakuraLLM模型鉴于显存为6G，下载20241012-Qwen2.5-1.5B-v1.0模型，去https://hf-mirror.com/SakuraLLM/Sakura-1.5B-Qwen2.5-v1.0-GGUF/tree/main下载gguf文件编译llama.cpp下载llama.cpp代码包cmake-Bbuild-DGGML_CUDA=ONcmake--buildbuild--configRelease将build
2025-01-15开发者成功在Xbox 360上运行Llama语言模型，挑战老旧硬件极限
在人工智能技术快速发展的今天，如何在各种硬件上实现高效的模型推理成为了开发者们的一项重要挑战。最近，开发者AndreiDavid从一台近二十年的Xbox360游戏机中找到了灵感，他成功地将MetaAI的LlamaLLM系列中的一款轻量级模型——llama2.c移植到这台老旧的游戏机上。
2025-01-13微软正式开源超强小模型Phi-4 性能测试超越GPT-4o、Llama-3.1
微软近期在HuggingFace平台上发布了名为Phi-4的小型语言模型，这款模型的参数量仅为140亿，但在多项性能测试中表现出色，超越了众多知名模型，包括OpenAI的GPT-4o及其他同类开源模型如Qwen2.5和Llama-3.1。在之前的在美国数学竞赛AMC的测试中，Phi-4获得了91.8分，显著优
2025-01-08常见大模型——LLaMA模型
目录1.LLaMA网络模型架构2.LLaMA网络的升级迭代过程3.注意力机制 LLaMA（LargeLanguageModelMetaAI）是由Meta开发的一种大规模语言模型，旨在提高自然语言处理任务的性能。LLaMA基于Transformer机构，并经过大规模数据训练，以便在多种语言任务中表现出色。LLaMA
2025-01-04免费使用 Cursor ，且生成质量不降低的技巧
免费使用Cursor，用其他大模型替代Cursor，且生成质量不降低的技巧如下：————第一步，使用免费的API，比如OpenRouterAI提供的免费模型：1️⃣meta-llama/llama-3.1-405b-instruct:free2️⃣meta-llama/llama-3.2-90b-vision-instruct:free3️⃣meta-llama/llama-3.1-70b-instruc
2024-12-29Llama系列关键知识总结
系列文章目录第一章：LoRA微调系列笔记第二章：Llama系列关键知识总结文章目录系列文章目录Llama:OpenandEfficientFoundationLanguageModels关键要点LLaMa模型架构：Llama2分组查询注意力(GQA)Llama3关键信息引用：Llama:OpenandEfficientFoundationLang
2024-12-27Amazon Bedrock 实践 - 利用 Llama 3.2 模型分析全球糖尿病趋势
黄浩文资深开发者布道师亚马逊云科技拥有电信、互联网以及云计算等行业超过20年的丰富经验，曾任职于微软、Sun和中国电信。他目前专注于生成式AI、大型语言模型(LLM)、机器学习和数据科学等领域的技术内容创作和实践分享，致力于赋能全球开发者。本博客内容原文来自于作者
2024-12-25为什么 Llama 3.3 70B 比 GPT-4o 和 Claude 3.5 Sonnet 更优秀
过去七天的AI新闻如狂风暴雨般涌来，AI世界发生了许多重大变化。在这篇文章中，我们将深入探讨来自Llama3.370B、GPT-4o和Claude3.5Sonnet等主要参与者的最新AI动态。12月7日，Meta将发布其年度最后一个AI模型。而就在昨天（12月6日），Meta发布了拥有700亿参数的
2024-12-24Windows 系统下本地部署 LLaMA-Factory 成功
Windows系统下本地部署LLaMA-Factory成功1.本地部署LLaMA-Factory2.下载模型3.微调模型3-1.下载数据集3-2.配置参数3-3.启动微调3-4.模型评估3-5.模型对话1.本地部署LLaMA-Factory下载代码，gitclonehttps://github.com/hiyouga/LLaMA-F
2024-12-23Llama 3.2 900亿参数视觉多模态大模型本地部署及案例展示
Llama3.2900亿参数视觉多模态大模型本地部署及案例展示本文将介绍如何在本地部署Llama3.290B（900亿参数）视觉多模态大模型，并开发一些UseCase，展示其强大的视觉理解能力。Llama3.2介绍今年9月，Meta公司发布了Llama3.2版本，包括11B和90B的中小型视觉大语言模型，适用于边缘计
2024-12-22llama.cpp：Android端测试 MobileVLM -- Android端手机部署图生文大模型
llama.cpp：Android端测试MobileVLM1.环境需要2.构建项目3.Android测试1.环境需要以下是经实验验证可行的环境参考，也可尝试其他版本。（1）PC：Ubuntu22.04.4（2）硬件设备：Android手机（3）软件环境：如下表所示工具版本安装Anaconda2021.05参考：Anaconda3安装及使用cmake3.26.
2024-12-20自己搭建专属AI：Llama大模型私有化部署
前言AI新时代，提高了生产力且能帮助用户快速解答问题，现在用的比较多的是Openai、Claude，为了保证个人隐私数据，所以尝试本地（MacM3）搭建Llama模型进行沟通。Gpt4all安装比较简单，根据 https://github.com/nomic-ai/gpt4all 下载客户端软件即可，打开是这样的：然后选择并下载模型文
2024-12-18LLaMA (以LLaMA2为例，文末附加对比1 2 3 三个版本的变化）
一、背景LLaMA2和LLaMA2-Chat参数规模：70亿、130亿和700亿数据和训练规模：上下文长度训练资源性能表现：二、预训练pretraining1.预训练数据·训练语料来自公开课用的数据源，不包括Meta的产品或服务数据·在2万亿个数据tokens上进行了训练·对真实的数据源进行上采
2024-12-15使用Llama-3.2-1B遇到的bug
背景在使用Llama-3.2-1B时遇到一个关于pad_tokens经验不足的bug。没有指定pad_token的时候分词器会报错，这个使用有以下两种解决策略：配一个新的token。tokenizer.add_special_tokens({'pad_token':'[PAD]'})model.resize_token_embeddings(len(tokenizer))#如果添加了新
2024-12-14使用LLaMA-Factory对LLM大模型进行微调！训练专属于你的模型！
前言如今也是出现了各种各样的大模型，如果想要针对性的让他扮演某个角色我们通常采用的是给他输入prompt（提示词）。但是如果遇到一些"思想钢印"较深的大模型，使用提示词洗脑可能效果并不好。那我们有没有其他方法来解决这个问题？当然有，那就是自行微调一个大模型！本篇文章，就带
2024-12-14使用从HuggingFace上下载Llama模型
背景这里记录一下从HuggingFace上下载Llama模型的流程，方便后续使用。注册账号目前Llama的模型是需要提交申请才可以使用，因此需要先注册HuggingFace的账号。这里有两点需要注意。用户名会用来登录：用户名会用作后续下载模型使用，因此需要使用一个自己方便记忆的名称。用户名修
2024-12-11Unsloth更快训练大模型并导出GGUF - Windows
环境搭建系统环境需要Nvidia显卡，至少8G显存，且专用显存与共享显存之和大于20G建议将非安装版的环境文件都放到非系统盘，方便重装或移植以Windows11为例，非安装环境文件都放在E盘下设置自定义Path文件夹创建E:\mypath文件夹，将其添加进用户环境变量Path中，之后会用CMake下载
2024-12-06人工智能大模型培训讲师叶梓:Llama Factory 微调模型实战分享提纲
LLaMA-Factory——一个高效、易用的大模型训练与微调平台。它支持多种预训练模型，并且提供了丰富的训练算法，包括增量预训练、多模态指令监督微调、奖励模型训练等。LLaMA-Factory的优势在于其简单易用的界面和强大的功能。用户可以在不编写任何代码的情况下，在本地完成上百种预
2024-12-01从零开始的 CPT (Continual Pre-Training): 摆脱复杂的训练框架
由于要解决一些业务问题，需要将领域知识喂给大模型。之前只做过简单的finetuning（在GLM的框架上跑了一些lora，数据量也不大），但是现在要将整个细分工业领域的相关数据都收集起来训练，规模上比之前半手动构造的微调数据集要大了很多，调研了一圈，更适合在pre-train阶段去做训练。尝试
2024-12-01大语言模型---Llama不同系列的权重参数文件提取；Llama-7B权重文件提取；Llama-8B权重文件提取；主要代码功能解析
文章目录1.概要2.Llama-7B权重文件提取3.Llama-8B权重文件提取4.主要代码功能解析1.概要Llama系列模型（Meta发布的大语言模型）在开源社区广受欢迎，不同版本（前文已经介绍过7B和8B的区别，详情请点击链接）在应用场景和硬件需求上各有不同，其权重文件的提取方式也略有差
2024-11-30大语言模型（1）--LLaMA
LLaMA（LargeLanguageModelMetaAI）是由MetaAI于2023年2月发布的大语言系列模型，它应该是近两年来影响力最大的自然语言处理大模型。在它的带动下，雨后春笋般地涌现出来不同语言、不同领域下的各种大模型。值得注意的是，最早Meta在非商业许可的情况下发布了LLaMA的模型权重，仅
2024-11-30AI模型的开放与封闭：一场不断演化的博弈
AI模型的开放与封闭：一场不断演化的博弈黑智2024年11月18日17:17北京图片来源｜TIME编译｜杨雪涵目前，像ChatGPT和Claude这样的顶尖AI模型通常伴随着严格的使用限制。它们的开发者对模型的访问方式进行了严格控制，以防止其被滥用。与之形成鲜明对比的是，开放模型则允许任何