Llama

2024-11-19Ziya-LLaMA-13B 模型在GPU 上部署
Ziya-LLaMA-13B模型在GPU上部署Ziya-LLaMA-13B是IDEA-CCNL基于LLaMa的130亿参数的大规模预训练模型，具备翻译，编程，文本分类，信息抽取，摘要，文案生成，常识问答和数学计算等能力。目前姜子牙通用大模型已完成大规模预训练、多任务有监督微调和人类反馈学习三阶段的训练过程。1.部署
2024-11-19【最全整理】大模型基本技术
0开始之前=========本文从Llama3报告出发，基本整理一些现代LLM的技术。‘基本’，是说对一些具体细节不会过于详尽，而是希望得到一篇相对全面，包括预训练，后训练，推理，又能介绍清楚一些具体技术，例如RM，DPO，KVCache，GQA，PagedAttention，DataParallelism等等的索引向文章。由于东西比
2024-11-17书生大模型实训营第4期基础岛第四关：InternLM + LlamaIndex RAG 实践
书生大模型实训营第4期基础岛第四关：InternLM+LlamaIndexRAG实践1.什么是RAG？2.LlamaIndex+InternLMAPI实践2.1LlamaIndex的简单介绍2.2LlamaIndex+InternLMAPI实践2.2.1开发机环境配置2.2.2下载SentenceTransformer模型2.2.3下载NLTK相关资源2.3是
2024-11-1451c大模型~合集43
我自己的原文哦~ https://blog.51cto.com/whaosoft/11870499#PanoSent情感分析的终极形态：全景式细粒度多模态对话情感分析基准罗盟，本工作的第一作者。新加坡国立大学（NUS）人工智能专业准博士生，本科毕业于武汉大学。主要研究方向为多模态大语言模型和SocialAI、Human-ecce
2024-11-14LLM - 计算多模态大语言模型的参数量(Qwen2-VL、Llama-3.1) 教程
欢迎关注我的CSDN：https://spike.blog.csdn.net/本文地址：https://spike.blog.csdn.net/article/details/143749468免责声明：本文来源于个人知识与公开资料，仅用于学术交流，欢迎讨论，不支持转载。影响(多模态)大语言模型参数量的主要网络模块，即Linear、Embedding、Norm(
2024-11-14丹摩征文活动｜Llama 3.1 开源模型快速部署：从零到上线
文章目录一、Llama3.1系列的演进与发展历程二、大型语言模型的力量：Llama3.1405B三、Llama3.1405B部署教程四、Llama3.1在客户服务中的运用一、Llama3.1系列的演进与发展历程自开源LLM（大语言模型）兴起以来，Meta公司凭借其Llama系列逐步在全球AI领域占据重
2024-11-13一文学会，利用LLaMA 3.2打造能“识图断字”的个人AI助理
人工智能最直接也是最普及的应用之一肯定是聊天机器人，或者叫个人AI助理。尽管聊天机器人以各种形式存在了30年，但在过去两年中，这些个人AI助理才真正成为热门应用。它们已经从前沿技术范畴落地到生活的各个方面、社交场合和商业场景中。虽然它们接入门槛低且易于使用，你打开
2024-11-12LlamaIndex 中全局配置Settings的设置使用
Settings是在LlamaIndex工作流/应用程序的索引和查询阶段使用的一组常用资源。您可以使用它来设置全局配置。局部配置（转换、llm、嵌入模型）可以直接传递到使用它们的接口中。Settings是一个简单的单例对象，存在于整个应用程序中。每当没有提供特定组件时，就使用Settings对象
2024-11-0951c大模型~合集20
我自己的原文哦~ https://blog.51cto.com/whaosoft/11634780#Transformer大模型尺寸变化大模型尺寸正在重走CNN的老路；马斯克：在特斯拉也是这样, Transformer大模型尺寸变化，正在重走CNN的老路！ Transformer大模型尺寸变化，正在重走CNN的老路！看到大家都被LLaMA3.1吸引了注
2024-11-09大模型面试题：LLAMA中的FFN层作用是什么？
更多面试题的获取方式请留意我的昵称或看评论区LLAMA中的FFN层作用是什么？总结上网上看到的一些分析，毕竟当时Transformer提出来的时候，可能也没考虑到会被研究的这么细。模型结构本身[AttentionisNotAllYouNeed:PureAttentionLosesRankDoublyExponentiallywit
2024-11-08Me-LLaMA——用于医疗领域的新型开源大规模语言模型
摘要大规模语言模型的出现是提高病人护理质量和临床操作效率的一个重大突破。大规模语言模型拥有数百亿个参数，通过海量文本数据训练而成，能够生成类似人类的反应并执行复杂的任务。这在改进临床文档、提高诊断准确性和管理病人护理方面显示出巨大的潜力。然而，像ChatGPT和
2024-11-07大模型-大模型推理部署-08
目录大模型常见推理框架：Transformers、Llama.cpp、Llamafile、Ollama、vLLM、TGI（TextGenerationInference)、DeepSpeed。vLLM，deepspeed是重点HuggingFace的Transformers强大的Python库，专为简化本地运行LLM而设计。其优势在于自动模型下载、提供丰富的代码片段，以及非常适合
2024-11-07制作并量化GGUF模型上传到HuggingFace和ModelScope
llama.cpp是Ollama、LMStudio和其他很多热门项目的底层实现，也是GPUStack所支持的推理引擎之一，它提供了GGUF模型文件格式。GGUF(GeneralGaussianU-NetFormat)是一种用于存储模型以进行推理的文件格式，旨在针对推理进行优化，可以快速加载和运行模型。llama.cpp还支持量
2024-11-07制作并量化GGUF模型上传到HuggingFace和ModelScope
llama.cpp是Ollama、LMStudio和其他很多热门项目的底层实现，也是GPUStack所支持的推理引擎之一，它提供了GGUF模型文件格式。GGUF(GeneralGaussianU-NetFormat)是一种用于存储模型以进行推理的文件格式，旨在针对推理进行优化，可以快速加载和运行模型。llama.cpp还支持量
2024-11-05这么多优秀的 AI 大模型，我应该选择哪个呢？
前两次，我们向大家介绍了当前全球最有名的总共11个AI大模型。在此期间，openAI于8月6日最新推出另了一个超强AI大模型——GPT-4o（Aug6），强势跻入全球前列。不得不说，这才多久，openAI，谷歌，Meta等大厂对于大模型就发生了无数次的更新，每次更新，都是让人大呼哇塞！全球领先真
2024-11-02搞人工智能开源大语言模型GPT2、Llama的正确姿势
（如果想及时收到人工智能相关的知识更新，请点击关注！！）序言：目前我们每一小节的内容都讲解得非常慢，因为这是人工智能研发中的最基础知识。如果我们不能扎实掌握这些知识，将很难理解后续更复杂且实用的概念。因此，我们甚至采用一个概念一节的方式来编排内容，区分得清清楚楚、明明白白，以便
2024-11-02大模型面试题：LLAMA中的FFN层作用是什么？
获取更多面试真题的集合，请移步至 https://i.afbcs.cn/naPbNY总结上网上看到的一些分析，毕竟当时Transformer提出来的时候，可能也没考虑到会被研究的这么细。模型结构本身[AttentionisNotAllYouNeed:PureAttentionLosesRankDoublyExponentiallywithDepth]论文
2024-10-31常见大模型——LLama系列
LLaMA简介LLaMA（LargeLanguageModelMetaAI）是由Meta开发的一种大规模语言模型，旨在提高自然语言处理任务的性能。LLaMA基于Transformer机构，并经过大规模数据训练，以便在多种语言任务中表现出色。LLaMA所采用的Transformer结构和细节，与标准的Transformer结构不同的地方是包
2024-10-29llama - assistant：开启本地 AI 智能助手新时代
目录引言一、llama-assistant简介二、项目亮点三、安装与使用四、未来展望结语引言在人工智能不断发展的今天，我们迎来了一款令人瞩目的工具——llama-assistant。它就像一位智能伙伴，时刻准备着为我们提供各种帮助。想象一下，有一个智能伙伴，它能听懂你的每一句话，无论
2024-10-28LLaMa 3.1: rope_scaling 错误
原因是因为一些基本库和model不匹配了：Q：rope_scalingmustbeadictionarywithwithtwofields,nameandfactor,got{'factor':8.0,'low_freq_factor':1.0,'high_freq_factor':4.0,'original_max_position_embeddings':8192,'r
2024-10-28Meta发布了一个开源的NotebookLM
https://github.com/meta-llama/llama-recipes/tree/main/recipes/quickstart/NotebookLlama Meta的LlamaRecipes中的“NotebookLlama”提供了一系列Jupyter笔记本指导，用于将PDF转换成播客风格的音频。工作流程包括四个步骤：处理PDF、生成脚本、增强对话语气以及
2024-10-27浦语学习笔记
官方文档地址：https://github.com/InternLM/Tutorial/tree/camp4/docs/L1/LlamaIndex前置知识检索增强生成（RetrievalAugmentedGeneration，RAG）技术用于更新模型的权重，另一个就是外部的方式，给模型注入格外的上下文或者说外部信息，不改变它的的权重，相较于训练模型更易于实现。通
2024-10-27Llama 越狱探索 Llama-3.1-8B-Instruct去除限制过程
探索Llama-3.1-8B-Instruct模型的越狱过程，即解除其限制，以实现更为灵活的使用，涉及对模型的行为约束、输入输出过滤器及整体指令的定制化调整。Llama模型家族由Meta研发，通常带有一定的指令集和约束，以确保其安全、可靠地运行，尤其是在指令模型中，这些限制可能会抑制其生成内