llama2

2024-09-22【面试经验】商汤NLP一面
整体不到1h前20min讲了一个项目，没太详细问。然后八股：Llama2架构(embedding,transformerblock,LMhead)Llama2transformerblock里做了哪些改变(RMSNorm,RoPE,SwiGLU,PreNorm不太清楚说全了没)为什么用RMSNorm不用LayerNorm(答参数量少，不太对)为什么用RoPE不用绝
2024-09-09LLM面试题汇总
LLM相关LLM基础zeroshot、oneshot、threeshot是什么zeroshot:零样本学习。对于模型没有见过的图像，通过已有的图像和特征相关联，从而判别新的图片fewshot:少样本学习。通过判断测试样本与训练样本的相似性，来推测测试样本属于什么类bf16和fp16有什么区别LLM微
2024-08-13本地通过python运行AI大语言模型LLaMa2
什么是Llama2Llama全称largelanguagemodel, MetaAI公司2023年发布的开源AI大型语言模型，参数7B~65B。最新版本为Llama3。更为详细的介绍可参考，LLaMA-维基百科，自由的百科全书(wikipedia.org)。什么是llama.cpp?一个开源c++库，用c++重写了LLaMa的推理代码，可用于加载
2024-07-25一文看懂llama2（原理&模型&训练）
关注我，持续分享逻辑思维&管理思维&面试题；可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导；推荐专栏《10天学会使用asp.net编程AI大模型》，目前已完成所有内容。一顿烧烤不到的费用，让人能紧跟时代的浪潮。从普通网站，到公众号、小程序，再到AI大模型网站。干货满满。学成后可
2024-07-13Llama2大语言模型在云GPU（AutoDL）上进行训练微调（自定义数据集）
Llama2是Meta开源的语言大模型，它经过训练的数据集包含2万亿个token。相比Llama，Llama2的上下文长度已经从2048扩展到4096，这使其能够理解和生成更长的文本。Llama2包括了多个模型，分别是7B、13B和70B的模型。一、准备工作在autodl平台租用实例（直接搜索，有许多租用教程，建议租
2024-07-04一文为你深度解析LLaMA2模型架构
本文分享自华为云社区《【云驻共创】昇思MindSpore技术公开课大咖深度解析LLaMA2模型架构》，作者：Freedom123。一、前言随着人工智能技术的不断发展，自然语言处理（NLP）领域也取得了巨大的进步。在这个领域中，LLaMA展示了令人瞩目的性能。今天我们就来学习LLaMA2模型，我们根据昇思M
2024-06-14Llama2的安装部署运行Atom模型的操作步骤
一、Llama2的安装部署操作步骤1.1、docker环境的使用说明：根据服务器部署的环境来分析，由于此服务器为多人使用，且不相互影响，故此服务器需要进行自己的docker环境下，如果是自己部署那么本身便不存在docker直接滤过1.1即可。1.1.1、启用docker环境服务器环境执行dockerrun-i
2024-06-08一文看懂llama2（原理&模型&训练）
自从Transformer架构问世以来，大型语言模型（LargeLanguageModels,LLMs）以及AIGC技术的发展速度惊人，它们不仅在技术层面取得了重大突破，还在商业应用、社会影响等多个层面展现出巨大潜力。随着ChatGPT的推出，这一技术日益走进大众视野，这也预示着一个由生成式AI塑造的未来正在加速
2024-04-09通过termux tailscale huggingface 来手把手一步一步在手机上部署LLAMA2-7b和LLAMA2-70b大模型
前言首先截图一下我的小米手机的配置我这个配置其实一般，当时主要为了存储空间大，而我对配置要求又不高，买的。在手机上安装termuxapp,然后在termux上就可以使用各种命令进行安装和使用，就像在linux操作系统上一样了。再通过termux安装上openssh,这样你就可以在window、mac等电
2024-04-01基于Linux系统的Llama2模型部署与运行
一、安装Linux系统（Ubuntu20.04）略。二、安装Nvidia-docker参考：nvidia-docker安装三、环境配置3.1拉取镜像在终端通过docker拉取一个Python版本为3.10的镜像。sudodockerpullpython:3.103.2在容器中的操作1、运行容器sudodockerrunit--name容器名python:3.
2024-03-31llama2+localGPT打造纯私有知识助手
通过部署llama2系列，可以构建本地私有的知识小助手用来输出一写周报、月报，甚至辅助数据分析都可以（想想都很轻松）想要大模型支持特定的数据集，就需要进行专业的fine-turing但是fine-turing工作，是需要一系列的数据工程，向量化等工作，不太便捷PromtEngineer/localGPT把这些工作就包
2024-03-25Elasticsearch：使用在本地计算机上运行的 LLM 以及 Ollama 和 Langchain 构建 RAG 应用程序
无需GPU的隐私保护LLM。在本博客中，我将演示使用不同的工具Ollama构建的RAG应用程序。与本文相关的所有源代码均已发布在github上。请克隆存储库以跟随文章操作。我们可以通过如下的方式来克隆：gitclonehttps://github.com/liu-xiao-guo/ollama_es什么是 Ollam
2024-03-24大语言模型资料汇总
社区/模型下载ModelScope魔搭社区HuggingFace微调https://github.com/modelscope/swifthttps://github.com/hiyouga/LLaMA-Factoryhttps://huggingface.co/docs/peft/index模型部署https://github.com/xorbitsai/inference模型分发https://github.com/songquanpeng/on
2024-03-15在Windows电脑上本地部署Llama2大型语言模型
在Windows电脑上本地部署Llama2大型语言模型需要一系列具体的步骤。下面，我将详细指导你完成这个过程，并附上相关链接和具体的输入代码或命令行。一、准备环境安装Python：首先，确保你的Windows电脑上已经安装了Python。你可以从Python的官方网站（https://www.python.org/downl
2024-03-04运行模型对比 gemma:7b, llama2, mistral, qwen:7b
【gemma:2b】totalduration:1m5.2381509sloadduration:530.9µspromptevalduration:110.304mspromptevalrate:0.00tokens/sevalcount:604token(s)evalduration:1m5.126287sevalrate:9.27tokens/s 【gemma:7b】t
2024-01-30llama-recipes fine-tuning 3
multipleGPUsinsinglenodeclicktoviewthecodetorchrun--nnodes1--nproc_per_node2examples/finetuning.py--enable_fsdp--use_peft--peft_methodlora--datasetmedcqa_dataset--model_namemeta-llama/Llama-2-7b-hf--fsdp_config.pure_bf16--output
2023-12-20国产670亿参数的DeepSeek：超越Llama2，全面开源
模型概述DeepSeek，一款国产大型语言模型（LLM），凭借其670亿参数的规模，正引领着人工智能领域的新浪潮。这款模型不仅在多项中英文公开评测榜单上超越了700亿参数的Llama2，而且在推理、数学和编程能力方面表现突出。最引人注目的是，DeepSeek在匈牙利最新高中数学考试中获得了65分的高分，显示
2023-12-10使用双卡/8卡3090微调llama2-70B/13B模型
写在前面本篇博文将会教大家如何在消费级的设备（或者各种超级便宜的洋垃圾上）实现13B/70B等无法在单张消费级显卡上加载（但可以在一台机器上的多张卡上加载）的模型的微调。由于绝大部分做实验，仅要求实现推理，或者在微调时没有资源上到全量/13B+级别的真·大模型的微调，没有涉及到将一
2023-12-08使用8卡3090微调llama2-70B模型
写在前面很多问题尚未弄清，还在进一步调整目前已知我用8卡的3090采用deepspeedZeRO3进行运行，下面是deepspeed3的配置1{2"fp16":{3"enabled":"auto",4"loss_scale":0,5"loss_scale_window":1000,6
2023-11-29medical custom dataset for fine-tuning llama2
datapreparationweusehuggingfaceshibin6624/medical tofine-tuningllama2,pleasenotethatthisdatasetisconsistofenandcndata,herewejustuseendata.datasetstructure nowwedownloadandloaddataset,thensavethemintotrain.csv,valida
2023-11-26快速上手llama2.c
title:快速上手llama2.cbanner_img:https://github.com/karpathy/llama2.c/blob/master/assets/llama_cute.jpgdate:2023-7-2516:19:00tags:-踩坑快速上手llama2.cllama2.c一个完整的解决方案，可以使用PyTorch从头开始训练的Llama2LLM（LightweightLanguageModel）模型
2023-11-26快速上手llama2.c(更新版)
title:快速上手llama2.c(更新版)banner_img:https://github.com/karpathy/llama2.c/blob/master/assets/llama_cute.jpgdate:2023-7-2816:31:00tags:-踩坑快速上手llama2.c(更新版)在上一次我同时在我的博客和知乎发布了快速上手llama2.c之后，我一个小透明也收获了不
2023-11-23全新Self-RAG框架亮相，自适应检索增强助力超越ChatGPT与Llama2，提升事实性与引用准确性
全新Self-RAG框架亮相，自适应检索增强助力超越ChatGPT与Llama2，提升事实性与引用准确性1.基本思想大型语言模型（LLMs）具有出色的能力，但由于完全依赖其内部的参数化知识，它们经常产生包含事实错误的回答，尤其在长尾知识中。为了解决这一问题，之前的研究人员提出了检索增强生成（RAG），它通
2023-11-09通义千问, 文心一言, ChatGLM, GPT-4, Llama2, DevOps 能力评测
引言“克隆dev环境到test环境，等所有服务运行正常之后，把访问地址告诉我”，“检查所有项目，告诉我有哪些服务不正常，给出异常原因和修复建议”，在过去的工程师生涯中，也曾幻想过能够通过这样的自然语言指令来完成运维任务，如今AI助手Appilot利用LLM蕴藏的神奇力量，将这一切变成了
2023-11-09通义千问, 文心一言, ChatGLM, GPT-4, Llama2, DevOps 能力评测
引言“克隆dev环境到test环境，等所有服务运行正常之后，把访问地址告诉我”，“检查所有项目，告诉我有哪些服务不正常，给出异常原因和修复建议”，在过去的工程师生涯中，也曾幻想过能够通过这样的自然语言指令来完成运维任务，如今AI助手Appilot利用LLM蕴藏的神奇力量，将这一切变成