机器学习笔记使用Python从头开始构建百万参数LLaMA

时间：2024-04-08 20:03:54浏览次数：35

标签：从头开始 Transformer 架构 Python 模型 AI gemini LLaMA

一、LLaMA架构

LLaMA (Large Language Model Meta AI) 是一个基础语言模型的集合，参数范围从 7B 到 65B，LLaMA并非专门为对话任务而设计的模型，而是专注于语言理解和生成。但是作为基础模型，LLaMA 被设计为多功能的，可以应用于许多不同的用例，而不是为特定任务设计的微调模型。换句话说，你可以训练自己的基础模型，在这个基础上为其他任务(比如对话)继续进行微调。

它基于Transformer架构，被发表完并随后提出了各种改进。据 Meta 称，自模型发布以来，开源 AI 社区已在Hugging Face平台上微调并发布了 7000 多个 LLaMA 衍生品。

下面是 vanilla Transformer 和 LLaMA 的对比图。

好像Google的gemini使用的也是LLaMA 架构（gemini自己说的），LLaMA 模型的 137B 参数版本，基于 Google AI 的 LLaMA 模型构建，该模型使用了一种称为“masked language modeling”的训练目标

标签：从头开始,Transformer,架构,Python,模型,AI,gemini,LLaMA
From： https://blog.csdn.net/bashendixie5/article/details/137401504

python基础语法
注：本文中不含有环境配置与安装，创建工程等步骤。环境为python3.8、pycharm2020；python默认的编码格式是ASCII格式；需要使用#-*-coding:UTF-8才能读取中文。1、注释采用 #（单行）或者三引号进行注释（多行）#单行注释'''Python中单引号'和双引号"使......
Python向文件里写入数据
直接上代码name="测试"data=name.encode("utf-8")#w特点：文件不存在则创建文件并在打开前清空f=open("db.txt",mode="wb")f.write(data)f.close()可以在db.txt文件里看到一句话测试name="Testing"data=name.encode("utf-8&quo......
原子核四极形变的 python 可视化
把原子核当作液滴，讨论较小的形变，经过一系列处理，可以用公式处理：\[R=R_0\left\{1+\beta\sqrt{\frac{5}{16\pi}}(\cos\gamma(3\cos^2\theta-1)+\sqrt{3}\sin\gamma\sin^2\theta\cos2\phi)\right\}.\]importnumpyasnpimportmatplotlib.pyplotaspltfromscipyi......
任务处理【华为OD机试】(JAVA&Python&C++&JS题解)
一.题目-任务处理在某个项目中有多个任务（用tasks数组表示）需要您进行处理，其中tasks[i]=[si,ei]，你可以在si<=day<=ei中的任意一天处理该任务。请返回你可以处理的最大任务数。注：一天可以完成一个任务的处理。输入描述：第一行为任务数量n，1<=n<=100000。后......
跳马【华为OD机试】(JAVA&Python&C++&JS题解)
一.题目马是象棋(包括中国象棋和国际象棋)中的棋子，走法是每步直一格再斜一格，即先横着或直着走一格，然后再斜着走一个对角线，可进可退，可越过河界，俗称“马走‘日’字。给顶m行n列的棋盘（网格图），棋盘上只有有棋子象棋中的棋子“马”，并且每个棋子有等级之分，等级为k的马可以跳1~k......
python高级脚本
python高级脚本自动化测试脚本importunittestclassTestCalculator(unittest.TestCase):deftest_addition(self):self.assertEqual(2+2,4)deftest_subtraction(self):self.assertEqual(5-3,1)if__name__=="__main__":un......
Python元组tuple
一、元组定义元组tuple像是一个列表list，它内部的值不可被修改。元组是一个有序的、不可变数据结构/类型列表->元组加锁过程元组->列表解锁过程列表和元组对比listtuple声明[]()索引YESYES切片YESYES追加元素YESNO修改元素YESNO删......
python获取指定视频分辨率并移动到相应的文件夹中-2
importosimportshutilfrommoviepy.editorimportVideoFileClip#获取所有文件defgetAllFiles(fire_dir,houzui=".mp4"):filepath_list=[]forroot,folder_names,file_namesinos.walk(fire_dir):forfile_nameinfile_names:......
python获取指定视频分辨率并移动到相应的文件夹中
importosimportshutilfrommoviepy.editorimportVideoFileClip#获取所有文件defgetAllFiles(fire_dir):filepath_list=[]forroot,folder_names,file_namesinos.walk(fire_dir):forfile_nameinfile_names:file_path=root+os......
python下载包过慢 pip 设置镜像
通过修改配置文件Windows上的配置方式：打开pip.ini文件，通常位于C:\Users\YourUsername\pip\pip.ini，如果文件不存在可以创建它。在pip.ini文件中添加以下内容：[global]index-url=https://pypi.tuna.tsinghua.edu.cn/simpleLinux/macOS上的配置方式：打开或创建~/.pi......

机器学习笔记使用Python从头开始构建百万参数LLaMA

一、LLaMA架构

相关文章

赞助商

阅读排行

机器学习笔记 使用Python从头开始​​构建百万参数LLaMA

一、LLaMA架构

相关文章

赞助商

阅读排行

机器学习笔记使用Python从头开始构建百万参数LLaMA