首页 > 编程语言 >机器学习笔记 使用Python从头开始​​构建百万参数LLaMA

机器学习笔记 使用Python从头开始​​构建百万参数LLaMA

时间:2024-04-08 20:03:54浏览次数:17  
标签:从头开始 Transformer 架构 Python 模型 AI gemini LLaMA

一、LLaMA架构

        LLaMA (Large Language Model Meta AI) 是一个基础语言模型的集合,参数范围从 7B 到 65B,LLaMA并非专门为对话任务而设计的模型,而是专注于语言理解和生成。但是作为基础模型,LLaMA 被设计为多功能的,可以应用于许多不同的用例,而不是为特定任务设计的微调模型。换句话说,你可以训练自己的基础模型,在这个基础上为其他任务(比如对话)继续进行微调。

        它基于Transformer架构,被发表完并随后提出了各种改进。据 Meta 称,自模型发布以来,开源 AI 社区已在Hugging Face平台上微调并发布了 7000 多个 LLaMA 衍生品。

        下面是 vanilla Transformer 和 LLaMA 的对比图。

        好像Google的gemini使用的也是LLaMA 架构(gemini自己说的),LLaMA 模型的 137B 参数版本,基于 Google AI 的 LLaMA 模型构建,该模型使用了一种称为“masked language modeling”的训练目标

标签:从头开始,Transformer,架构,Python,模型,AI,gemini,LLaMA
From: https://blog.csdn.net/bashendixie5/article/details/137401504

相关文章

  • python基础语法
    注:本文中不含有环境配置与安装,创建工程等步骤。环境为python3.8、pycharm2020;python默认的编码格式是ASCII格式;需要使用#-*-coding:UTF-8才能读取中文。1、注释        采用 #(单行)或者三引号进行注释(多行)#单行注释'''Python中单引号'和双引号"使......
  • Python向文件里写入数据
    直接上代码name="测试"data=name.encode("utf-8")#w特点:文件不存在则创建文件并在打开前清空f=open("db.txt",mode="wb")f.write(data)f.close()可以在db.txt文件里看到一句话测试name="Testing"data=name.encode("utf-8&quo......
  • 原子核四极形变的 python 可视化
    把原子核当作液滴,讨论较小的形变,经过一系列处理,可以用公式处理:\[R=R_0\left\{1+\beta\sqrt{\frac{5}{16\pi}}(\cos\gamma(3\cos^2\theta-1)+\sqrt{3}\sin\gamma\sin^2\theta\cos2\phi)\right\}.\]importnumpyasnpimportmatplotlib.pyplotaspltfromscipyi......
  • 任务处理【华为OD机试】(JAVA&Python&C++&JS题解)
    一.题目-任务处理在某个项目中有多个任务(用tasks数组表示)需要您进行处理,其中tasks[i]=[si,ei],你可以在si<=day<=ei中的任意一天处理该任务。请返回你可以处理的最大任务数。注:一天可以完成一个任务的处理。输入描述:第一行为任务数量n,1<=n<=100000。后......
  • 跳马【华为OD机试】(JAVA&Python&C++&JS题解)
    一.题目马是象棋(包括中国象棋和国际象棋)中的棋子,走法是每步直一格再斜一格,即先横着或直着走一格,然后再斜着走一个对角线,可进可退,可越过河界,俗称“马走‘日’字。给顶m行n列的棋盘(网格图),棋盘上只有有棋子象棋中的棋子“马”,并且每个棋子有等级之分,等级为k的马可以跳1~k......
  • python高级脚本
    python高级脚本自动化测试脚本importunittestclassTestCalculator(unittest.TestCase):deftest_addition(self):self.assertEqual(2+2,4)deftest_subtraction(self):self.assertEqual(5-3,1)if__name__=="__main__":un......
  • Python元组tuple
    一、元组定义元组tuple像是一个列表list,它内部的值不可被修改。元组是一个有序的、不可变数据结构/类型列表->元组  加锁过程元组->列表  解锁过程列表和元组对比listtuple声明[]()索引YESYES切片YESYES追加元素YESNO修改元素YESNO删......
  • python获取指定视频分辨率并移动到相应的文件夹中-2
    importosimportshutilfrommoviepy.editorimportVideoFileClip#获取所有文件defgetAllFiles(fire_dir,houzui=".mp4"):filepath_list=[]forroot,folder_names,file_namesinos.walk(fire_dir):forfile_nameinfile_names:......
  • python获取指定视频分辨率并移动到相应的文件夹中
    importosimportshutilfrommoviepy.editorimportVideoFileClip#获取所有文件defgetAllFiles(fire_dir):filepath_list=[]forroot,folder_names,file_namesinos.walk(fire_dir):forfile_nameinfile_names:file_path=root+os......
  • python下载包过慢 pip 设置镜像
    通过修改配置文件Windows上的配置方式:打开pip.ini文件,通常位于C:\Users\YourUsername\pip\pip.ini,如果文件不存在可以创建它。在pip.ini文件中添加以下内容:[global]index-url=https://pypi.tuna.tsinghua.edu.cn/simpleLinux/macOS上的配置方式:打开或创建~/.pi......