首页 > 其他分享 >GGUF大模型文件格式

GGUF大模型文件格式

时间:2024-09-14 16:14:41浏览次数:11  
标签:训练 二进制 模型 GGUF 文件格式 格式

GGUF大模型文件格式

https://www.datalearner.com/blog/1051705718835586

 

大语言模型的开发通常使用PyTorch等框架,其预训练结果通常也会保存为相应的二进制格式,如pt后缀的文件通常就是PyTorch框架保存的二进制预训练结果。

但是,大模型的存储一个很重要的问题是它的模型文件巨大,而模型的结构、参数等也会影响模型的推理效果和性能。为了让大模型更加高效的存储和交换,就有了不同格式的大模型文件。其中,GGUF就是非常重要的一种大模型文件格式。

GGUF文件全称是GPT-Generated Unified Format,是由Georgi Gerganov定义发布的一种大模型文件格式。Georgi Gerganov是著名开源项目llama.cpp的创始人。

GGUF就是一种二进制格式文件的规范,原始的大模型预训练结果经过转换后变成GGUF格式可以更快地被载入使用,也会消耗更低的资源。原因在于GGUF采用了多种技术来保存大模型预训练结果,包括采用紧凑的二进制编码格式、优化的数据结构、内存映射等。

综上所述,GGUF可以理解为一种格式定义,采用相应的工具将原始模型预训练结果转换成GGUF之后可以更加高效的使用。

llama.cpp官方提供了转换脚本,可以将pt格式的预训练结果以及safetensors模型文件转换成GGUF格式的文件。转换的时候也可以选择量化参数,降低模型的资源消耗。这个过程性能损失很低!

 

标签:训练,二进制,模型,GGUF,文件格式,格式
From: https://www.cnblogs.com/lightsong/p/18414244

相关文章

  • 实现 Excel 文件导入到向量数据库(Milvus),并支持 先查询知识库(Milvus),然后再查询大模型(Ol
    为了实现Excel文件导入到向量数据库(Milvus),并支持先查询知识库(Milvus),然后再查询大模型(Ollama)的功能,以下是具体的实现步骤:1.导入Excel数据到向量数据库(Milvus)首先,您需要将Excel文件中的数据向量化,并将这些向量导入到Milvus数据库中。可以使用pandas读取Excel文件,使用......
  • 建立“二分查找”的通用模型
    案例[5,7,7,8,8,10]返回非递减数组中第一个≥8的数的位置,如果所有数都<8,返回数组长度暴力做法:遍历每个数,询问是否≥8?时间复杂度O(n)二分查找的模型红蓝染色法:约定如下≥target表示在target右侧标记为蓝色<target表示在target左侧标记为红色1.左闭右闭f......
  • 代数模型(Algebraic Models)---线性规划------+ 案例 + Python源码求解(见文中)
    目录一、代数模型(AlgebraicModels)详解1.1什么是代数模型?1.2代数模型的基本形式1.3安装所需要的Python包--运行下述案例1.4代数模型的应用案例案例1:市场供需平衡模型Python求解代码Python求解结果如下图:案例2:运输问题中的线性规划模型进行数学建模分析1.目标函数2.......
  • 几何概率模型
    一、几何概率模型①样本空间的样本点为无限个②每个样本点发生的可能性是均等的③P(A)=事件A的几何度量值/样本空间的几何度量值说明:如果样本空间的样本点为有限个,则为古典概型通过2个例子,来感受下两者的区别①例:在[1,4]区间内,任意取一个整数,求该整数<2的概率设:事件A为整数<2第1......
  • 大语言模型(LLM)入门学习路线图
    Github项目上有一个大语言模型学习路线笔记,它全面涵盖了大语言模型的所需的基础知识学习,LLM前沿算法和架构,以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份资料重点介绍了我们应该掌握哪些核......
  • AI跟踪报道第56期-新加坡内哥谈技术-本周AI新闻: 划时代 Open AI 新模型系统2思维推理
      每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行!订阅:https://......
  • Flux.1 的专属提示词增强模型来啦!不用费脑,一键扩写提示词!
    编写提示词对于听雨来说一直是一个比较费脑子的事情,下班以后的闲暇时间本就不多,还要费脑子在提示词上,让本就不够富裕的脑子更加不堪重负!所以听雨对于提示词相关的插件都是蛮感兴趣的,毕竟可以让一天紧张工作疲惫不堪的脑子偷个懒,何乐而不为嘞!之前听雨也介绍了一款随机提示词插......
  • Hume AI 推出 EVI 2 情感模型;OpenAI o1 模型问世,模拟人类思考问题 丨 RTE 开发者日报
       开发者朋友们大家好: 这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。 我们的社区编辑团队会整理分享RTE(Real-TimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个......
  • 专业角度深入讲解:大模型备案(生成式人工智能)
    一、什么是大模型备案?大模型备案是指大模型产品在向公众开放及商用之前,经过国家互联网信息办公室(简称“网信办”)等监管部门的备案审批过程。 是为加强生成式人工智能服务的合规管理,通过备案制度,促进人工智能技术的健康发展,建立起一个既安全又可靠的人工智能服务体系,为公众提供高......
  • 开源模型应用落地-qwen2-7b-instruct-LoRA微调-unsloth(让微调起飞)-单机单卡-V100(十七)
    一、前言  本篇文章将在v100单卡服务器上,使用unsloth去高效微调QWen2系列模型,通过阅读本文,您将能够更好地掌握这些关键技术,理解其中的关键技术要点,并应用于自己的项目中。  使用unsloth能够使模型的微调速度提高2-5倍。在处理大规模数据或对时间要求较高的场景下......