首页 > 其他分享 >如何打造你的AI大模型:开源大模型指南

如何打造你的AI大模型:开源大模型指南

时间:2024-11-14 11:15:47浏览次数:3  
标签:Chinese AI 模型 gguf 学习 开源

本地大语言模型

为什么要用开源模型

大语言模型有两种类型:

  • 闭源的模型,如GPT-3.5、GPT-4、Cluade 、文心一言等

  • 开源的模型,如LLaMA、ChatGLM,Qianwen等

开源模型的优势

  • 已知目前最强的gpt4等大模型是商用闭源的,这些模型参数更大,更加智能,为什么我们会关注开源模型呢?

  • 可以本地部署运行(利用自己的电脑或服务器,运行)数据交互不需要和外网连接,数据安全性提升

  • 不需要购买服务,不用开会员,跑在自己的电脑上,想用多少就用多少

直接运行–>打包+运行

本地直接运行大模型

  • 本地运行,需要至少一台性能很好的机器,不管是服务器,云服务器,或者自己的电脑,最好有张naviad 的显卡

  • 选择大模型,现在目前最好的是llama3 是由Meta公司开源的,另外gemma是Google的,也非常不错,微软和苹果也开源了。中文的阿里开源的千问也不错

  • 选好大模型后去下载到本地(体积看参数多少,在4G–100G之间)

  • 下载好后,就可以本地运行了,只需要在命令行中输入命令

  • 如果想要个网页端上对话,可以再下载一个网页端,比如open webui (这是我喜欢用的)。看个人风格

  • 我自己常用的本地化大模型:

打包自己的模型

  • 有个新闻说是国内现在发布了几百个ai大语言模型,很多都是基于这些开源的模型上训练或改的

  • 即使在开源模型上训练和微调也需要很多的显卡资源和算力。也不是个人可以做到的

  • 如果你和我一样没有很大算力的服务器,又想尝试发布自己的大模型

  • 可以考虑重新打包一个大模型,让它变成你的大模型

怎么打包

  • 步骤1.下载开源模型
wget "https://huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat-GGUF-8bit/blob/main/Llama3-8B-Chinese-Chat-q8.gguf""   ll -h    -rw-r--r-- 1 root root 8.0G Apr 21 10:21 Llama3-8B-Chinese-Chat-q8.gguf   -rw-r--r-- 1 root root  662 Apr 21 14:57 Modelfile   
  • 步骤2.编辑Modelfile
vim Modelfile      #类型如下   FROM "/data/gguf/Llama3-8B-Chinese-Chat-q8.gguf"   TEMPLATE """{{ if .System }}<|start_header_id|>system<|end_header_id|>      {{ .System }}<|eot_id|>{{ end }}{{ if .Prompt }}<|start_header_id|>user<|end_header_id|>      {{ .Prompt }}<|eot_id|>{{ end }}<|start_header_id|>assistant<|end_header_id|>      {{ .Response }}<|eot_id|>   """   PARAMETER num_keep 24   PARAMETER stop "<|start_header_id|>"   PARAMETER stop "<|end_header_id|>"   PARAMETER stop "<|eot_id|>"   SYSTEM """   - Think step by step.   - Be precise, no preamble, get to the point.   - Always answer in Chinese unless the user is in English.   - My name is 51ak.    - My last training session took place on April 25th, 2024.   """         
  • 步骤3: 打包
ollama create 51akGPT -f "/data/gguf/Modelfile"   
  • 等待一会,就会出现一个模型,51akGPT

新模型可以用了

51akGPT

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文转自 https://mp.weixin.qq.com/s/ok4OvLFk1S8j3CmXIXNW_w,如有侵权,请联系删除。

标签:Chinese,AI,模型,gguf,学习,开源
From: https://blog.csdn.net/2401_84206094/article/details/143762897

相关文章

  • AI做小红书小绿书创作,一键打造热门笔记,轻松实现躺赢收入!(Coze工作流)
    最近小红书和小绿书图文二创非常火爆!今天我们就实战拆解一下使用Coze让AI自动完成爆款笔记。操作思路,根据同行爆款笔记,投喂给AI,让AI二创来出标题、文案和配图。图文二创工作流拆分:提取笔记内容-文案重写-文案配图-内容发布。1.内容提取:浏览小红书,寻找热门笔记。提取笔记......
  • 矩阵系统源码搭建的数据获取技术解析,开源部署,oem
    一、引言在矩阵系统的开发中,数据获取是至关重要的环节。无论是用于分析用户行为、优化业务流程,还是实现精准营销等目的,高效且准确的数据获取技术都是构建强大矩阵系统的基础。本文将深入解析矩阵系统源码搭建过程中涉及的数据获取技术,包括数据来源、获取方式以及相关的技术要......
  • 大模型神书《HuggingFace自然语言处理详解——基于BERT中文模型的任务实战》读完少走
    这几年,自然语言处理(NLP)绝对是机器学习领域最火的方向。那么今天给大家带来一本《HuggingFace自然语言处理详解——基于BERT中文模型的任务实战》这本大模型书籍资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】★内容全面本......
  • AI赋能电商:提升销售效率与用户体验的新引擎
    在数字化时代,人工智能(AI)技术正逐步渗透到各行各业,其中电商行业尤为显著。AI技术的引入不仅为电商平台带来了前所未有的创新应用,还极大地提升了销售效率和用户体验。本文将探讨AI技术在购物推荐、会员分类、商品定价等方面的应用,并分享如何运用AI技术推动电商平台的数字化转型,为......
  • 刷题答题脚本—>接入AI (python+css)
    刷题答题脚本———接入AIgithub地址:https://github.com/LY-zhang-yi-hao/do-homework-AI-python创作不易,github点个star,有时间分享更多实用代码,谢谢!本项目使得刷题的脚本的编写下限变低,利用阿里云模型回答问题,不需要进行题库的编写或网页搜索。将问题发送给AI,拿到答案后,进行......
  • 深度学习模型的原理、应用与未来发展
    深度学习(DeepLearning)是机器学习的一个分支,已在近十年里取得了巨大进展,推动了人工智能(AI)的跨越式发展。从自动驾驶、语音识别到医疗诊断,深度学习正在深刻影响各行各业。本文将对深度学习模型的基本原理、常见模型类型、实际应用以及未来趋势进行详细介绍,以帮助读者更深入地理......
  • LLM - 计算 多模态大语言模型 的参数量(Qwen2-VL、Llama-3.1) 教程
    欢迎关注我的CSDN:https://spike.blog.csdn.net/本文地址:https://spike.blog.csdn.net/article/details/143749468免责声明:本文来源于个人知识与公开资料,仅用于学术交流,欢迎讨论,不支持转载。影响(多模态)大语言模型参数量的主要网络模块,即Linear、Embedding、Norm(......
  • JAVA开源项目 基于Vue和SpringBoot卫生健康系统
    博主说明:本文项目编号T076,文末自助获取源码\color{red}{T076,文末自助获......
  • JAVA开源项目 基于Vue和SpringBoot高校学科竞赛平台
    博主说明:本文项目编号T075,文末自助获取源码\color{red}{T075,文末自助获......
  • java 使用开源免费API实现翻译功能 - 代码基于spring ai和国产大模型
    大模型技术推动翻译进入新阶段过去,我们主要依赖百度或其他团队提供的翻译API来实现中英、英中、日中、中日等多种语言间的翻译。然而,随着大模型技术的发展,其在内容理解能力上已远超传统翻译工具。现在,我们可以完全依靠这些先进的大模型来进行更准确、自然的多语言翻译工作,这......