如何打造你的AI大模型：开源大模型指南

时间：2024-11-14 11:15:47浏览次数：3

标签：Chinese AI 模型 gguf 学习开源

本地大语言模型

为什么要用开源模型

大语言模型有两种类型：

闭源的模型，如GPT-3.5、GPT-4、Cluade 、文心一言等
开源的模型，如LLaMA、ChatGLM,Qianwen等

开源模型的优势

已知目前最强的gpt4等大模型是商用闭源的，这些模型参数更大，更加智能，为什么我们会关注开源模型呢？
可以本地部署运行（利用自己的电脑或服务器，运行）数据交互不需要和外网连接，数据安全性提升
不需要购买服务，不用开会员，跑在自己的电脑上，想用多少就用多少

直接运行–>打包+运行

本地直接运行大模型

本地运行，需要至少一台性能很好的机器，不管是服务器，云服务器，或者自己的电脑，最好有张naviad 的显卡
选择大模型，现在目前最好的是llama3 是由Meta公司开源的，另外gemma是Google的，也非常不错，微软和苹果也开源了。中文的阿里开源的千问也不错
选好大模型后去下载到本地（体积看参数多少，在4G–100G之间）
下载好后，就可以本地运行了，只需要在命令行中输入命令
如果想要个网页端上对话，可以再下载一个网页端，比如open webui （这是我喜欢用的）。看个人风格
我自己常用的本地化大模型：

打包自己的模型

有个新闻说是国内现在发布了几百个ai大语言模型，很多都是基于这些开源的模型上训练或改的
即使在开源模型上训练和微调也需要很多的显卡资源和算力。也不是个人可以做到的
如果你和我一样没有很大算力的服务器，又想尝试发布自己的大模型
可以考虑重新打包一个大模型，让它变成你的大模型

怎么打包

步骤1.下载开源模型

wget "https://huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat-GGUF-8bit/blob/main/Llama3-8B-Chinese-Chat-q8.gguf""   ll -h    -rw-r--r-- 1 root root 8.0G Apr 21 10:21 Llama3-8B-Chinese-Chat-q8.gguf   -rw-r--r-- 1 root root  662 Apr 21 14:57 Modelfile

步骤2.编辑Modelfile

vim Modelfile      #类型如下   FROM "/data/gguf/Llama3-8B-Chinese-Chat-q8.gguf"   TEMPLATE """{{ if .System }}<|start_header_id|>system<|end_header_id|>      {{ .System }}<|eot_id|>{{ end }}{{ if .Prompt }}<|start_header_id|>user<|end_header_id|>      {{ .Prompt }}<|eot_id|>{{ end }}<|start_header_id|>assistant<|end_header_id|>      {{ .Response }}<|eot_id|>   """   PARAMETER num_keep 24   PARAMETER stop "<|start_header_id|>"   PARAMETER stop "<|end_header_id|>"   PARAMETER stop "<|eot_id|>"   SYSTEM """   - Think step by step.   - Be precise, no preamble, get to the point.   - Always answer in Chinese unless the user is in English.   - My name is 51ak.    - My last training session took place on April 25th, 2024.   """

步骤3: 打包

ollama create 51akGPT -f "/data/gguf/Modelfile"

等待一会，就会出现一个模型，51akGPT

新模型可以用了

51akGPT

如何学习AI大模型？

作为一名热心肠的互联网老兵，我决定把宝贵的AI知识分享给大家。至于能学习到多少就看你的学习毅力和能力了。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

四、AI大模型商业化落地方案

作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。

本文转自 https://mp.weixin.qq.com/s/ok4OvLFk1S8j3CmXIXNW_w，如有侵权，请联系删除。

标签：Chinese,AI,模型,gguf,学习,开源
From： https://blog.csdn.net/2401_84206094/article/details/143762897

AI做小红书小绿书创作，一键打造热门笔记，轻松实现躺赢收入！（Coze工作流）
最近小红书和小绿书图文二创非常火爆！今天我们就实战拆解一下使用Coze让AI自动完成爆款笔记。操作思路，根据同行爆款笔记，投喂给AI，让AI二创来出标题、文案和配图。图文二创工作流拆分：提取笔记内容-文案重写-文案配图-内容发布。1.内容提取：浏览小红书，寻找热门笔记。提取笔记......
矩阵系统源码搭建的数据获取技术解析，开源部署，oem
一、引言在矩阵系统的开发中，数据获取是至关重要的环节。无论是用于分析用户行为、优化业务流程，还是实现精准营销等目的，高效且准确的数据获取技术都是构建强大矩阵系统的基础。本文将深入解析矩阵系统源码搭建过程中涉及的数据获取技术，包括数据来源、获取方式以及相关的技术要......
大模型神书《HuggingFace自然语言处理详解——基于BERT中文模型的任务实战》读完少走
这几年，自然语言处理（NLP）绝对是机器学习领域最火的方向。那么今天给大家带来一本《HuggingFace自然语言处理详解——基于BERT中文模型的任务实战》这本大模型书籍资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】★内容全面本......
AI赋能电商：提升销售效率与用户体验的新引擎
在数字化时代，人工智能（AI）技术正逐步渗透到各行各业，其中电商行业尤为显著。AI技术的引入不仅为电商平台带来了前所未有的创新应用，还极大地提升了销售效率和用户体验。本文将探讨AI技术在购物推荐、会员分类、商品定价等方面的应用，并分享如何运用AI技术推动电商平台的数字化转型，为......
刷题答题脚本—>接入AI (python+css)
刷题答题脚本———接入AIgithub地址：https://github.com/LY-zhang-yi-hao/do-homework-AI-python创作不易，github点个star，有时间分享更多实用代码，谢谢！本项目使得刷题的脚本的编写下限变低，利用阿里云模型回答问题，不需要进行题库的编写或网页搜索。将问题发送给AI，拿到答案后，进行......
深度学习模型的原理、应用与未来发展
深度学习（DeepLearning）是机器学习的一个分支，已在近十年里取得了巨大进展，推动了人工智能（AI）的跨越式发展。从自动驾驶、语音识别到医疗诊断，深度学习正在深刻影响各行各业。本文将对深度学习模型的基本原理、常见模型类型、实际应用以及未来趋势进行详细介绍，以帮助读者更深入地理......
LLM - 计算多模态大语言模型的参数量(Qwen2-VL、Llama-3.1) 教程
欢迎关注我的CSDN：https://spike.blog.csdn.net/本文地址：https://spike.blog.csdn.net/article/details/143749468免责声明：本文来源于个人知识与公开资料，仅用于学术交流，欢迎讨论，不支持转载。影响(多模态)大语言模型参数量的主要网络模块，即Linear、Embedding、Norm(......
JAVA开源项目基于Vue和SpringBoot卫生健康系统
博主说明：本文项目编号T076，文末自助获取源码\color{red}{T076，文末自助获......
JAVA开源项目基于Vue和SpringBoot高校学科竞赛平台
博主说明：本文项目编号T075，文末自助获取源码\color{red}{T075，文末自助获......
java 使用开源免费API实现翻译功能 - 代码基于spring ai和国产大模型
大模型技术推动翻译进入新阶段过去，我们主要依赖百度或其他团队提供的翻译API来实现中英、英中、日中、中日等多种语言间的翻译。然而，随着大模型技术的发展，其在内容理解能力上已远超传统翻译工具。现在，我们可以完全依靠这些先进的大模型来进行更准确、自然的多语言翻译工作，这......