首页 > 其他分享 >AI大模型部署精讲:从硬件到软件(ollama+dify)

AI大模型部署精讲:从硬件到软件(ollama+dify)

时间:2025-01-22 18:29:26浏览次数:3  
标签:dify AI ollama 环境 python -- cuda 安装 下载

前言:2023年用GPU云主机在优班图上搭建过xinference+dify后对AI有初步概念,2024年1月后,和另外一个同事聊天时候了解某东3060卡1800左右,就入手一张,在windows环境上对AI的底层到软件部署到开发一步步的实操,通过“格物致知”对大模型有更新的认识,本文记录如下:

第一篇 硬件篇

主机硬件:cpu AMD 8核 内存 16G、升级AI显卡:[英伟达 NVIDIA GeForce RTX 3060 参数 CUDA 核心:3584 个  显存容量:12GB  最大功耗:170W] ,升级了 主机电源:600W

操作系统是win10的,右击任务栏--任务管理器--可以看到显卡以及GPU利用率情况

第二篇 环境部署

2.1 安装 cuda

查看当前你的电脑显卡支持的最高CUDA版本,后面下载的驱动不能超过它,我选12.4版本

CUDA下载官网:CUDA Toolkit Archive | NVIDIA Developer

下载 cuda_12.4.0_551.61_windows

点击安装,选择自定义安装,然后默认即可

2.2下载 解压cuDNN

cuDNN下载地址:cuDNN Archive | NVIDIA Developer

下载cuDNN,要注册一个英伟达的账号,才能下载照提示流程注册、登录即可。  

 cudnn-windows-x86_64-8.9.7.29_cuda12-archive.exe 解压

复制到cuda目录:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4

第三篇  python环境(开发环境!!)

非常强大的python环境管理软件,与PyCharm等编程环境搭配可以实现多个AI场景的安装环境的切换,比单独电脑安装python环境好用多了!!!!

进入Anaconda的官网进行下载:https://www.anaconda.com/download

修改默认安装路径为D:\soft\anaconda3\

配置环境变量

右键点击【我的电脑】(此电脑)--【属性】--点击【高级系统设置】--【高级】--【环境变量】-找到系统变量下的【Path】--右侧点击【新建】,按照我标红框的进行添加即可。(注意anaconda3的安装路径

3.1 创建大模型安装环境

dos命令行进入

1、conda create -n damoxing python=3.9

2、查看环境名称 conda info --envs

3、激活默认环境 activate damoxing   !!!这步很重要,今后的python环境都在这里

4、在ananada中安装pytorch 环境依赖

https://pytorch.org/get-started/previous-versions/

conda install pytorch==2.5.0 torchvision==0.20.0 torchaudio==2.5.0 pytorch-cuda=12.4 -c pytorch -c nvidia

 5、验证是否安装成功,在自己创建的虚拟环境中,依次执行以下代码进行验证:python

import torch

torch.cuda.is_available() 

 第四篇  ollama安装 

1. 本文安装环境为:Windows10专业版

下载: Ollama下载地址:https://ollama.com/download

现在Ollama已经安装完了,我们需要在终端中输入下方命令运行一个大语言模型进行测试,这里以对在中文方面表现相对好些的千问为例,大家也可以使用其他的模型。

ollama run qwen 

第五篇  Docker Desktop 安装

打开控制面板,在程序与功能页面选择启用或Windows功能

访问Docker官网进行下载 Windows | Docker Docs

  

   

备注:wsl 2 出错无法升级的,可以关掉wsl引擎  

第五篇  安装Dify

官网下载源码https://github.com/langgenius/dify,例如下载到D:\dify-main

  

注意!!! windown要修改 docker-compose.yaml里面postgress数据库的读写权限,否则无法9个进程只有8个运行,一个postgres的一直重启中

    volumes: 

-./volumes/db/data:/var/lib/postgresql/data

增加 && sudo chmod 0750 /var/lib/postgresql/data

DOS命令行下启动

docker compose up -d

Docker中查看是否部署成功,启动即可

    

  

.....持续更新!!!!!!

 

标签:dify,AI,ollama,环境,python,--,cuda,安装,下载
From: https://blog.csdn.net/m0_75018468/article/details/145307814

相关文章

  • 深化Edge AI 应用:德承工控机GM-1100安装Ubuntu 24.04.1 LTS系统操作指南
    EdgeAI:边缘运算(EdgeComputing)结合人工智能(AI),将AI模型和算法安排在负责处理边缘运算的工控机上,除了能够就近撷取设备端的数据外,还能够进行资料处理与机器学习的任务,透过EdgeAI,不再需要将大量数据传到云端服务器,有效缩短处理时间、提高反应速度,还能够降低对于网络带宽的需求......
  • failed: Authentication plugin 'caching_sha2_password' cannot be loaded: /usr/lib
    mysql连接时报以下这个错误CannotconnecttoMySQL:DBIconnect('jiwei;host=;port=3306;mysql_read_default_group=client','root',...)failed:Authenticationplugin'caching_sha2_password'cannotbeloaded:/usr/lib64/mysql/plugin/caching......
  • kafka学习笔记5 PLAIN认证——筑梦之路
    在Kafka中,SASL(SimpleAuthenticationandSecurityLayer)机制包括三种常见的身份验证方式:SASL/PLAIN认证:含义是简单身份验证和授权层应用程序接口,PLAIN认证是其中一种最简单的用户名、密码认证方式,生产环境使用维护简单易用。可用于Kafka和其他应用程序之间的认证。SASL/S......
  • Hugging Face全面拥抱LangChain:全新官方合作包
    最近HuggingFace官宣发布langchain_huggingface,这是一个由HuggingFace和LangChain共同维护的LangChain合作伙伴包。这个新的Python包旨在将HuggingFace最新功能引入LangChain并保持同步。本系列合集,点击链接查看通过官方包的加持,开发小伙伴们通过简单的api调用......
  • 深化Edge AI 应用:德承工控机GM-1100安装Ubuntu 24.04.1 LTS系统操作指南
    EdgeAI:边缘运算(EdgeComputing)结合人工智能(AI),将AI模型和算法安排在负责处理边缘运算的工控机上,除了能够就近撷取设备端的数据外,还能够进行资料处理与机器学习的任务,透过EdgeAI,不再需要将大量数据传到云端服务器,有效缩短处理时间、提高反应速度,还能够降低对于网络带宽的需求也更......
  • 从0到1打造企业AI知识库-课程目录
    课程名称:「从0到1打造企业AI知识库:实用指南与生产落地」课程目录第一章:AI企业知识库的前景与价值1.企业知识库的概念与意义1.1什么是企业知识库?-企业知识库的核心组成-企业知识库的类型1.2企业知识库如何赋能内部协作与创新。2.AI在知识库中的作用AI赋能的......
  • 米尔瑞芯微第二代8nm高性能AIOT平台-RK3576开发板怎么样?
    文章来源公众号:电子开发学习瑞芯微近期推出了第二代8nm高性能AIOT平台——RK3576。 RK3576应用方向指向工业控制及网关,云终端,人脸识别设备,车载中控,商显等等。参数方面,内置了四核Cortex-A72+四核Cortex-A53,频率最高2.2GHz,内置ARMG52MC3GPU,NPU算力高达6TOPS…… 参数看着......
  • 2025 最新 JetBrains IDEA 激活教程 (1月22日更新)
    最近JetBrains许可证过期了,本着学习的态度以 IntelliJIDEA 为例尝试了几种破解方案。当然ja-netfilter插件确实是较为完美的方案,完美破解JB全家桶。但本着不破坏程序本质,本教程从激活的角度来研究如何获得正版的JetBrains授权。推荐方法访问:https://idea.hacks.t......
  • (即插即用模块-Convolution部分) 十二、(AAAI 2020) TBConv 捆绑块卷积
    文章目录1、TiedBlockConvolution2、代码实现paper:TiedBlockConvolution:LeanerandBetterCNNswithSharedThinnerFiltersCode:https://github.com/frank-xwang/TBC-TiedBlockConvolution1、TiedBlockConvolution在现有的研究中,作者观察到随着CNN......
  • 数学建模学习-朴素贝叶斯分类器(Naive Bayes Classifier)教程(31)
    数学建模学习-朴素贝叶斯分类器(NaiveBayesClassifier)教程(31)写在最前注意本文的相关代码及例子为同学们提供参考,借鉴相关结构,在这里举一些通俗易懂的例子,方便同学们根据实际情况修改代码,很多同学私信反映能否添加一些可视化,这里每篇教程都尽可能增加一些可视化方便同......