首页 > 其他分享 >星海智算:Llama3.2 Vision使用教程

星海智算:Llama3.2 Vision使用教程

时间:2025-01-17 15:59:45浏览次数:3  
标签:文本 Llama3.2 3.2 Llama 图像 智算 模型 Vision

(一)前言

1、磁盘空间

占用33G磁盘,预留了近67G磁盘空间以供用户使用。

2、模型介绍

Llama 3.2-Vision 多模态大型语言模型 (LLM) 集合是一个包含 11B 和 90B 尺寸的指令微调图像推理生成模型的集合(文本 + 图像输入 / 文本输出)。Llama 3.2-Vision 指令微调模型针对视觉识别、图像推理、字幕生成和回答有关图像的一般问题进行了优化。在常见的行业基准测试中,这些模型的性能超过了众多现有的开源和闭源多模态模型。

支持的语言:对于纯文本任务,官方支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。Llama 3.2 已在比这 8 种支持语言更广泛的语言集合上进行训练。dsfsdfdsfdsfsdfs

请注意,对于图像 + 文本应用,仅支持英语。

(二)使用详情

应用服务(以11B)为例

星海智算官网:https://gpu.spacehpc.com/

  •  实例创建完成后,滑动下方滚动条,在实例右侧有应用服务按钮,点击打开界面。

 

  • 若出现“502 Bad Gateway”建议关闭界面等待两到三分钟重新启动,若还是出现问题,联系工作人员。 

 

  • 打开界面如图所示。

 

  • 首次登录需要注册管理员账户,点击下方注册,输入账户名,邮箱,密码完成注册。

 

  • 点击左上角Arena Model按钮选择需要的大模型,目前已内置Llama3.2 Vision 11B多模态大模型以及Llama3.2 3B大模型。 

 

  • 选择好模型后,在输入框添加图片,使用英文进行对话。 

 

  • 等待片刻,即可收到Llama 3.2-Vision识别图像后的回复。 

 

  • 切记,对于图像 + 文本应用,仅支持英语对话。

 

标签:文本,Llama3.2,3.2,Llama,图像,智算,模型,Vision
From: https://blog.csdn.net/2402_84709675/article/details/145207042

相关文章

  • 本次小论文minor revision中的知识积累
    可以发邮件向编辑申请延期返修截止日期https://cn.service.elsevier.com/app/answers/detail/a_id/29653/c/10595/supporthub/publishing/role/作者/https://zhuanlan.zhihu.com/p/577324425申请邮件模板:如何在EditorialManager系统中提交修改稿?【爱思唯尔Editorial......
  • 解密 Apple Vision Pro 的眼睛舒适度调节技术
    如果你在长时间佩戴使用VisionPro后感觉到异常的眼睛疲劳,即便没有观看太多高速运动的画面仍然感觉到眩晕,或者在摘下VisionPro后眼睛需要额外花一点时间才能重新对焦到周边物体,那么你可以尝试手动调整一下这一显示屏距离,以找到最适合自己的屏幕显示效果。【视频Vision......
  • ViLT: Vision-and-Language Transformer Without Convolution or Region Supervision(V
    ViLT:Vision-and-LanguageTransformerWithoutConvolutionorRegionSupervision(ViLT无卷积或区域监督的语言视觉转换器)1.摘要大概内容就是视觉与语言预训练(VLP)在各种视觉与语言联合下游任务重表现很牛逼,但是目前他们大部分都以来图像特征提取过程(比如区域监督和卷积结......
  • 地平线Vision Mamba:超越ViT,最具潜力的下一代通用视觉主干网络
    •VisionMamba论文链接:https://arxiv.org/abs/2401.09417•项目主页:https://github.com/hustvl/Vim简介本文的工作VisionMamba[1]发表在ICML2024。研究的问题是如何设计新型神经网络来实现高效的视觉表示学习。该任务要求神经网络模型能够在处理高分辨率图像时既保持......
  • 《使用 Vision Transformer 进行图像分类》
    《使用VisionTransformer进行图像分类》作者:KhalidSalama创建日期:2021/01/18最后修改时间:2021/01/18描述:实现用于图像分类的VisionTransformer(ViT)模型。(i)此示例使用Keras3 在Colab中查看 • GitHub源介绍此示例实现了AlexeyDosovitskiy等人的......
  • VP UNIQUE VISION Programming Contest 2024 Christmas (AtCoder Beginner Contest 38
    A-Equally题意:给你三个数,判断能不能分成大于一组后每组和相等。只可能分成两个和一个或者三组一个的。点击查看代码voidsolve(){inta,b,c;std::cin>>a>>b>>c;if((a==b&&b==c)||(a+b==c)||(b+c)==a||(a+c)==b){ s......
  • 第一!天翼云全面领跑智算云服务市场
    近日,赛迪顾问发布《2024H1中国智算云服务市场研究报告》。报告显示,天翼云位居2024H1中国智算云服务市场领导者象限,并荣膺2024H1中国算力互联调度市场第一名,彰显了天翼云在智算领域的核心竞争力和行业领导者地位。2024H1中国智算云服务市场厂商竞争力象限分析图2024H1中国算力......
  • Vision Pro开发的收入与营销策略分析
    2024年对于许多VisionPro开发者来说是充满挑战与机遇的一年。本文将通过一位开发者的视角,详细探讨其在VisionPro平台上的应用收入情况、有效的营销渠道以及未来的发展计划和主要经验总结。一、收入明细(2024年12月)根据最新的财务报告,该开发者在2024年12月的应用总收入达......
  • C# 开发VisionMaster SDK取图 ImageBaseData结构及参数
    ImageBaseData结构探寻参考:https://blog.csdn.net/weixin_44391223/article/details/125387952前4个参数分别为byte数组数组长度图片宽度和图片高度但是第五个参数Pixelformat为什么为1并不确定查看SDK内的C语言头文件可知,应该是两个宏定义C:\ProgramFiles\VisionMast......
  • Stable Diffusion 【通用模型】:出图快效果好的AI大模型TurboVisionXL!
    前言StableDiffusion【通用模型】:出图快效果好的AI大模型TurboVisionXL随着SDXL进入Turbo秒级出图时代,现在越来越多的大模型都开始支持Turbo。今天和大家介绍一个基于SDXLTurbo的超快速大模型TurboVisionXL。最新版本是4.3.1。本文涉及模型、插件下载请扫描免费获取哦......