首页 > 其他分享 >这可能是最清晰的AI存储数据流动图解

这可能是最清晰的AI存储数据流动图解

时间:2024-09-15 20:23:27浏览次数:11  
标签:存储 AI Solidigm NAND SSD 图解 数据

图片

之前小编也写过多篇AI存储相关的文章,包括AI背景与分层存储的分析,以及AI存储重点从训练转向推理等内容。具体参考:

业内有很多关于AI不同解读对存储需求的分析,每家都有画对应的示意图。在这么多厂商的分析中,小编觉得Solidigm家画的眼前一亮小编很早就看到了,由于不是公开信息,无法在公众号分享,近期Solidigm在FMS 2024上也公开了相关材料,正好分享给各位读者参考!

Solidigm QLC SSD也是目前市场的主力,在AI场景赚翻了。

  • SK集团(SK hynix和Solidigm):SK集团在2024年第二季度保持了第二大NAND闪存供应商的地位。AI需求的增加显著提升了Solidigm的发货量,尽管PC和智能手机需求有所下调。因此,该集团的bit容量发货量略有减少,但ASP增长了16%,导致NAND闪存营收环比增长13.6%,达到37.16亿美元。SK hynix计划长期将企业SSD发货量的比例提高到40%,以应对AI驱动的高容量企业SSD需求。

图片

在AI的数据管道中,数据经历了从收集、准备、训练、验证、量化到推断的全过程。每个阶段都有其独特的数据访问模式。例如,在数据获取阶段,原始数据通常以顺序的方式写入对象存储层。随后,在数据准备阶段,数据被读取、预处理,并写回到计算服务器。而在训练阶段,数据以随机顺序暴露给GPU进行训练,并将训练后的模型写回存储。最后,模型在推断阶段被再次读取使用。

图片

现代AI集群通常由几个不同的存储层级组成。

  • 最底层的GPU服务器,它们拥有有限的存储空间(通常是8个U.2插槽)。

  • 全闪存性能层,该层的服务器配置了快速存储设备(通常是TLC NAND),以弥补硬盘性能不足。

  • 对象存储层,由包含多个存储设备的存储服务器或JBODs组成,当前大多数情况下使用的是硬盘(HDD)。

这样的分层存储架构有助于根据数据访问频率和性能要求合理分配数据。

图片

  1. 数据收集

    • 原始数据以顺序方式写入对象存储层。这一阶段通常涉及大量的数据写入操作。

    • 推荐解决方案:适用于高容量和顺序写入性能的存储设备。

图片

  1. 数据预处理

    • 数据从对象存储层读取到计算服务器。

    • CPU对原始数据进行预处理,然后将清洗后的数据写回。

    • 推荐解决方案:具备顺序读写性能的存储设备。

图片

  1. 训练

    • 在此阶段,GPU以随机顺序读取数据进行训练。训练结果会被写入存储。

图片

  1. 检查点

    • 训练中的模型周期性地被写入磁盘,并按需读回。

图片

  1. 推理与归档

    • 模型部署后开始接收输入,这会在GPU服务器上产生随机读取活动。

图片

    • 模型的输入和输出被捕获并写入对象存储层。

图片

参考文献:FMS2024-Solidigm-《AI Data Pipeline》


如果您看完有所受益,欢迎点击文章底部左下角“关注”并点击“分享”、“在看”,非常感谢!

精彩推荐:

标签:存储,AI,Solidigm,NAND,SSD,图解,数据
From: https://blog.csdn.net/zhuzongpeng/article/details/142201717

相关文章

  • AI老照片修复神器,Anole下载介绍
    最近AI老照片修复上色,再一次火出圈,一些社交平台关于此话题内容流量满满,尤其是在小红书和抖音火的不得了,本期文章就来给大家分享下AI修复老照片的方式方法本文主要介绍使用Anole修复老照片的方法,只需输入一张黑白或彩色照片,即可得到修复后的彩色结果,让往日的老照片坐上时光机重焕新......
  • sign与unsigned的原理、数据存储与硬件的关系
    目录关键字unsigned和signed数据在计算机中的存储原码与补码的转化与硬件关系原,反,补的原理:整型存储的本质变量存取的过程类型目前的作用十进制与二进制快速转换大小端字节序判断当前机器的字节序"负零"(-128)的理解截断建议在无符号类型的数值后带上u,关键字unsigned和signe......
  • oracle 存储加数据检查
    在Oracle数据库中,可以使用存储过程和触发器来实现数据检查。以下是一个简单的例子,展示了如何使用触发器来在数据插入之前进行数据检查。假设我们有一个名为orders的表,其中包含order_id和order_amount两个字段。我们想确保每个order_id都是唯一的,且order_amount大于零......
  • AI写作助手哪些好用?6款强大的AI写作助手值得收藏!
    在内容创作日益重要的今天,AI写作助手已经成为许多创作者的得力工具。它们不仅能够提高写作效率,还能在一定程度上保证文章质量。面对市场上琳琅满目的AI写作助手,如何选择一款好用且适合自己的工具呢?以下推荐6款强大的AI写作助手,它们各具优势,助力创作者轻松应对各种写作场景。......
  • Comparing Multi-agent AI frameworks
    ComparingMulti-agentAIframeworkshttps://sajalsharma.com/posts/overview-multi-agent-fameworks/AComparativeOverviewTobetterunderstandthedifferencesandapplicationsoftheseframeworks,let’sexaminetheminacomparativetable:FeatureAutoGe......
  • 使用Altair轻松实现统计数据可视化-从基础图表到高级交互
    在数据科学和数据可视化领域,生成清晰、漂亮的统计图表对于展示数据和传达见解至关重要。Python中有许多强大的库可以帮助我们实现这一目标,其中Altair库是一个非常流行的选择。Altair是一个基于Vega和Vega-Lite的声明式统计可视化库,它使得生成交互式、漂亮的图表变得非常简单。本文......
  • 如何在Java中实现高效的可解释AI算法
    如何在Java中实现高效的可解释AI算法大家好,我是微赚淘客系统3.0的小编,是个冬天不穿秋裤,天冷也要风度的程序猿!可解释AI(ExplainableAI,XAI)旨在提供机器学习模型的透明度,使其决策过程和结果对用户可理解。随着AI应用的广泛普及,确保模型的可解释性变得尤为重要。本文将介绍......
  • AI商业广告与智能办公实战【技术驱动下的变革】(好书推荐)
    文章目录AI商业广告与智能办公实战【技术驱动下的变革】(好书推荐)AI在商业广告中的应用AI在智能办公中的应用AI商业广告设计实战108招:ChatGPT+Photoshop+Firefly+Midjour【书籍推荐】AI智能办公实战108招:ChatGPT+Word+PowerPoint+WPS【书籍推荐】AI数据处理实战108招:Ch......
  • Efficient DevSecOps Workflows with a Little Help from AI
    EfficientDevSecOpsWorkflowswithaLittleHelpfromAIhttps://www.infoq.com/articles/efficient-devsecops-workflows/AIisenhancingDevSecOpsworkflowsbystreamliningtasks,improvingsecurity,andoptimizingoperations.UtilizeAIforgeneratingco......
  • 想转行AI大模型开发工程师?这本书是你的必读指南!!!《AI大模型开发之路》
     当前最热门的技术无疑是AI大模型。虽然它的应用前景广阔,但真正精通大模型技术的人还不多。然而,市场对大模型的需求却在不断增长,吸引了不少开发者想要转行进入这个领域。然而,面对新技术,许多人心中充满疑虑,担心自己无法掌握。笔者也是充满疑虑,然后直到我看到这本书籍,感觉受益匪......