Memory<T> 和 Span<T>

时间：2024-09-08 21:24:24浏览次数：14

标签：异步 Span chunkSize chunk 内存 Memory

Memory 和 Span 是 C# 中的高效内存管理工具，特别适用于处理大数据集或需要避免不必要的内存分配的场景。它们提供了高性能、低分配的方式来操作内存。相比传统的数组和集合，它们有以下几个关键好处：

零拷贝：Span 和 Memory 允许对现有内存块进行切片操作，而不会产生新的数组或复制数据，减少了内存分配和垃圾回收的开销。

堆栈分配：Span 可以在堆栈上分配，而不是堆上分配，这意味着它们更轻量且性能更好。

高效内存切片：你可以轻松地从现有的内存块中创建子视图，便于操作和管理数据。

示例：Memory 和 Span 的实际应用
假设我们有一个方法，它需要处理一个包含多个数据块的文件，而每个数据块需要单独进行处理。通常我们可能会用数组来操作，但每次都需要创建新的数组或切片，可能会导致性能下降。

使用传统数组：

void ProcessData(byte[] data, int chunkSize) {
    for (int i = 0; i < data.Length; i += chunkSize) {
        byte[] chunk = new byte[chunkSize];
        Array.Copy(data, i, chunk, 0, chunkSize);  // 拷贝数据
        ProcessChunk(chunk);
    }
}

void ProcessChunk(byte[] chunk) {
    // 对 chunk 进行处理
}

这种方法在每次处理数据块时都会创建新的数组并拷贝数据，这在处理大数据集时效率低下
在这个版本中，Slice 方法仅创建现有数据的视图，不进行数据复制，显著提高了性能。

使用 Memory 进行异步操作：
在处理异步操作时，Memory 比 Span 更合适，因为 Span 是堆栈分配的，不能在异步方法中使用。

async Task ProcessDataAsync(Memory<byte> data, int chunkSize) {
    for (int i = 0; i < data.Length; i += chunkSize) {
        Memory<byte> chunk = data.Slice(i, chunkSize);  // 切片，无拷贝
        await ProcessChunkAsync(chunk);
    }
}

async Task ProcessChunkAsync(Memory<byte> chunk) {
    // 对 chunk 进行异步处理
}

在这里，Memory 可以跨越异步边界使用，适用于异步场景，而不会发生内存复制。

总结：

Span：适合同步操作，提供高效的内存切片操作。
Memory：适合异步操作，提供同样的高效切片功能，但可以在异步方法中使用。
通过 Memory 和 Span，我们可以避免不必要的内存分配和数据复制，提升程序的性能和内存利用率

标签：异步,Span,chunkSize,chunk,内存,Memory
From： https://www.cnblogs.com/JosenEarth/p/18403517

QT5 掌握debug调试的方法（简要内容：Memory查看内存地址的数值和查看变量值）（图文并茂）
A1——选择构建模式（选项：debug调试、release发行、profile不知道…）A2——开始运行A3——开始调试（仅在debug调试模式下，断点调试助手才有效）A4——执行构建（生成输出目录及相应的文件，路径要求与工程的路径同级）A1——鼠标悬停变量名弹出，可固定窗口，Qt查看变量值的......
LSTM（Long Short-Term Memory，长短期记忆网络）介绍
关注我，持续分享逻辑思维&管理思维&面试题；可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导；推荐专栏《10天学会使用asp.net编程AI大模型》，目前已完成所有内容。一顿烧烤不到的费用，让人能紧跟时代的浪潮。从普通网站，到公众号、小程序，再到AI大模型网站。干货满满。学成后可......
GaLore Memory-Efficient LLM Training by Gradient Low-Rank Projection
目录概符号说明GaLoreZhaoJ.,ZhangZ.,ChenB.,WangZ.,AnandkumarA.andTianY.GaLore:Memory-efficientllmtrainingbygradientlow-rankprojection.ICML,2024.概本文提出了一种优化器中高效的缓存策略.符号说明\(W_t\in\mathbb{R}^{m\timesn}\),参......
BAdam A Memory Efficient Full Parameter Optimization Method for Large Language M
目录概BAdam代码LuoQ.,YuH.andLiX.BAdam:Amemoryefficientfullparameteroptimizationmethodforlargelanguagemodels.arXivpreprint,2024.概本文介绍了一种Blockcorrdinatedescent(BCD)的训练方式.BAdam当模型本身很大的时候,训练它会成为一......
使用 SpanMetrics Connector 将 OpenTelemetry 跟踪转换为指标
原文：https://last9.io/blog/convert-opentelemetry-traces-to-metrics-using-spanconnector/如果您已经实施了跟踪但缺乏强大的指标功能怎么办？SpanConnector是一个通过将跟踪数据转换为可操作指标来弥补这一差距的工具。这篇文章详细介绍了SpanConnector的工作原理，提供了有......
两种形式的dma 实现memory copy代码
在飞思卡尔的时候，需要用SDMA实现内存到内存memorycopy的功能，需要做两部分的工作：1：在DMAcontroller中加入M2M的支持。2：写一个驱动来调用DMAcontroller的M2M功能。上面的2实际上对于不同的SoC来讲，思路是一样的，有通用性，在这里总结下。当时在实现的时候，用了两种方法：1：cyclic,用dma_a......
A 3nm, 32.5TOPS/W, 55.0TOPS/mm2 and 3.78Mb/mm2 Fully-Digital Compute-in-Memory M
1、强调存储密度（StorageDensity）Mb/mm2，存算一体的主要目的是减少数据搬运的开销，如果一味的堆计算单元而损失存储密度，那么虽然整体的计算吞吐率（TOPS）可以做到很大，相应的对计算密度也会有提升，但是由于需要频繁给CIMMacro刷新数据，从系统能效的角度上来说反而是下降的。这次的SRAMArr......
A 12nm 121-TOPS/W 41.6-TOPS/mm2 All Digital Full Precision SRAM-based Compute-in
1b*4b的操作是通过4b或非门乘法器完成，然后再通过4b加法器两两相加。但是从真值表上来看，2个4b或非门乘法器加1个4b加法器完成的工作实际上可以通过一个由加法器和两比特IN控制的四选一Mux（或者说LUT）来完成。这样做的话可以直接节省掉21%的功耗。提出的这个并行多位输入结构下（即并......

Memory<T> 和 Span<T>

总结：

相关文章

赞助商

阅读排行