关于SVD-LLM的应用-基于SVD量化

一背景

　　论文连接：https://arxiv.org/pdf/2403.07378 这是论文

　　github：https://github.com/AIoT-MLSys-Lab/SVD-LLM

二什么是SVD

　　SVD可能是可以把矩阵向量转化到另外一个空间角度，以方便数据处理。

　　2.1 概念

　　SVD（Singular Value Decomposition，奇异值分解）是一种矩阵分解的技术，它可以将一个矩阵分解成三个矩阵的乘积。给定一个m×n的矩阵A，SVD 将其分解为以下形式：

　　A = U * Σ * V^T

　　其中U 是一个m×m的正交矩阵，Σ 是一个m×n的对角矩阵，V^T（V 的转置）是一个n×n的正交矩阵。

　　对角矩阵

　　对角矩阵是一种特殊的方阵，其除了对角线上的元素外，其余元素均为零。

　　正交矩阵

　　正交矩阵是指其行向量和列向量是正交的方阵。在数学上，一个n×n的矩阵A如果满足以下条件，则称为正交矩阵：

A 的每一列都是单位向量（向量的长度为1）；
A 的每一列两两正交（即任意两列的内积为0，表示它们垂直）；
A 的每一行也是单位向量且两两正交

　　正交变换

　　向量长度

　　||v|| = sqrt(x1^2 + x2^2 + ... + xn^2)，将每个分量的平方求和后再开根号。这样计算出的结果就是向量的长度或模。

三 SVD-LLM原理

　　示意图：

　　Key Designs

Truncation-Aware Data Whitening: Ensure truncating smaller singular values has lower compression loss.
Layer-Wise Closed-Form Update: Compensate for accuracy degradation under high compression ratio.

　　更详细的原理来自论文

四怎么使用SVD-LLM

　　已封装好脚本主要对LLAMA-7B 可以使用

标签：SVD,矩阵,正交,LLM,量化,对角,向量
From： https://www.cnblogs.com/lx63blog/p/18297903

【 2024！深入了解大语言模型（LLM）微调方法（总结）】
文末有福利！引言众所周知，大语言模型(LLM)正在飞速发展，各行业都有了自己的大模型。其中，大模型微调技术在此过程中起到了非常关键的作用，它提升了模型的生成效率和适应性，使其能够在多样化的应用场景中发挥更大的价值。那么，今天这篇文章就带大家深入了解大模型微调。其中主要......
Lookback Lens：用注意力图检测和减轻llm的幻觉
在总结文章或回答给定段落的问题时，大语言模型可能会产生幻觉，并会根据给定的上下文回答不准确或未经证实的细节，这也被称为情境幻觉。为了解决这个问题，这篇论文的作者提出了一个简单的幻觉检测模型，其输入特征由上下文的注意力权重与新生成的令牌(每个注意头)的比例给出。它被称为回......
高盛开源的量化金融 Python 库
GSQuantGSQuant是用于量化金融的Python工具包，建立在世界上最强大的风险转移平台之一之上。旨在加速量化交易策略和风险管理解决方案的开发，凭借25年的全球市场经验精心打造。它由高盛的定量开发人员（定量）创建和维护，以支持交易策略的开发和衍生产品的分析。GSQuant可用于......
AI推介-大语言模型LLMs之RAG（检索增强生成）论文速览（arXiv方向）：2024.06.20-2024.07.01
文章目录～1.AStudyonEffectofReferenceKnowledgeChoiceinGeneratingTechnicalContentRelevanttoSAPPhIREModelUsingLargeLanguageModel2.FromRAGtoRICHES:RetrievalInterlacedwithSequenceGeneration3.SK-VQA:SyntheticKnowledgeGeneration......
Ollama完整教程：本地LLM管理、WebUI对话、Python/Java客户端API应用
老牛同学在前面有关大模型应用的文章中，多次使用了Ollama来管理和部署本地大模型（包括：Qwen2、Llama3、Phi3、Gemma2等），但对Ollama这个非常方便管理本地大模型的软件的介绍却很少。目前，清华和智谱AI联合发布开源的GLM4-9B大模型也能支持Ollama进行本地部署了（本地部署GLM-4-9B清华......
LLM大模型: 常用的数据清洗方法总结
LLM的三大要素：算力：算力的本质是拼财力，普通人是无力改变的；算法/模型结构：目前最流行的还是transformer架构，各种LLM都是基于transformer改细节，暂时没有用新的框架替代transformer。至于后续manba会不会替代transformer架构，有待观察！数据：这块是做LLMpre-train或fine-tune最大......
阿里开源语音理解和语音生成大模型FunAudioLLM
近年来，人工智能（AI）的进步极大地改变了人类与机器的互动方式，例如GPT-4o和Gemin-1.5等。这种转变在语音处理领域尤为明显，其中高精度的语音识别、情绪识别和语音生成等能力为更直观、更类人的交互铺平了道路。阿里开源大模型FunAudioLLM，一个创新的框架，旨在促进人类与大型......
量化交易入门：如何在QMT中配置Python环境，安装第三方依赖包
哈喽，大家好，我是木头左！引言QMT，作为量化交易系统中的佼佼者，以其强大的功能和灵活的操作性，受到了广大投资者的青睐。但是，对于很多新手来说，如何在QMT中配置Python环境，安装第三方依赖包，却是一个让人头疼的问题。本文将从零开始，手把手教你如何在QMT中配置Python环境，安装第三方依赖包......
【LLM大模型】一文带你速通RAG、知识库和LLM！
检索增强生成（RetrievalAugmentedGeneration，RAG）是一种强大的工具，它通过将企业外部知识整合到生成过程中，增强了大语言模型（LLM）的性能。RAG本质上是通过工程化手段，解决LLM知识更新困难的问题。其核心手段是利用外挂于LLM的知识数据库（通常使用向量数据库）存储未在训练数据集中......
YOLOv8优化策略：轻量化改进 | LeYOLO，新的可扩展和高效CNN目标检测体系结构
......

关于SVD-LLM的应用-基于SVD量化

关于SVD-LLM的应用-基于SVD量化

一背景

二什么是SVD

三 SVD-LLM原理

Key Designs

四怎么使用SVD-LLM

相关文章

赞助商

阅读排行

关于SVD-LLM的应用-基于SVD量化

关于SVD-LLM的应用-基于SVD量化

一 背景

二 什么是SVD

三 SVD-LLM原理

Key Designs

四 怎么使用SVD-LLM

相关文章

赞助商

阅读排行

一背景

二什么是SVD

　　Key Designs

四怎么使用SVD-LLM