• 2024-11-18transformer模型学习路线
    Transformer学习路线前排提示,文末有大模型AGI-CSDN独家资料包哦!完全不懂transformer,最近小白来入门一下,下面就是本菜鸟学习路线。Transformer和CNN是两个分支!!因此要分开学习Transformer是一个Seq2seq模型,而Seq2seq模型用到了self-attention机制,而self-attention机制又在E
  • 2024-11-15Encoder Data compression
    Lab3:EncoderIntroductionDatacompressionistheprocessofencodinginformationusingfewerbitsthantheoriginalrepresentation.Run-lengthencoding(RLE)isasimpleyeteffectivecompressionalgorithm:repeateddataarestoredasasingledataandth
  • 2024-11-11【论文系列】之 ---- CLIP
    CLIP(ContrastiveLanguage-ImagePre-Training)从名字显而易见:语言-图像,预训练,主要用于学习图像该模型的核心思想是使用大量图像和文本的配对数据进行预训练,以学习图像和文本之间的对齐关系CLIP模型有两个模态,一个是文本模态,一个是视觉模态,包括两个主要部分内容该模型的核心思
  • 2024-11-10【神经网络组件】Transformer Encoder
    【神经网络组件】TransformerEncoder目录【神经网络组件】TransformerEncoder1.seq2seq模型2.为什么只需要TransformerEncoder3.TransformerEncoder的结构1.seq2seq模型什么是sequence:sequence指由多个向量组成的序列。例如,有三个向量:\(\mathbf{a}=[1,0,0]^T,\math
  • 2024-11-09gigapath部署以及微调全过程
    0.0什么是gigapathgigapath是一个由微软开发的数字病理学全玻片基础模型,用于从高分辨率图像(如病理切片图像)中提取和处理信息的深度学习模型架构。图中分为abc三个部分a首先输入一张高清的病理图像,我们将它拆分成256*256的图像切片,从而可以逐块处理。每个图像块会被输入到一
  • 2024-11-09大模型面试题:为什么大模型都是Decoder-only结构?
    更多面试题的获取方式请留意我的昵称或看评论区为什么大模型都是Decoder-only结构?在探讨当前大型语言模型(LLM)普遍采用Decoder-only架构的现象时,我们可以从以下几个学术角度进行分析:注意力机制的满秩特性:Decoder-only架构采用的因果注意力机制(causalattention)形成了一个下
  • 2024-11-06bert自然语言处理框架
    探索BERT:自然语言处理的新纪元在人工智能和自然语言处理(NLP)的浩瀚星空中,BERT(BidirectionalEncoderRepresentationsfromTransformers)无疑是近年来最耀眼的星辰之一。自2018年由GoogleAILanguage团队提出以来,BERT不仅重新定义了NLP任务的处理方式,还极大地推动了该领域的边
  • 2024-11-03自然语言处理进阶手册--Seq2seq 和注意力机制
    Seq2seq和注意力机制Seq2seqSeq2seq是一种框架结构,它接受一个序列(单词、字母、图像特征等)并输出另一个序列,由编码和解码两部分构成。如在机器翻译任务中,一个序列指的是一系列的词,一个接一个地被处理编码,同样,输出的也是一系列单词,一个接一个地进行解码。具体地,编码器处
  • 2024-10-31Stable Diffusion技术路线发展历程回顾
    图1描述了StableDiffusion模型的发展历程,从最初的AE(AutoEncoder),逐步发展到DDPM、VQVAE、LDM,并最终产生了StableDiffusion。从技术路线上看,StableDiffusion由2条技术路线汇聚而成,一条是路线1:AE->VAE->DDPM,另一条是路线2:AE->VQVAE->LDM。路线1主要解决生成图像质
  • 2024-10-31Adobe Media Encoder 2025 v25.0 (macOS, Windows) - 格式转换
    AdobeMediaEncoder2025v25.0(macOS,Windows)-格式转换Acrobat、AfterEffects、Animate、Audition、Bridge、CharacterAnimator、Dimension、Dreamweaver、Illustrator、InCopy、InDesign、LightroomClassic、MediaEncoder、Photoshop、PremierePro、AdobeXD请访问
  • 2024-10-31大模型导论
    为什么大模型相比中小模型,有更突出的性能和泛化能力,也许大多数人并没有想过这个问题,业内一般从函数曲线拟合的角度,来理解模型为什么能解决现实中的问题。1、模型为什么越大,性能和泛化越好?在AI领域,对需要解决的业务问题,将其视为满足一定条件的数据分布,先通过特征工程的方式,从
  • 2024-10-30DashText-快速开始
    快速开始DashText,是向量检索服务DashVector推荐使用的稀疏向量编码器(SparseVectorEncoder),DashText可通过BM25算法将原始文本转换为稀疏向量(SparseVector)表达,通过DashText可大幅度简化使用DashVector[关键词感知检索]能力。说明需要使用您的api-key替换示例中的YOUR_API_KE
  • 2024-10-30DashText-进阶使用
    前置知识BM25简介BM25算法(BestMatching25)是一种广泛用于信息检索领域的排名函数,用于在给定查询(Query)时对一组文档(Document)进行评分和排序。BM25在计算Query和Document之间的相似度时,本质上是依次计算Query中每个单词和Document的相关性,然后对每个单词的相关性进行加权求和。BM
  • 2024-10-21LLM大模型: blip2多模态大模型原理
      截止目前,图片检索领域最出名的应该是openAI的clip了,分别用bert和vit对text和image做encoder,然后让配对的embedding接近,不配对的embedding拉远,通过这种方法达到text匹配(检索)image的目的!但这种方式只能检索,没法生成text啊(比如对image做适当的description),咋整了?总结一下,单存的
  • 2024-10-17【Adobe】Adobe Media Encoder(ME)视频和音频媒体文件的编码和导出下载安装
    目录一、AdobeMediaEncoder发展历史1.1起源与早期发展1.2独立软件的形成1.3广泛应用与持续创新二、AdobeMediaEncoder功能介绍2.1高效编码与导出2.2自定义输出设置2.3强大的媒体处理能力三、AdobeMediaEncoder系统要求3.1操作系统要求3.2硬件要求
  • 2024-10-14transformer的基础知识
    transformer的基础知识transformer网络结构图seq2seq一般Seq2seq会分成两部分:Encoder、Decoder。EncoderTransformer中的Encoder就是用的Self-attention。encoder的内部结构补充:block的内部结构主要由self-attention和全连接神经网络所构成。在原来的论文中
  • 2024-10-13Transformer中的Encoder与Decoder
    参考学习:【超详细】【原理篇&实战篇】一文读懂Transformer-CSDN博客彻底搞懂了Transformer解码器(图文详解)-知乎(zhihu.com)这样图解Transformer应该没人看不懂了吧——多头注意力机制详解_transformer多头注意力机制-CSDN博客本文目标是加强记忆,如果想具体学习点击链接参
  • 2024-10-10多模态论文串讲-学习笔记(下)
    入门参考:跟着chatgpt一起学|多模态入门-CSDN博客学习笔记(上):多模态论文串讲-学习笔记(上)-CSDN博客学习参考:多模态论文串讲·下【论文精读·49】_哔哩哔哩_bilibili学习笔记上介绍只使用transformer encoder的方法,本文来介绍下同时使用transformerencoder和decoder的方法。
  • 2024-09-30人大&百度提出个性化插件式LLM
    LLM目前最有前景的应用之一就是超级助手,其中个人超级助手早晚躲不开个性服务,因为即使有相同需求的用户,也可能偏好不同的输出。以通用人工智能著称的LLM又要怎么开启个性化服务呢?给每个用户单独微调一个LLM在toC端肯定是不现实的,即使是用各种PEFT的奇淫巧技,也能把公司底裤都亏
  • 2024-09-24超详细的系列总结!大模型岗面试题(含答案)来了!(大语音模型基础篇二)
    前言大模型应该是目前当之无愧的最有影响力的AI技术,它正在革新各个行业,包括自然语言处理、机器翻译、内容创作和客户服务等,正成为未来商业环境的重要组成部分。截至目前大模型已超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关岗位和面试也开始越来越卷
  • 2024-09-21Transformer模型-7- Decoder
    概述Decoder也是N=6层堆叠的结构,每层被分3层:两个注意力层和前馈网络层,同Encoder一样在主层后都加有Add&Norm,负责残差连接和归一化操作。Encoder与Decoder有三大主要的不同:第一层MaskedMulti-HeadAttention:采用Masked操作第二层Multi-HeadAttention:K,V矩阵是
  • 2024-09-18Attention is all you need 论文阅读笔记
    AttentionisallyouneedTransformeronlybasedonattentionmechanisms,dispensingCNN,RNNIntroductionandBackgroundRNN必须将前一步生成的h
  • 2024-09-12SD入门教程一:Stable Diffusion 基础(技术篇)
    前言在开篇的时候就大致讲了SD和VAE,那么今天我们具象化地再来讲讲StableDiffusion(稳定扩散)。严格说来它是一个由几个组件(模型)构成的系统,而非单独的一个模型。我以最常见的文生图为例,解释下StableDiffusion的整体架构和工作原理。本次教程将使用AI绘画工具StableD
  • 2024-09-08Transformer图解以及相关的概念解析
    前言transformer是目前NLP甚至是整个深度学习领域不能不提到的框架,同时大部分LLM也是使用其进行训练生成模型,所以transformer几乎是目前每一个机器人开发者或者人工智能开发者不能越过的一个框架。接下来本文将从顶层往下去一步步掀开transformer的面纱。transformer概述Transforme