首页 > 其他分享 >2023-8-24 Pyramid Vision Transformer 2023人工智能大会青年科学家论坛

2023-8-24 Pyramid Vision Transformer 2023人工智能大会青年科学家论坛

时间:2023-11-06 15:46:46浏览次数:37  
标签:24 Transformer Pyramid 分辨率 times 2023 Vision

Pyramid Vision Transformer | 2023人工智能大会青年科学家论坛

王文海 香港中文大学

  • 首次将多层次金字塔结构引入视觉变化网络

  • 研究动机

    • | 方法 | 感受野,模型权重->表征能力 | 结构输出->适用面 |
      | ---- | -------------------------- | ---------------- |
      | CNN | 局部固定 | 金字塔多尺度 |
      | ViT | 全局自适应 | 柱状单尺度 |
      | PVT | 全局自适应 | 金字塔多尺度 |
  • 关键点

    • 金字塔结构:分辨率由大到小,特征维度从小到大
    • 四段式结构:每个阶段存在独立patch 和 transformer
    • 空间压缩注意力机制:解决分辨率高导致的资源消耗大的问题
  • 如何控制每个阶段分辨率大小

    • \(H\times W\times C\to H/P\times W/P\times CP^2\to H/P\times W/P\times C'\to\mathrm{Decoder}\)
  • 如何减小高分辨率特征图上注意力算子的计算消耗

    • 空间压缩注意力层
    • 处理后复杂度仅有原先复杂度的\(1/R_i^2\)
  • 如何搭建模型结构

    • 参考ResNet模型搭建规则
      • 随层数加深特征图分辨率减小,维度加大
      • 主要计算量集中在第三层
  • 优点汇总

    • 可以输出多尺度高分辨率特征图
    • 结合纯transformer的解码器实现检测和分割

标签:24,Transformer,Pyramid,分辨率,times,2023,Vision
From: https://www.cnblogs.com/zhoulijie/p/17812845.html

相关文章

  • 2023-8-3 青少年时期求学的回忆
    2023-8-3青少年时期求学的回忆主讲人:王鼎盛中科院物理所(退休研究员)[email protected]中学时期(1951~1956)重庆市南川中学出生:重庆市南川区就读:重庆市南川中学校舍原为寺庙:建于1473年1952年创办高中部,失火后重建校舍千禧年重新修建校舍图书馆:引起对知识广泛兴趣的地......
  • 2023-8-2 从黑洞成像浅谈协作与积淀
    2023-8-2从黑洞成像浅谈协作与积淀主讲人:史生才中科院紫金山天文台M87星系中心的超大质量黑洞(65亿倍太阳质量)银河系中心黑洞照片(400万倍太阳质量)(EHT1.3mm)2020年诺贝尔物理学奖:罗杰·彭罗斯、赖因哈德·根策尔和安德烈娅·盖兹;罗杰·彭罗斯证明了黑洞是爱因斯坦广义......
  • 2023-8-1 显微成像技术的过去,现在和未来
    2023-8-1显微成像技术的过去,现在和未来主讲人:徐涛中科院生物物理所引入:显微成像技术公元前三十世纪,偶然制作出少量玻璃公元13世纪,设计出放大镜罗伯特·胡克(1635-1703)使用显微镜首次发现和定义细胞首次记录植物的形态列文虎克()制作出高倍数显微镜首次记录微生物......
  • 2023-8-24 基于机器学习的电池健康诊断技术 2023人工智能大会青年科学家论坛
    基于机器学习的电池健康诊断技术|2023人工智能大会青年科学家论坛张云蔚中山大学研究背景:电池健康诊断技术电池老化机制:电极附近形成固态电解质层影响导电性传统行为:通过经验公式模拟->通过大数据方法判断电池容量变化通过机器学习评估容量变化显示老化过程引入技术:......
  • 2023-8-24 大型语言模型的科学挑战 2023 人工智能大会青年科学家论坛
    大型语言模型的科学挑战|2023人工智能大会青年科学家论坛复旦大学邱锡鹏MOSS模型开发过程中文预训练基座(CPT,CBART)2021.9对话模型(MOSS)2023.2工具增强(MOSS-Plugin)2023.4大模型时代,自然语言处理还存在吗?graphLRG[V1]-->A1A1[输入]B1[基础模型]C1[词法分......
  • 2023-11-06 Could not find any Electron packages in devDependencies ==》没有安装E
    问题描述:electron项目安装好后,运行npmrunstart时报错。解决方案:npmielectron--save-dev推荐使用powershell终端来输入,如果你用的是vscode的终端会出现卡在加载中的情况,而前者则可以通过回车键来刷新加载状态安装完成时重新运行npmrunstart,你会看到欢迎界面: ......
  • Golang面试题从浅入深高频必刷「2023版」
    大家好,我是阳哥。专注Go语言的学习经验分享和就业辅导。Go语言特点Go语言相比C++/Java等语言是优雅且简洁的,是我最喜爱的编程语言之一,它既保留了C++的高性能,又可以像Java,Python优雅的调用三方库和管理项目,同时还有接口,自动垃圾回收和goroutine等让人拍案叫绝的设计。有许多基于......
  • 【2023-10-28】小孩看病
    20:00 应该说很多人付出比我多,他们在一线工作,有些人还付出了生命的代价,所以我的这些投入真的算不了什么,很多人头发比我白得多,我只是通过媒体的宣传,好像感受到我的工作经历。实际上更多人承受比我的压力更大,他们比我更辛苦,而且付出得更多,贡献得更多。        ......
  • 以品质打动市场,萤石网络斩获2023质量沸腾奖
    近日,有着“家居质量奥斯卡”美誉的沸腾质量奖揭晓了2023年度十月份测评获奖名单,萤石网络作为智能家居科创板上市企业,凭借着卓越的产品质量与精致的产品工艺成功斩获大奖。质量沸腾奖由中国质量认证中心担任指导单位,由沸腾质量数据主办。奖项聚焦消费痛点,以高规格的评测标准......
  • 轻松理解 Transformers (3): Feed-Forward Layer部分
    编者按:随着人工智能技术的不断发展Transformer架构已经成为了当今最为热门的话题之一。前馈层作为Transformer架构中的重要组成部分,其作用和特点备受关注。本文通过浅显易懂的语言和生活中的例子,帮助读者逐步理解Transformers中的前馈层。本文是Transformers系列的第三篇。作者的观......