首页 > 其他分享 >【双语字幕】CMU-多模态机器学习

【双语字幕】CMU-多模态机器学习

时间:2023-06-23 13:08:41浏览次数:52  
标签:模态 视频 双语 学习 MMML 字幕 课程 CMU


【双语字幕】CMU-多模态机器学习_模态

课程描述

    多模态机器学习(MMML)是一个充满活力的多学科研究领域,它通过集成和建模多种交流模式(包括语言、声音和视觉信息)来解决人工智能的一些基础问题。随着对视听语音识别的初步研究,以及最近对图像和视频字幕等语言和视觉项目的研究,这一研究领域给多模态研究人员带来了一些独特的挑战,因为数据具有异质性,模态之间往往存在偶然性。本课程将教授与MMML相关的基本数学概念,包括多模态对齐和融合、异构表示学习和多数据流时间建模。我们还将回顾最近描述MMML最先进的概率模型和计算算法的论文,并讨论当前和未来的挑战。

    本课程将介绍与多模态机器学习的五个主要挑战相关的机器学习和深度学习的基本数学概念:(1)多模态表示学习,(2)翻译和映射,(3)模态对齐,(4)多模态融合和(5)协同学习。这些包括但不限于多模态自动编码器、深度典型相关分析、多核学习、注意力模型和多模态递归神经网络。本课程还将讨论MMML最近的许多应用,包括多模态情感识别、图像和视频字幕以及跨模态多媒体检索。

     文末附本课程视频及ppt下载地址。

课程首页

https://cmu-multicomp-lab.github.io/mmml-course/fall2020/

课程大纲

【双语字幕】CMU-多模态机器学习_人工智能_02

课程视频截图

【双语字幕】CMU-多模态机器学习_模态_03

【双语字幕】CMU-多模态机器学习_人工智能_04

【双语字幕】CMU-多模态机器学习_自然语言处理_05

【双语字幕】CMU-多模态机器学习_深度学习_06

【双语字幕】CMU-多模态机器学习_模态_07

课程视频及ppt免费下载地址

    微信公众号“深度学习与NLP”回复关键字“dmtml”获取下载地址。


标签:模态,视频,双语,学习,MMML,字幕,课程,CMU
From: https://blog.51cto.com/u_13046751/6537795

相关文章

  • 双语斯坦福CS224W-图机器学习
    课程描述这门课是关于什么的?复杂的数据可以表示为对象之间的关系图。这种网络是社会、技术和生物系统建模的基本工具。本课程着重于大量图形分析的计算、算法和建模挑战。通过研究底层的图结构及其特征,学生们学习机器学习技术和数据挖掘工具,这些工具能够揭示各种网络的底层知识。主......
  • 双语麻省理工-自然语言处理进阶
    课程描述    自然语言处理是如何教计算机理解人类语言的工程艺术和科学。自然语言处理是一种人工智能技术,现在它无处不在—自然语言处理让我们可以和手机通话,使用网络回答问题,在书籍和社交媒体中规划讨论,甚至在人类语言之间进行翻译。由于语言丰富、模棱两可,而且对计算机来......
  • CMUX串口多路复用协议
    CMUX1.简介CMUX(ConnectionMultiplexing),即连接(串口)多路复用,其功能主要在一个真实的物理通道上虚拟多个通道,每个虚拟通道上的连接和数据通讯可独立进行。CMUX软件包常用于蜂窝模块串口复用功能(PPP+AT模式),以及串口硬件资源受限的设备。CMUX软件包特点如下:支持通过真实......
  • CMU15445 (Fall 2020) 数据库系统 Project#4 - Concurrency Control 详解
    前言一个合格的事务处理系统,应该具备四个性质:原子性(atomicity)、一致性(consistency)、隔离性(isolation)和持久性(durability)。隔离性保证了一个活跃的事务(还没提交或者回滚)对数据库所做的系统对于其他的活跃事务是不可见的,看起来就像某一时刻就只有一个事务在操作数据库。然而完美的......
  • A stochastic parrot in every pot 每口锅里都会有一只随机鹦鹉? | 经济学人社论双语精
    2023年5月13日周报社论:《人工智能经济学》(TheeconomicsofAI)Astochasticparrotineverypot?每口锅里都会有一只随机鹦鹉?WhatdoesaleakedGooglememorevealaboutthefutureofAI?一份泄露的谷歌备忘录揭示了人工智能怎样的未来?Open-sourceAIisbooming.Thatmakes......
  • The baby-bust economy “婴儿荒”经济 | 经济学人20230603版社论双语精翻
    2023年6月3日《经济学人》(TheEconomist)封面文章暨社论(Leaders)精选:《“婴儿荒”经济》(“Thebaby-busteconomy”)。baby-bust即“婴儿荒”(生育低谷),与历史上1946~1964年间著名的baby-boom即“婴儿潮”(生育高峰)相对立。Thebaby-busteconomy“婴儿荒”经济Globalfertilityhascoll......
  • CMU15445 (Fall 2020) 数据库系统 Project#3 - Query Execution 详解
    前言经过前两个实验的铺垫,终于到了执行SQL语句的时候了。这篇博客将会介绍SQL执行计划实验的实现过程,下面进入正题。总体架构一条SQL查询的处理流程如下为:SQL被Parser解析为抽象语法树ASTBinber将AST转换为Bustub可以理解的更高级的ASTTreerewriter将语法......
  • 直播源码搭建平台技术知识:实时语音识别字幕呈现功能
     今天我要分享的直播源码搭建平台技术知识对我们的生活有着极大的帮助,那他是什么技术那?且听我娓娓道来。在日常生活中,大家有没有在嘈杂的地方刷过抖音、快手等短视频而又因为听不清声音而感到苦恼,或是在网络会议和网课老师说的太快听不清而感到焦虑?大部分人可能都会有这些问题,也......
  • CMU15-445 Project3 Query Execution心得
    Project3QueryExecution心得一、概述首先要说:这个project很有趣很硬核!从这个project开始才感觉自己在数据库方面真正成长了!第一个project:bufferpoolmanager相对独立且简单,说白了就是使用LRU-K算法维护一个page数组,2022fall又加了一点内容:使用可扩展哈希来将对......
  • CMU15445 (Fall 2020) 数据库系统 Project#2 - B+ Tree 详解(上篇)
    前言考虑到B+树较为复杂,CMU15-445将B+树实验拆成了两部分,这篇博客将介绍Checkpoint#1部分的实现过程,搭配教材《DataBaseSystemConcepts》食用更佳。B+树索引许多查询只涉及文件中的少量记录,例如“找出物理系所有教师”的查询就只涉及教师记录中的一小部分,如果数据库......