香港中文大学多媒体实验室——人工智能与计算机视觉的创新引擎

时间：2023-07-26 15:34:25浏览次数：59

原创 | 文 BFT机器人

香港中文大学多媒体实验室——人工智能与计算机视觉的创新引擎_人工智能

01 引言

香港中文大学多媒体实验室（MultimediaLaboratory）成立于2001年7月，是香港中文大学信息工程学系的重要组成部分。该实验室由汤晓鸥教授执导，是最早应用深度学习进行计算机视觉研究的华人团队之一。因其卓越的贡献，该实验室被誉为“计算机视觉界的黄埔军校”。

香港中文大学多媒体实验室——人工智能与计算机视觉的创新引擎_人脸识别_02

02 人脸识别技术的“开拓者”和探路者——汤晓鸥

汤晓鸥于1990年获中国科学技术大学工学学士学位，并在1991年获罗彻斯特大学工程及应用科学学院理学硕士学位。随后，于1996在麻省理工学院获得博士学位，并在攻读博士学位期间开始了对人工智能领域的研究。

汤晓鸥通过一系列杰出的研究成果，逐渐在人工智能，尤其是人脸识别技术领域建立了自己的声誉和地位。在2009年获得了计算机视觉与模式识别国际会议（CVPR）的最佳论文奖，这是亚洲学者首次获得该奖项。

03 人脸识别技术——DeepID

MMLab的研究范围广泛，涵盖了计算机视觉、多媒体处理和机器学习等多个方面。2014年，汤晓鸥教授团队公开自主研发的DeepID系列人脸识别算法，准确率超过DeepFace算法，是全球首次超过人眼识别准确率的计算机视觉算法。据公开文献报道，DeepID 系列人脸识别算法准确率达到 98.52%。

香港中文大学多媒体实验室——人工智能与计算机视觉的创新引擎_计算机视觉_03

与传统的人脸识别算法相比，DeepID算法能够学习到更高层次的抽象特征，从而提高了人脸识别的准确性和鲁棒性。DeepID算法的训练过程包括两个关键步骤：多任务学习和三元组损失函数。在多任务学习中，算法同时学习人脸识别和性别分类两个任务，通过共享网络层的方式提取共享特征。这样可以使得网络学习到更具判别性的特征表示。

lDeepID算法的提出对于人脸识别技术的发展具有重要意义。它为人脸识别领域的研究和应用提供了新的思路和方法，推动了该领域的进一步发展。该算法的成功也证明了深度学习在人脸识别任务中的巨大潜力，并为后续的研究和创新奠定了基础。

04 人工智能与计算机视觉研究先锋

自成立以来，MMLab一直专注于计算机视觉与多媒体技术的研究，并积极开展相关研究项目。这些项目包括基于图像识别的智能安防系统、虚拟现实技术在教育领域的应用以及视频内容分析等。同时，实验室还为该领域的研究者提供了一个良好的交流平台，定期组织国际学术会议、研讨会等活动。

MMLab一直活跃在人工智能，在计算机视觉和深度学习的方面作出重要贡献。他们的研究成果在国际上得到了广泛的认可和重视。MMLab在多个顶级国际学术会议和期刊上发表了数十篇高水平的论文，包括CVPR、ICCV、ECCV、NeurIPS等。此外，他们还在ImageNet、ActivityNet、COCO、NITRE等计算机视觉的主要国际比赛上多次获得冠军。

如今，MMLab实验室已经成为国际上具有重要影响力的计算机视觉与多媒体技术研究机构之一。在2016年，MMLab与麻省理工学院、斯坦福大学等著名大学一同入选世界十大人工智能先锋实验室。MMLab也将继续致力于推动计算机视觉与多媒体技术的发展，为人工智能领域的进步做出更多贡献。

香港中文大学多媒体实验室——人工智能与计算机视觉的创新引擎_人脸识别_04

作者 | 小河

排版 | 居居手

更多精彩内容请关注公众号：BFT机器人

本文为原创文章，版权归BFT机器人所有，如需转载请与我们联系。若您对该文章内容有任何疑问，请与我们联系，将及时回应。

标签：香港中文大学,MMLab,人脸识别,多媒体,计算机,人工智能,算法,视觉
From： https://blog.51cto.com/bftrobot/6856552

机器学习实战(01)-人工智能概要
1发展历程20世纪50年代:人工智能概念诞生1956年,“人工智能”这个术语由麦卡锡在达特茅斯会议上首次提出主要研究逻辑和推理,以及如何在机器上模拟人类智能20世纪60年代:知识表达期开始研究知识表达,使用谓词逻辑来表达知识开发可以解题的专家系统,例如Dendral专家系统20世纪70年......
【ChatGPT】AI 人工智能能让你成为更聪明的程序员吗？
目录......
饮冰三年-人工智能-Django淘宝拾遗-85-常用的Python格式化工具
Python代码格式化对于团队协作、代码质量、错误预防以及与Python社区的契合都具有重要意义。好的代码格式化不仅是一种编码规范，更是一种良好的编码习惯，有助于提高整个项目的质量和可维护性。在团队中，可能有不同的编码规范和自定义的格式化规则。尽管有一些格式......
ChatGPT：人工智能交互的未来之光
一、ChatGPT：开启自然语言交流新纪元ChatGPT是基于GPT（生成式预训练）技术的最新版本，它采用深度学习模型，通过在大规模文本数据上的预训练来理解自然语言，并生成具有连贯性和合理性的回复。ChatGPT是一种通用的人工智能模型，能够在各种领域展现出卓越的表现，如智能客服、内容创作、教育......
上海科技大学智能生活组齐聚合合信息，“沉浸式”体验人工智能产品
近期，上海科技大学组织本科生产业实践-校企联合人才培养活动，30余名学生组成的“智能生活组”实地参访人工智能及大数据科技企业上海合合信息科技股份有限公司（简称“合合信息”）。本次活动旨在通过项目体验、主题交流，加深学生对于研究方向的专业认知，充分理解市场需求，达成学以致用的目......
2023.29 人工智能的发展特征
今年以来，人工智能又热了起来，发展有以下几个特征:涌现出很多大模型，它们使用大量数据集进行训练，所以称它们为大型语言模型(LLM)。这些模型是生成式的。这意味着他们可以创建新内容，无论是文本、图像、声音、视频、3D对象，甚至是计算机代码。这是相较于旧人工智能模型的一个进步，旧的......
读数据压缩入门笔记09_多媒体数据压缩
1. 压缩分类1.1. 多媒体数据压缩（media-specificcompression）1.2. 通用压缩（generalpurposecompression）2. 有损压缩算法2.1. 为了使数据压缩得更小，可以牺牲多媒体的质量这样的数据转换2.2. 针对特定的多媒体文件2.2.1. 针对图像文件的算法就不太适用于音频文件2.3.......
【专题】展望人工智能银行：当银行遇到AI报告PDF合集分享（附原数据表）
报告链接：http://tecdat.cn/?p=32210在2016年，AlphaGo机器人打败了18届世界棋王李世石，成为了世界棋坛上最伟大的人物。阅读原文，获取专题报告全文，解锁154份文末人工智能银行相关报告。围棋是一种非常复杂的棋类，它要求有很强的直觉，想像力和策略性的思考，而这一切在很长一段时间里都......
行行AI人才直播第11期：墨尔本大学数据科学高级讲师-宫明明《机器学习：从统计到因果，人工
行行AI人才是博客园和顺顺智慧共同运营的AI行业人才全生命周期服务平台。马克斯·普朗克智能系统中心主任曾在国际数学家大会进行了题为FromStatisticaltoCausalLearning的报告，建立和理解人工智能系统的基本研究思路：从通过统计学习的符号方法到依靠因果关系概念的干预模......
王炸福利！天花板！！（安卓+Win+MAC）GPT中文版AIchat非常强大的AI人工智能助手！
AIchat是一款非常强大的AI人工智能助手，它可以解决我们所有的疑问问题，还可以根据我们的需求自动写论文、写小说、写代码、写文案等等，同时还可以扮演任何角色对我们进行提问，还可以讲故事、陪聊天，还可以对我们提供建议，几乎无所不能，谁用谁爽！软件使用非常简单，如下图所示，在软件主页中......

香港中文大学多媒体实验室——人工智能与计算机视觉的创新引擎

01

引言

02

人脸识别技术的“开拓者”和探路者——汤晓鸥

03

人脸识别技术——DeepID

04

人工智能与计算机视觉研究先锋

相关文章

赞助商

阅读排行