首页 > 其他分享 >CSIG青年科学家会议干货分享:视觉内容安全技术的前沿进展与应用

CSIG青年科学家会议干货分享:视觉内容安全技术的前沿进展与应用

时间:2024-12-25 17:29:33浏览次数:3  
标签:检测 技术 安全 干货 CSIG 图像 篡改 视觉 前沿

CSIG青年科学家会议干货分享:视觉内容安全技术的前沿进展与应用

在这里插入图片描述

1. 前言

近期,第二十届中国图象图形学学会(CSIG)青年科学家会议于杭州正式开幕。中国图象图形学学会理事长王耀南院士,浙江大学副校长陈刚教授出席并致辞。大会主席浙江大学周昆教授主持开幕式。

会议由中国图象图形学学会主办,浙江大学计算机科学与技术学院、浙江大学计算机辅助设计与图形系统全国重点实验室、杭州全息智能技术研究院、中国图象图形学学会青年工作委员会承办。湖南大学王耀南院士、浙江大学陈刚副校长、浙江大学周昆教授、中国科学院自动化研究所王亮研究员共同担任大会主席。本次会议是中国图像图形学领域的重要会议,已经列入中国科协的重要会议指南。在这里插入图片描述

2. 视觉内容安全技术的前沿进展与应用

本篇文章,我给大家分享下大会上一个干货,主题是《视觉内容安全技术的前沿进展与应用》,该主题由合合信息图像算法研发总监郭丰俊老师分享,他同时也是上海市图像图形学会的理事,专注于文字识别与图像处理领域。听完这场分享之后,对当前视觉安全领域的发展现在和最新研究进展有了一个非常清晰的认识,所以迫不急期待的地想分享给大家。

2.1 日渐增多的视觉安全需求

在这里插入图片描述

随着AI技术的发展和黑灰产利益的冲击,市面上出现了非常多的图像数据篡改案例。比较常见的有发票信息篡改医疗票据金额篡改身份证日期信息篡改医疗检查报告日期信息篡改等。

有效的视觉安全技术,不仅能够识别和防范篡改行为,还能够:

  1. 通过身份识别安全性认证确保个人和企业的身份信息真实可靠,防止身份欺诈。比如实名认证的自动化和合法性验证。
  2. 通过确保交易和票据的真实性来保护企业的经济利益不受篡改行为的侵害,比如可以避免票据造假给保险公司带来的恶意骗保问题。

2.2 视觉内容安全技术分类

在这里插入图片描述
在视觉内容安全技术领域,尤其是被动检测方面,郭丰俊老师带领团队在积极推进图像篡改和人脸伪造检测技术,并且在篡改图像检测方面较早的推出了篡改检测平台,支持文字、证件以及人脸伪造等多种类型。

在国内,还有一些其他的厂商也做了一些包括大模型安全方案,包括证照伪造检测、AIGC检测、PS篡改检测等。国外方面,Intel、微软和亚马逊等团队也在人脸检测方面进行了投入,并取得了一定的成果。

2.3 通用篡改检测系统及人脸伪造检测系统

在这里插入图片描述
基于强大的视觉内容安全技术积累,合合信息对外发布了通用篡改检测系统,支持证照、证书、票据等的检测,适用于证券、银行、零售等行业。
在这里插入图片描述
此外,还根据用户需求,推出了人脸伪造检测系统,已在某央企标杆银行的生产流程中应用,主要提供AIGC图片检测和人脸PS检测等能力,目前系统运行良好。

2.4 文档图像篡改检测成果

在这里插入图片描述

近年来,学术界对文字图像伪造检测的关注逐渐增加,合合信息作为较早涉足此领域的先驱之一,应对相关需求展开了研究。在近两年的两项重要比赛中取得显著成绩:ICDR比赛中获得篡改文档检测比赛第一名世界互联网大会的AI攻防挑战赛金融场景凭证篡改检测比赛中再次夺冠,展示了合合信息在文字图像伪造检测领域的领先技术与成果。

2.5 文本图像篡改检测技术的标准制定

在图像篡改检测领域,存在跨域问题、背景纯色下的篡改识别、图像质量降低、误检率和检出率等挑战。这些挑战对实际落地系统的知识成本、维护成本以及交付周期有显著影响。为解决这些挑战,合合信息于2024年10月,与中国信通院、中国图象图形学学会、中国科学技术大学
等在内的多个高校和机构合作编制了《文本图像篡改检测系统技术要求》,标准围绕伪造图像鉴别、生成式图像判别等议题,凝聚了行业共识,以促进该技术的稳定落地和广泛应用。

在这里插入图片描述

2.6 视觉内容安全技术趋势及挑战

在这里插入图片描述
当前,在视觉内容安全领域,需求主要集中在伪造图像检测、人脸伪造检测和声音篡改检测等方面。技术方面,可以基于VIT和频率特征的图像篡改检测方法,以及通过纹理抖动和学习图像特征差异来提高泛化能力的方法。这些技术旨在检测视觉痕迹微弱的篡改和提升对未知数据类型的适应能力。

但是,图像内容安全的进一步发展,同样也面临很多挑战。主要体现在如下几方面:

  1. 易受攻击:如缩放,传输过程可能导致性能下降
  2. 泛化能力待提高:在特定场景和数据集上表现优异,但面对未
    知的伪造手段或多样化的应用场景时,常常无法保持较高的检
    测精度。
  3. 伪造手段变化快,维护成本高
  4. 数据获取与标注成本高昂:要求高质量标注,涉及隐私保护,
    进一步增加了获取难度

2.7 基于大模型技术的技术探索

在这里插入图片描述

随着视觉内容安全问题的挑战日益严峻,合合信息和业界同行们都在积极探索,利用大模型提升系统性能,突破挑战。

为什么考虑选用大模型的方案呢?主要因为如下几方面:

  1. 大模型可以利用多模态信息,整合图像、语言和动态信息,提高检测准确率。
  2. 可以把多场景、多类别信息统一到一个架构中,从而提升系统的易用性和交付效率。
  3. 借助大模型强大的泛化能力,尽可能的兼容未见过的新类别内容,提高识别率。
  4. 通过大模型,可以方便的把知识注入到系统里面去。能够更快捷的来迭代这个系统,以应对伪造手段的快速变化。 在这里插入图片描述

3. 总结

作为一个对人工智能领域有所关注的听众,听完郭丰俊老师的报告,我对视觉安全技术的重要性和它在现代社会中的应用有了非常深刻的认识。

报告中提到的伪造图像问题,尤其是在人脸、票据和证件方面的应用,让我意识到了这一问题对个人隐私和公共安全可能带来的威胁。

我也联系到实际生活中的很多应用场景存在漏洞风险,比如前段时间我提交商业保险报销所用的电子病历和电子发票,就非常容易造假,给保险公司带来资损,如果能够通过视觉内容安全方案进行甄别,很大程度上可以减少骗保的发生。

期待看到视觉内容安全领域技术在大模型的助力下,能够进一步发展,以更好地服务于社会,保护我们免受伪造内容的侵害。

有奖问卷

标签:检测,技术,安全,干货,CSIG,图像,篡改,视觉,前沿
From: https://blog.csdn.net/g310773517/article/details/144569320

相关文章

  • C#/.NET/.NET Core技术前沿周刊 | 第 18 期(2024年12.16-12.22)
    前言C#/.NET/.NETCore技术前沿周刊,你的每周技术指南针!记录、追踪C#/.NET/.NETCore领域、生态的每周最新、最实用、最有价值的技术文章、社区动态、优质项目和学习资源等。让你时刻站在技术前沿,助力技术成长与视野拓宽。欢迎投稿、推荐或自荐优质文章、项目、学习资源等。......
  • 【EI会议推荐】抢先掌握学术前沿!快来参加EI学术会议投稿,展示你的研究成果,开启科研新高
    抢先掌握学术前沿用处【研究生必备|学术会议|高录用|见刊后1个月检索】第三届材料科学与智能制造国际学术会议(MSIM2025)【研究生必备|学术会议|ACM独立出版|快检索|海外高校联合主办】第二届信息化教育与计算机技术国际学术会议(IECA2025)用处学术交流参加学术会......
  • 2024 年医疗 AI 突破盘点,精选 35 篇不可错过的前沿论文
    过去几年,以英伟达、谷歌为首的科技巨头纷纷表达对AI医疗的重视,近千亿元资金被砸进该赛道,医疗领域也成为AI应用最广、成效最明显的领域之一。在即将过去的2024年期间,研究人员们构建医学大模型,用AI分割医学图像/视频、诊断糖尿病、帕金森病、乳腺癌、肺癌、卵巢癌、......
  • 合合信息在视觉内容安全领域的创新与应用-应对伪造挑战的前沿进展
    引言2024年,中国图象图形学学会青年科学家会议上,上海合合信息科技股份有限公司的图像算法研发总监郭丰俊博士围绕“视觉内容安全技术的前沿进展与应用”进行了主题分享。随着人工智能(AI)技术的迅猛发展,尤其是深度学习和生成对抗网络(GANs)等技术的成熟,视觉内容伪造技术日趋复杂......
  • 融云IM干货丨如何在pages.json中设置不同平台的导航栏?
    在`pages.json`中,你可以通过条件编译来为不同平台设置不同的导航栏样式。条件编译允许你根据不同的平台编写特定的配置代码。以下是如何在`pages.json`中为不同平台设置导航栏的示例:```json{ "pages":[  {   "path":"pages/index/index",   "sty......
  • 融云IM干货丨pages.json 文件用来对 uni-app 进行全局配置
    在uni-app中,`pages.json`文件是一个非常重要的配置文件,它用于定义应用中的页面路径、窗口表现以及全局配置等。以下是`pages.json`文件的一些关键配置项和它们的作用:1.**pages**:  -这个数组定义了应用中的所有页面路径,每个对象代表一个页面。数组中的每个对象至少包含......
  • 智慧医疗挂号前沿:SSM+Vue 医院预约挂号系统设计与突破
    4系统概要设计4.1概述本系统采用B/S结构(Browser/Server,浏览器/服务器结构)和基于Web服务两种模式,是一个适用于Internet环境下的模型结构。只要用户能连上Internet,便可以在任何时间、任何地点使用。系统工作原理图如图4-1所示:图4-1系统工作原理图4.2系统结构本系统......
  • 合合信息亮相CSIG AI可信论坛,全面拆解AI视觉内容安全的“终极防线”
    合合信息亮相CSIGAI可信论坛,全面拆解视觉内容安全的“终极防线”!......
  • 软件测试工程师进阶之路:从基础夯实到前沿创新与团队引领
    一、基础阶段编程语言学习选择一种编程语言深入学习,如JAVA或Python。学习其基础语法、数据类型、控制结构、函数与模块等。例如通过在线教程、相关书籍进行系统学习,同时进行大量的代码练习,如编写简单的数学计算程序、数据处理程序等,以巩固所学知识,培养良好的编程习惯。......
  • C#/.NET/.NET Core技术前沿周刊 | 第 17 期(2024年12.09-12.15)
    前言C#/.NET/.NETCore技术前沿周刊,你的每周技术指南针!记录、追踪C#/.NET/.NETCore领域、生态的每周最新、最实用、最有价值的技术文章、社区动态、优质项目和学习资源等。让你时刻站在技术前沿,助力技术成长与视野拓宽。欢迎投稿、推荐或自荐优质文章、项目、学习资源等......