首页 > 其他分享 >综合设计——多源异构数据采集与融合应用综合实践

综合设计——多源异构数据采集与融合应用综合实践

时间:2023-12-14 21:33:07浏览次数:28  
标签:异构 视频 文字 项目 音视频 轻量级 多源 综合 图片

这个项目属于哪个课程 2023数据采集与融合技术 (福州大学 - 福州大学计算机与大数据学院)
组名、项目简介 组名:你在跟我作队
项目需求:(1)音视频转文字准确性 (2)实时性 (3)多语种支持 (4)扩展性
项目目标:①搭建轻量级网站平台提供交互。②利用大模型及第三方库解析音视频及图片。③性能测试及优化
项目开展技术路线:(1)HTML/CSS/JavaScript前端编写(2)Python flask请求处理、URL路由、模板渲染,快速搭建轻量级交互式web。(3)Whisper大模型解析视频,多语言语音识别、翻译。pytesseract库及Tesseract识别引擎提取图片文字。
团队成员学号 组长:陈星宇 102102135
组员:
冯展  052101102
王剑瑜 102102113
吴钦堋 052106102
李嘉骏 102102122
戴坤松 032004111
这个项目的目标 (1)搭建轻量级网站平台。(2)输入视频网址,利用大模型解析视频,将音视频转文字,概括视频主要内容,同时获取评论,提炼观看者对视频内容看法。输入图片网址,提取图片上文字。(3)将上述处理结果通过搭建的web网页进行交互式输入输出。(4)性能测试与优化,提高转文字准确性,实时性,多语种,可扩展性和灵活性。
其他参考文献 《语音识别技术的研究与发展》
《基于深度学习的语音识别研究》
《Whisper: A Self-supervised Speech Pre-training Method》
《Large-scale Weakly Supervised Pre-training for Speech Recognition》
《Improving the Robustness of Whisper with Domain-Adaptive Training》

oGitee 文件夹链接:

码云链接

项目整体简述

项目概述
致力于打造一个简单而灵活的Web网页,用于采集需要处理的视频和图片的网址。通过运用相关第三方库和大模型技术,深入解析这些视频和图片,实现音视频转文字,音视频内容提炼,观众情感判断。同时提取图片文字,为后续的数据分析和处理提供便利。最后通过Web网页将处理结果反馈给用户,帮助他们更好地理解和利用这些视频和图片资源。
项目需求
 (1)音视频转文字准确性
 (2)实时性
 (3)多语种支持
 (4)扩展性
项目目标
 (1)搭建轻量级网站平台。
 (2)输入视频网址,利用大模型解析视频,将音视频转文字,概括视频主要内容,同时获取评论,提炼观看者对视频内容看法。输入图片网址,提取图片上文字。
 (3)将上述处理结果通过搭建的web网页进行交互式输入输出。
 (4)性能测试与优化,提高转文字准确性,实时性,多语种,可扩展性和灵活性。
技术路线
 (1)HTML/CSS/JavaScript前端编写
 (2)Python flask请求处理、URL路由、模板渲染,快速搭建轻量级交互式web。
 (3)Whisper大模型解析视频,多语言语音识别、翻译。pytesseract库及Tesseract识别引擎提取图片文字。
效果简单展示:

个人工作汇报

(1)利用pytesseract库及Tesseract识别引擎编程实现输入图片网址,提取图片文字并输出。

(2)程序测试
①网络性能测试与优化

②简单功能测试

(3)相关工作对接,文档编写

实践总结及心得体会

在此次多源异构数据采集融合实践中,我们团队遇到了技术上的挑战,如音视频的文字转换、噪声去除、情感推断分析等问题。通过不断学习和尝试,我们成功解决了这些问题。在团队协作中,我们遇到了沟通不畅、任务分配不均等问题。不过后续通过加强沟通和协作,成功解决了这些问题,提高了团队的工作效率。并且通过合理安排时间和资源,成功按时完成了项目任务。
通过参与此次音视频转文字项目,我不仅提高了自己的技能水平,还获得了许多宝贵的经验和教训。这些经验和教训将对我今后的学习工作产生积极的影响。同时,我也感谢团队成员的共同努力和协作,让我们共同完成了这个项目。最后,感谢老师的辛勤付出,实践课程圆满完结撒花!

标签:异构,视频,文字,项目,音视频,轻量级,多源,综合,图片
From: https://www.cnblogs.com/daikunsong/p/17899919.html

相关文章

  • 综合设计——多源异构数据采集与融合应用综合实践
    这个项目属于哪个课程2023数据采集与融合技术(福州大学-福州大学计算机与大数据学院)组名、项目简介组名:你在跟我作队项目需求:(1)音视频转文字准确性(2)实时性(3)多语种支持(4)扩展性项目目标:①搭建轻量级网站平台提供交互。②利用大模型及第三方库解析音视频及图......
  • 综合设计——多源异构数据采集与融合应用综合实践
    综合设计——多源异构数据采集与融合应用综合实践这个项目属于哪个课程2023数据采集与融合技术组名、项目简介组名:Double20000、项目需求:设计出一个交互友好的多源异构数据的采集与融合的小应用、项目目标:通过在网页中上传文本、图片、视频或音频分析其中的情感、项......
  • 综合设计——多源异构数据采集与融合应用综合实践
    这个项目属于哪个课程右对齐组名、项目简介单元格团队成员学号单元格这个项目目标单元格其他参考文献单元格......
  • 综合设计——多源异构数据采集与融合应用综合实践
    这个项目属于哪个课程2023数据采集与融合技术组名、项目简介组名:普雷蒙奇、项目需求:多模态情感分析、项目目标:通过在网页中搜索关键词来得到一个综合的情感分析、项目开展技术路线:前端、python、华为云平台团队成员学号102102112、102102115、102102116、102102118......
  • 综合设计——多源异构数据采集与融合应用综合实践
    这个项目属于哪个课程2023数据采集与融合技术(福州大学-福州大学计算机与大数据学院)组名、项目简介组名:你在跟我作队项目需求:(1)音视频转文字准确性(2)实时性(3)多语种支持(4)扩展性项目目标:①搭建轻量级网站平台提供交互。②利用大模型及第三方库解析音视频及图......
  • 综合设计——多源异构数据采集与融合应用综合实践
    这个项目属于哪个课程2023数据采集与融合技术组名、项目简介组名:Double20000、项目需求:设计出一个交互友好的多源异构数据的采集与融合的小应用、项目目标:通过在网页中上传文本、图片、视频或音频分析其中的情感、项目开展技术路线:前端3件套、Python、fastapi团队......
  • 软件需求与分析课堂测试十——综合案例分析
    软件需求与分析课堂测试十——综合案例分析 根据下列案例需求描述,回答相关问题:有一个对外营业的会议中心,有各种不同规格的会议室,为用户提供以下服务:1、用户可以按照会议人数、会议时间预订会议室。可以只预订1次,也可预订定期召开的会议。2、开会前允许用户修改会议时间、......
  • 软件需求与分析课堂测试十——综合案例分析(5分)
    根据下列案例需求描述,回答相关问题:有一个对外营业的会议中心,有各种不同规格的会议室,为用户提供以下服务:1、用户可以按照会议人数、会议时间预订会议室。可以只预订1次,也可预订定期召开的会议。2、开会前允许用户修改会议时间、人数,重新选择会议室,甚至取消预订的会议。3、......
  • 软件需求与分析课堂测试十——综合案例分析(5分)
    软件需求与分析课堂测试十——综合案例分析(5分) 根据下列案例需求描述,回答相关问题:有一个对外营业的会议中心,有各种不同规格的会议室,为用户提供以下服务:1、用户可以按照会议人数、会议时间预订会议室。可以只预订1次,也可预订定期召开的会议。2、开会前允许用户修改会议时......
  • 异构内存管理(HMM) 【ChatGPT】
    https://www.kernel.org/doc/html/v6.6/mm/hmm.html异构内存管理(HMM)HMM提供基础设施和辅助工具,将非常规内存(例如设备内存,如GPU板载内存)整合到常规内核路径中,其核心是为此专门设计的用于此类内存的structpage(请参见本文档的第5至7节)。HMM还提供了用于SVM(共享虚拟内存)的可选辅......