首页 > 其他分享 >我第一个开源AI小产品-video2blog即将正式发布

我第一个开源AI小产品-video2blog即将正式发布

时间:2024-04-30 14:12:20浏览次数:14  
标签:视频 AI video2blog 自己 开源 产品 字幕

前言

首先它是为了解决我自己的个人问题。不管能不能帮到你,或者对于看到的你是否有点利用价值,也没太大的关系,最起码你可以来看看我开发小产品的整个过程。

一段时间以来,我开始通过youtube平台来获取一些知识,或者打发早晚上下班坐地铁的时间。主要是我早晚通勤时间过长,差不多都是一个小时吧,单纯的刷刷什么某音、某红的真真的浪费了大量的时间,所以我选择了youtube平台。我在 youtube 看视频时,觉得有点用的信息我会截个图,方便回头查找关键字,尤其是看技术类的视频。但有时候虽然截图了,但是前后是有关联的,关联的地方当时又没截图,但是隐约的也记不起前后文的联系了,于是尴尬了,就只能重新翻看这个视频了。因为我遇到过好多次了,而且比较浪费时间。 于是就有了video2blog。

video2blog的开发历程

通过视频链接结合AI的能力,将整个视频转换为一篇图文笔记或者图文博客。图文最大的好处就是方便我自己回看,就像小时候我们自己的错题笔记。

image 从3月底附近我就在琢磨我这个小产品了,但当时的思路还没有打开,但是脑海中已经有了初步的设想。从那时起代码就已经开始了,因为要开发一个pc的客户端,也有很多的技术没有使用过,需要投入时间去研究一番。说真的还是有点小兴致,毕竟是解决自己的痛点的。

image 刚好4月初跟随清明节一起请了三天假,玩完回来状态也非常的nice,那一周真的是疯狂的码码查bug,也慢慢的有了上图的自我感觉的清晰思路。 目前按照上图基本上跑通了。但是很多功能还非常不完善或者还没有加进来。比如视频通过whisper来转字幕目前通过python实验成功,但没加入到项目中,再比如对接AI的字幕转长文功能也没真正落地。这些都可以通过其他的工具来实现,所以暂时就先搁置一下,解决我觉得更重要的问题了。

image 我只能说一周的时间真的太短了,因为平常还有别的项目在搞,上班的时候只能抽点时间来看看查查问题,优化下思路等等,更多的时候也在思考吧。有几天真的也不太想上班了。

image 每周实现的功能也不多,但紧紧把把的能基本按照自己的预想在走,有时候一天的问题解决不了,我就担心这进度要慢了,明天得抓紧时间了。

image 这里我之前也在3月底的时候留过记录。我自己的期待也是争取5月底能有一个比较好的版本出来。就是提前尽量给自己做好计划目标,哪怕没完成,没达到预期,也能在自己复盘的时候找到问题,或者能总结出一些经验教训。

现状

video2blog.excalidraw
video2blog.excalidraw

通过这个图便可以简单的看到我整个小产品的流程走向,其实现在看来流程清晰,思路也是比较简单粗暴的。 当然了也有其他更好的使用模式。这里暂时针对我自己算是现阶段对我来说是一个比较好的模式选择了。

我的小产品现阶段借助外部的AI工具是可以走通的。比如可以借助Whisper模型进行语音转文字,或者直接通过它来翻译。 如果有字幕,字幕刚好是英文,也可以通过AI工具进行翻译为中文。翻译为中文后,再通过AI工具转换为文章或者叫笔记。 转换为文章的时候对prompt是有要求的,转换的时候要添加上目录,并且在目录上添加上视频中的时间区间,这样方便我根据时间区间来获取图片并去除重复的图片,然后选择插入到文章中。

最后

现在预发布这个小产品也算是对我自己,这一个多月时间的阶段性总结。也是对我自己的一个小小的挑战。因为从来也没有进行过对外发布一个属于自己的小产品,这也算是一次小小的尝试。 很多时候有了想法,那就去做做试试看吧,也许其中有非常多的困难,但是只有去做了才知道,这些个小困难在一天天的排解中,慢慢的也不算是个什么困难了。 也许这个小产品并不是很完美,但最起码我自己能够慢慢的用起来了。

如果你觉得小工具还有点意思,便可以提前来玩一下看看。如果有什么问题,也可以随时联系我。 目前支持window和mac,在我自己的电脑上安装尝试都没有问题的。当然可能会有兼容性的问题,毕竟第一次尝试搞一个跨平台的客户端。

image
image

我创建了一个video2blog的微信群。

可以关注我的公众号:那个曾经的少年回来了

然后后台发送消息: video2blog。

由于项目还没真正的成型发布,所以暂时就不将开源地址放出来了。因为暂时也是堆叠功能代码,主要以实现功能为主。争取5月底正式发布第一个完整的版本。
最后如果产品思路对你有价值,你也可以快速复刻一个。

标签:视频,AI,video2blog,自己,开源,产品,字幕
From: https://www.cnblogs.com/aehyok/p/18167928

相关文章

  • 开源的快速开发平台:让企业实现降本增效!
    在快速发展的社会中,竞争越来越激烈,发展速度也越来越快。随着社会的进步和发展,数字化转型和流程化办公早已成为发展趋势和潮流。如何实现数字化转型?如何让企业获得降本增效的发展目标?流辰信息专业研发开源的快速开发平台产品,为客户提供集产品、框架定制、产品交付为一体的一站式技......
  • Python-与-TensorFlow2-生成式-AI(五)
    Python与TensorFlow2生成式AI(五)原文:zh.annas-archive.org/md5/d06d282ea0d9c23c57f0ce31225acf76译者:飞龙协议:CCBY-NC-SA4.0第十二章:用生成式人工智能玩视频游戏:GAIL在之前的章节中,我们已经看到如何使用生成式人工智能来生成简单的(受限玻尔兹曼机器)和复杂的(变分自动......
  • 2024 开源数据工程生态系统全景图
    2024开源数据工程生态系统全景图(转)简介​ 虽然生成式人工智能和ChatGPT带来的沸沸扬扬的炒作令科技界为之一振,但在数据工程领域,2023年仍然是一个令人振奋和充满活力的一年,数据工程生态系统变得更加多样化和复杂化,系统中的所有层面都在不断创新和演进。​ 随着各种开源工具、......
  • 蓝鲸6.1 CMDB 事件推送的开源替代方案
    本文来自腾讯蓝鲸智云社区用户:木讷大叔爱运维背景在蓝鲸社区“社区问答”帖子中发现这么一个需求:究其原因,我在《不是CMDB筑高墙,运维需要一定的开发能力!》一文中已经介绍,在此我再简单重复下:蓝鲸5.1自带“事件推送”功能,当配置信息发生变化的时候,实时通知到关联的系统中;蓝......
  • MATLAB运行simulink模型显示找不到库Failed to load library
    MATLAB运行simulink模型显示找不到库Failedtoloadlibrary‘原因上述的错误即提示加载某一个库失败了,原因就是MATLAB需要在其设定的setpath中寻找。设置paths查看paths添加成功后再次打开MATLAB的setpath,可以看到相关文件及库被添加进来了。点击save进行保存,重新运......
  • 高德Signature verification failed
    记录一个高德API的问题: 最近业务需求需要调用高德API,遇到了返回签名错误的问题,但其他API是可以调用通的,经过问题排查,发现是参数类型错误,修改之后成功调用。高德返回code4签名错误问题时:1.可能真的是你签名错误2.你的参数格式类型错误(个人感觉是个bug,因为文档错误码上一个......
  • AI助力后厨可视化智慧监管,让“舌尖安全”看得见
    一、背景与需求分析夏天是食物易腐败的季节,高温容易引发食品安全问题。在后厨环境中,食品安全问题可能涉及食品加工、后厨环境、食品是否被污染等方面,而不合格的食品安全管理可能导致食品中毒事件等风险,损害消费者的健康和餐厅的声誉。在这样的背景下,越来越多的餐厅管理者意识到......
  • C#托盘图标动画效果 - 开源研究系列文章
          这次在编写一个CPU使用率的小应用,上次发布了获取CPU使用率的代码,这次研究的是托盘图标的动画效果的问题。      托盘图标的动画效果,其实是多个图标,然后在时间内进行切换显示,形成的动画效果。这里笔者推荐两种方法:1、Timer计时器方法;就是设置一个T......
  • 用Mermaid画流程图、序列图、类图、甘特图
    左手编程,右手年华。大家好,我是一点,关注我,带你走入编程的世界。公众号:一点sir,关注领取编程资料Mermaid简介Mermaid是一种基于文本的图表定义语言,它允许开发者使用文本和代码的形式来创建图表。这种语言的设计初衷是为了方便版本控制和多人协作,同时简化图表的维护和更新过程。......
  • Windows开源输入法 - RIME输入法
    前言#上一篇文章介绍了Windows下的包管理器,本文继续介绍输入法。事实上Windows的输入法生态比Linux/Mac丰富很多,不过很多国产输入法存在窃取隐私、植入广告、乱安装流氓软件等问题,现在有开源的RIME输入法可以选择,何必受这气呢......