• 2024-11-04chrome语音文本互转
    随着浏览器技术发展,chrome越来越强大。可以实现越来越多的系统级功能,例如:文件操作、剪切板、支付、NFC、通知、WASM、XR(VR、AR)、串口、蓝牙、语音合成、AI等(可参考FUGU项目)在以前想要实现语音文本互转功能,基本都是接入第三方服务(例如讯飞、百度等)。这种方式优点是,提供各种定制化
  • 2024-11-04Ei数据库检索证明开具
    Pre:以EI收录的会议论文为例。1.进入Ei数据库https://www.engineeringvillage.com/home.url?redir=t点击Checkaccess进入登陆(需要学校等组织认证访问)2.输入需要开具检索的论文Title3.找到你的论文(以kaiming大神的ResNet为例)导出为PDF文件即可。参考He,Kaiming,et
  • 2024-10-25FunAudioLLM/SenseVoice
    Skiptocontent NavigationMenu Product Solutions Resources OpenSource Enterprise Pricing  SigninSignup  FunAudioLLM/SenseVoicePublicNotificationsFork 292 Star 3.2k CodeIssues64Pullr
  • 2024-10-16funasr
    funasrhttps://www.funasr.com/#/https://github.com/modelscope/FunASRAFundamentalEnd-to-EndSpeechRecognitionToolkitandOpenSourceSOTAPretrainedModels,SupportingSpeechRecognition,VoiceActivityDetection,TextPost-processingetc.FunASRho
  • 2024-10-12人脸识别调研
    项目列表开源项目语言/环境准确率(onLabeledFacesintheWild)备注ageitgey/face_recognitionPython,Dlib99.38%DocsDFacePython  facenetTensorFlow99.2%https://mp.weixin.qq.com/s/1kgbYScIujSjCRvfPGw0tgV
  • 2024-09-14纯前端实现语音文字互转
            在现代互联网的发展中,语音技术正逐渐成为改变用户体验的重要一环。WebSpeechAPI的引入使得开发者能够在浏览器中轻松实现语音识别和语音合成功能,为用户带来更加直观和便捷的操作体验。本文将介绍WebSpeechAPI的基本概念、功能特性以及如何利用它来构建
  • 2024-09-14.NET 开源的功能强大的人脸识别 API
    前言人工智能时代,人脸识别技术已成为安全验证、身份识别和用户交互的关键工具。给大家推荐一款.NET开源提供了强大的人脸识别API,工具不仅易于集成,还具备高效处理能力。本文将介绍一款如何利用这些API,为我们的项目添加智能识别的亮点。项目介绍GitHub上拥有1.2k星标的C#
  • 2024-09-09解锁Python中的人脸识别:Face Recognition库详解与应用
    在当今的人工智能时代,人脸识别技术已经成为了计算机视觉领域的一项重要应用。无论是在安全监控、社交媒体还是智能设备中,人脸识别都扮演着不可或缺的角色。在众多的人脸识别工具和库中,Python的FaceRecognition库以其简单易用和高效性而备受青睐。本文将深入探讨FaceRecogniti
  • 2024-09-07Python 语音识别
    STT(SpeechToText)语音转文本17.2.1. SpeechRecognitionhttps://github.com/Uberi/speech_recognition17.2.1.1. 安装 pipinstallSpeechRecognition 麦克风相关 brewinstallportaudiopipinstallpyaudio 运行下面命令授权访问麦克风
  • 2024-08-31基于Python的人脸识别考勤管理系统-计算机毕业设计源码+LW文档
    摘要随着信息技术的迅猛发展,面部识别技术已逐渐成为身份验证领域的研究热点。基于Python的人脸识别考勤管理系统,作为一种新兴的身份验证方式,具有重要的研究意义和应用价值。该系统通过捕捉和分析人脸特征,实现快速、准确的身份验证,解决了传统考勤方式中可能存在的冒用、伪造等问题
  • 2024-08-28Python基于dlib的人脸识别的上课考勤管理系统,附源码
    Python基于dlib的人脸识别的上课考勤管理系统,附源码1简介Python基于Django的人脸识别的上课考勤系统,是基于Python开发的,采用dlib,face_recognition识别技术,可以准确识别人脸。该项目功能完整,实用性较强。包括登陆注册、考勤签到、打卡,用户管理等功能。适合大学生实战项
  • 2024-08-19html JS 语音识别
    1、语音识别的过程语音识别涉及三个过程:首先,需要设备的麦克风接收这段语音;其次,语音识别服务器会根据一系列语法(基本上,语法是你希望在具体的应用中能够识别出来的词汇)来检查这段语音;最后,当一个单词或者短语被成功识别后,结果会以文本字符串的形式返回(结果可以有多个),以及更多
  • 2024-08-15edge recognition 一种识别边缘的方法
       是按X/Y方向找一点特征的像素吗?怎么实现的,有没盆友参透
  • 2024-08-12vue实现录音并转文字功能,包括PC端web,手机端web
    vue实现录音并转文字功能,包括PC端,手机端和企业微信自建应用端不止vue,不限技术栈,vue2、vue3、react、.net以及原生js均可实现。原理浏览器实现录音并转文字最快捷的方法是通过WebSpeechAPI来实现,这是浏览器内置示例的api方法,可以直接调用,无需引入任何依赖包,唯一需要注意的是浏览
  • 2024-07-27【Python】利用 face_recognition 库进行人脸检测识别【附完整示例】
    1.背景条件1.1安装所需库首先安装face_recognition和Pillow这两个库。您可以使用以下命令来安装它们:pipinstallface_recognitionPillow-ihttps://pypi.tuna.tsinghua.edu.cn/simple1.2拷贝代码安装完成后,您就可以在本地运行以下提供的代码了。importfac
  • 2024-07-26人脸识别项目打包成exe的过程遇到的问题
     我最近重新拾起了计算机视觉,借助Python的opencv还有face_recognition库写了个简单的图像识别demo,额外定制了一些内容,原本想打包成exe然后发给朋友,不过在这当中遇到了许多小问题,都解决了,记录一下踩过的坑。 1、Pyinstaller打包过程当中出现warning,跟dll文件有关,将"C:\Windows
  • 2024-05-02文本到语音(tts)
    WebSpeechAPI使你能够将语音数据合并到Web应用程序中。WebSpeechAPI有两个部分:SpeechSynthesis语音合成(文本到语音TTS)和SpeechRecognition语音识别(异步语音识别)SpeechSynthesis:语音服务的控制器接口,获取设备上关于可用的合成声音的信息,开始、暂停语音,或除此之外
  • 2024-04-26h5使用原生麦克风
    conststartButton=document.getElementById('chart_button');    constinputText=document.getElementById('chatui_input');     //initrecognition    constrecognition=newwebkitSpeechRecognition();     functi
  • 2024-04-19基于face_recognition实现的人脸识别功能
    环境Python3.11.8dlib==19.24.4opencv-python==4.9.0.80numpy==1.26.4face_recognition==1.3.0通过本地图片采集人脸编码importosimportcv2importface_recognitionencode_list=[]image_field_path=os.path.join('.','images')images_fil
  • 2024-03-29几行代码实现人脸定位
    几行代码实现人脸定位importface_recognitionfromPILimportImageimage=face_recognition.load_image_file("IMG_20220519_210830.jpg")face_locations=face_recognition.face_locations(image)forface_locationinface_locations:#打印每张脸的位置信息
  • 2024-01-16python语音识别whisper的使用
    Python语音识别Whisper的使用语音识别是一项具有广泛应用的技术,它使得计算机可以理解人类的语音指令并作出相应的反应。在众多的语音识别工具中,Whisper是一个基于Python的开源库,它提供了简单易用的语音识别功能。本文将介绍Whisper的基本概念和使用方法,并通过代码示例来演示其功能
  • 2024-01-08深度学习的基本概念:从线性回归到卷积神经网络
    1.背景介绍深度学习是一种人工智能技术,它旨在模拟人类大脑中的神经网络,以解决复杂的问题。深度学习的核心思想是通过多层次的神经网络来学习数据的复杂关系,从而实现自主学习和决策。深度学习的发展历程可以分为以下几个阶段:1980年代:人工神经网络的基础研究,主要关注神经网络的结构和
  • 2024-01-05使用 Python 进行简单的人脸识别
    介绍人脸识别技术已经成为当今世界许多领域的重要应用,从安全领域到社交媒体,无处不在。Python提供了许多强大的库和工具,使得实现人脸识别变得更加容易。本文将介绍如何使用Python中的一些流行库来进行简单的人脸识别。准备工作在开始之前,确保你已经安装了以下库:OpenCV:用于
  • 2024-01-05卷积神经网络在图像分割与段落中的应用
    1.背景介绍卷积神经网络(ConvolutionalNeuralNetworks,CNNs)是一种深度学习算法,它在图像处理领域取得了显著的成功。在这篇文章中,我们将探讨卷积神经网络在图像分割和段落检测领域的应用。图像分割是将图像划分为多个部分,以表示图像中的各个对象或区域。段落检测是识别图像中的段
  • 2023-12-18Bottleneck Transformers for Visual Recognition
    BottleneckTransformersforVisualRecognition*Authors:[[AravindSrinivas]],[[Tsung-YiLin]],[[NikiParmar]],[[JonathonShlens]],[[PieterAbbeel]],[[AshishVaswani]]DOI:10.1109/CVPR46437.2021.01625初读印象comment::(BoTNet)通过在ResNet的最后三个