首页 > 其他分享 >p2p视频通话和p2p语音对讲的实现

p2p视频通话和p2p语音对讲的实现

时间:2023-06-15 12:37:02浏览次数:40  
标签:视频 音频 方面 通话 p2p 语音 手机 设备

qq视频聊天和语音聊天功能是我们日常生活中经常使用到的功能。如果我们要实现手机与智能摄像头, 可视门铃, 可视猫眼等智能家居的视频对讲功能,如果以前没有接触过这些方面,难度和复杂度都不小。


需要在以下方面有知识沉淀和深入研究:


1、首先要解决p2p视频传输的问题:视频对讲流量大,通过服务器中转的话,既浪费服务器昂贵的宽带资源,视频延时长也严重影响用户体验。通过p2p打洞,手机直接连接智能设备,可减少视频延时又节省服务器宽带资源。


2、视频推流、拉流、编解码;音频编解码。


3、手机APP实时视频显示。


4、手机声音采集、声音澡音处理,回声处理。


网络上能够找到的库非常少,webrtc算是比较全面的解决方案,但是它却非常复杂,编译后的库也很大,不适合在嵌入式智能家居设备上使用。下面将详细描述如何解决以上各方面的难点。


首先看看实现后的效果图:

p2p视频通话和p2p语音对讲的实现_服务器

p2p视频通话和p2p语音对讲的实现_视频流_02


p2p视频传输这块,我们使用深圳市好游科技有限公司开发的p2p sdk,接口非常简单,穿透能力强,双对称型 NAT也能打洞成功。编译后的库也非常小,linux不到500kb,windows下不到200kb.


音视频推流、拉流、编解码;我们使用好游科技实现的多媒体库liveMedia,视频方面用H264、音频方面用的是aac。在设备端和手机端都接入此库。手机app上查看设备时,首先拉取了设备上的视频流,音频流虽然开了,但是默认是静音的,没有传输音频数据。用户可以在APP上单独开启声音,此后音频数据才会开始传输。当用户点通话按扭时,开启手机上的rtsp库,并开始录音。此后设备端开始从手机上拉取视频流和音频流。


手机视频显示方面,我们用unity3D+NGUI开发,创建了一个纹理UITexture来显示。通过GLES把每帧的视频绘制到纹理上。也可以对此纹理做各种后期处理。


4、采集方面ios使用的是 Aduio Unit,安卓方面使用的是AudioRecord


5、音频噪声处理和回声处理上,ios方面使用的是 api自带的效果就已经比较好了。设备端使用的是webrtc里面的声音处理模块。


后面再详细介绍每个模块的主要代码,有疑问的朋友可联系QQ: 390090739   由于代码较复杂,代码量也巨大,只能挑重点讲解每个部份的内容。


标签:视频,音频,方面,通话,p2p,语音,手机,设备
From: https://blog.51cto.com/u_16159766/6486205

相关文章

  • 重拾梦想!语音交友源码平台搭建技术知识:在线K歌功能的实现
    你是否小时候也有一个当歌手的梦想,长大后却因生活压力所迫而放弃?我相信绝大多数人小的时候都有一个当歌手的梦想,因为在我们小的时候非常的天真纯洁,当听到好听的歌或是想起好听的歌,不管在何时何地,公共场合或是私密场所我们都可以不惧别人的目光唱起来歌,不管我们唱的好不好听,大部分人......
  • 可节省40%MCU开发成本的音乐睡眠灯语音扩展芯片方案N9300-S16
    随着社会节奏的加快,人们每天的生活节奏也在不断的加快,工作压力也在不断的加大,越来越多的人都面临着失眠的痛苦,当拖着疲惫不堪的身体躺到床上时,却发现由于担忧每天的工作或月底需要交房租等问题,久久无法入眠;这时打开睡眠音乐灯,在舒缓的音乐中、在渐变的灯光中慢慢忘却工作中的压力,慢......
  • NVC低功耗语音芯片制氧机方案,提升用户体验同时降低开发成本
    家用制氧机是一种可以通过空气中提取氧气,制造出高浓度的氧气供给需要氧气治疗的患者使用的设备。为了提高用户使用体验和操作便捷性。很多厂商会通过加入语音芯片实现语音提示功能,用户可以通过听到语音提示来了解制氧机的状态和操作指引,从而更加方便地使用制氧机。 那么家用......
  • 关于语音发送/接收 方法和装置发明专利正式发布
    北京时间,6月1日,三星电子申请专利:《语音发送方法和装置以及语音接收方法和装置、电子设备》,正式发布!该专利的发布旨在解决现有技术中,终端发送和接收语音时进行采样率转换的效果较差,无法向用户提供优质的听觉体验。此外,此项专利的核心特点是基于神经网络的语音发送方法和装置以及语音......
  • 流媒体发展新趋势 p2p网络技术 p2p穿透 p2p音视频解决方案
    一、流媒体系统及其发展趋势 所谓流媒体是指用户通过网络或者特定数字信道边下载边播放多媒体数据的一种工作方式。流媒体应用的一个最大的好处是用户不需要花费很长时间将多媒体数据全部下载到本地后才能播放,而仅需将起始几秒的数据先下载到本地的缓冲区中就可以开始播放,后面收......
  • Facebook 最新可佩戴 AR 设备、AR 设备未来五年市场扩张、语音社交新创Swell等|Decode
     DecodetheWeek ≠音视频技术周刊 Credit: MeKyeoungLee /NewsBriefing. Clubhouse 聘请 Instagram前高管 Clubhouse聘请曾任职Instagram的FadiaKader担任新的媒体合作和创作主管。此前,OWN和Netflix的前高层MayaWatson被CH聘请担任其全球营销主管,这表明......
  • 情感语音合成技术难点突破与未来展望
    PhotobyLukasfromPexels语音技术的进步,让机器合成的声音不再顿挫、冰冷,在自然度和可懂度等方面取得了不错的成绩,但当前合成效果在合成音的表现力上,特别是语气和情感方面,还存在不足。声音如果缺少情感,何谈表现力,又如何能提高用户交互的意愿?本文由标贝科技联合创始人兼CTO李秀林......
  • 语音情感识别之谱图特征提取(python)
    谱图: 注:FFT(快速傅里叶变换);DFT(离散傅里叶变换);DCT(离散余弦变换);VMD(变分模态分解)MEDC:张钰莎,蒋盛益.基于MFCC特征提取和改进SVM的语音情感数据挖掘分类识别方法研究[J].计算机应用与软件,2020,37(08):160-165+212.VGFCC:刘雨柔,张雪英,陈桂军,黄丽霞,张静.VMD改进GFCC的情......
  • 喜马拉雅贺雯迪:基于端到端TTS实现更具生动、富有情感的语音合成表现
    Photoby NicholasGithiri from Pexels现如今,随着TTS技术不断发展,用户对于语音合成的音质质量、流畅度等拥有更高追求。语音合成中的风格控制、音色转换、歌声合成等技术是目前业界的难点和共同追求的方向。本次采访邀请到了喜马拉雅的音频算法工程师贺雯迪,她将从语音合成领域......
  • 语音和语音助手测试点__肖sir__测试点整理
    语⾳测试⽤例测试语⾳的输⼊,主要包括以下⼏个⽅⾯:①语⾳输⼊离拾⾳设备的距离:近距离、远距离②拾⾳设备:移动端(安卓、IOS)原⽣麦克风、PC端原⽣麦克风、⽇常⽤⽿机麦克风、专业设备麦克风(罗技等)③语⾳输⼊与拾⾳设备的相对位置:正对拾⾳⼝,背对拾⾳⼝④语⾳输⼊的环境:办公环......