首页 > 其他分享 >基于安卓的智能语音识别系统

基于安卓的智能语音识别系统

时间:2023-06-20 21:05:42浏览次数:40  
标签:界面 安卓 识别系统 用户 合成 语音 识别 APP

本文通过对市场上的大多数用户量比较大的手机APP是使用的调查,并对调查结果做出需求分析后,确定了基于安卓客户端的语音识别和语音合成的功能设计方案。实现了在手机端可以调用手机的客户端麦克风进行语音的录入和识别,同时也实现了文本信息朗读和合成的技术。本设计的框架为 Android 系统,客户端界面由其相关组件设计而出,开发语言是JAVA,开发环境是AndroidStudio,数据库为安卓常用的轻量型关系型数据库SqlLite,阐述语音识别手机应用的设计与实现过程。本APP将用户的各种信息存储在APP端,并做到及时更新。客户端为装有Android系统的智能手机,用户可以通过App带有的各种功能进行测试运行。

基于安卓的智能语音识别系统_计算机毕业设计

功能分析

本设计的各种功能主要集中在客户端也就是手机APP中,为了人们可以更加方便的出行,我们结合了前期调研的结果,特别是针对于人们反应出的两大需求,我们对手机APP的设计做了一些有新意的设计;

(1)本App的客户端基于Android系统,对于使用该App的用户来说,可以通过手机更方便地操控手机应用,实现“智能化”的操作手机和输入指示命令,具体功能大致如下:

1)语音识别:用户在“语音合成”界面点击开始后,会调取手机麦克风,此时会有科大讯飞封装好提供的对话话,提示用户请说话,用户在录入语音结束后,会调用科大讯飞的语音识别的算法,来识别语音中的内容,进而再根据语音中的内容来判断执行相应的命令,例如跳转到微信,查询某个城市的天气,播放音乐,进行音乐的切换等功能。  

2)语音合成:用户在“语音合成”的界面,会看到有一文本输入框(EditText控件),用户在文本框中输入文字信息,后点击合成,就会调用科大讯飞的相关算法API,将文本信息合成语音文件,并提升用户文件所保存的路径,同时会将文本信息朗读出来,朗读时可以分为男声朗读和女声朗读。

基于安卓的智能语音识别系统_安卓毕业设计_02

主要功能模块的实现

在调研及需求分析后,我们得出本App的基本功能大致包括个人中心模块,语音合成模块以及语音识别等几个功能模块。各个功能设计的具体说明大致如下:

1)语音识别模块

    用户在成功登录APP,进入应用的主界面时,在“语音识别”的界面中,这一模块是本次设计的核心内容,也是本款APP实现的核心功能。用户可以选择“云端”还是“混合”的方式进行语音识别的解析,这是科大讯飞API中提供的方法,

用户点击“开始”后,会弹出提示框,提示用户录入语音,用户录入语音完毕,就会执行科大讯飞的算法分析,算法分析返回的结果不是字符串,还需要进行字符串的转换,只要转换成字符串以后,才能变成android代码能识别的“文字语言信息”,在识别到相关命令后开始执行相应的功能,本次设计实现了三个语音命令:1)语音控制打开应用,主要包括打开一些常用的APP软件,如支付宝、微信、微博等第三方应用。2)查询天气,用户可以输入命令查询某个城市的天气,例如查询济南,泰安的天气等,天气数据来源于易源接口的提供的数据。3)播放音乐,用户输入语音命令后,会进入到音乐播放的界面,用户可以语音控制音乐的播放,暂停,以及上一首和下一首等。

2)语音合成模块

用户登陆App之后,可以在主界面中看到“语音合成”图标。通过前面的分析,我们知道了用户的两大需求:1.可以语音识别。2.可以在线合成语音,这个省去了人们传统的只能依赖于文本输入的麻烦。所以,在这一模块中主要就是针对上述这这个需求来进行设计。其中,用户在文本框中输入文字信息,后点击合成,就会调用科大讯飞的相关算法API,将文本信息合成语音文件。至此,本次设计的核心供能也基本上就完全实现了。

4)个人中心模块

用户登陆App之后,可以在主界面中看到“退出应用”图标,单击即可返回结束退出当前应用,并重新跳转到用户登录界面,需要用户重新输入密码和账号进行服务端校验成功后,再次进入应用。用户登陆App之后,可以在主界面的下方中看到“个人中心”图标,单击即可跳转到当前界面,当然手指左右滑动手机屏幕也可以切换至当前界面。然后可以看到在个人中心中显示的信息有“用户头像”“用户名”“性别”,“年龄”。其中点击用户头像可选择手机本地图库里的图片进行上传,在此处本次设计实现了图片的圆形裁剪。“用户名”,“性别”,“年龄”不允许更改,在用户进行注册时获取到这些信息,在进入程序后显示给用户。“职业”和“联系电话”可虑到他们自身属性的不稳定性,在本次设计中采用的是用户可点击进行修改,当用户点击上述两个控件显示的内容的时候,会弹出一个对话框提示用户来编辑要修改的信息。

基于安卓的智能语音识别系统_计算机毕业设计_03

基于安卓的智能语音识别系统_语音合成_04

标签:界面,安卓,识别系统,用户,合成,语音,识别,APP
From: https://blog.51cto.com/u_6668792/6524506

相关文章

  • 基于matlab的车牌识别系统的研究,图像处理。 基于matlab的
    基于matlab的车牌识别系统的研究,图像处理。基于matlab的车牌识别系统的研究。1:有完整运行代码可以验证2:有完成配套资料,可以直接用。ID:7959598308655028......
  • 智能台灯语音方案:NRK3303语音识别芯片,更好的用户体验
    智能家居的发展已经成为了当今科技界的热门话题,其中智能台灯作为智能家居的组成部分越来越受到人们的关注。智能台灯的出现,意味着家居生活将迎来更加便捷的方式。而随着语音识别技术的发展,智能台灯的语音方案也越来越受到人们的青睐。今天,我们来介绍一款智能台灯语音方案:NRK3303语......
  • 基于pca人脸识别系统与实现
    计算机时代的到来,给各个领域带来了巨大的变革,人们的生活也日益进入到了数字编码时代。人工智能学的发展及其广泛的使用令图片处理和模式识别技术已显得尤为重要。人脸识别技术就是基于生物识别理论而发展而来的。人脸识别技术是生物识别中的典型,有着远大的发展前景,人脸识别技术已经......
  • 智能台灯语音方案:NRK3303语音识别芯片,更好的用户体验
    智能家居的发展已经成为了当今科技界的热门话题,其中智能台灯作为智能家居的组成部分越来越受到人们的关注。智能台灯的出现,意味着家居生活将迎来更加便捷的方式。而随着语音识别技术的发展,智能台灯的语音方案也越来越受到人们的青睐。今天,我们来介绍一款智能台灯语音方案:NRK3303语......
  • NV400F语音芯片方案让洗地机更加智能和支持UART音频更换
    随着人工智能技术的快速发展,越来越多的传统行业开始使用智能化技术提高操作效率和品质,并实现更加个性化的服务。其中,洗地机作为清洁行业不可或缺的设备,也在追求更智能化和高效率的目标。近年来,对于当下洗地机的需求,九芯电子新研发的NV400F语音芯片,它让洗地机更加智能,可以更高效地完......
  • pixel 3xl 编译安卓与内核并烧入全流程(含安卓源码部分编译)
    pixel3xl编译安卓与内核并烧入全流程(含安卓源码部分编译)目录pixel3xl编译安卓与内核并烧入全流程(含安卓源码部分编译)环境搭建安卓源码下载一、准备下载环境1、安装Python3.92、安装git3、安装curl4、配置环境变量安装repo二、下载源代码1、创建目录2、初始化仓库3、同步安......
  • 树莓派、PS4、Switch、STM32、安卓、iOS
    系统架构树莓派:基于ARMCortex-A系列处理器(如Cortex-A53)的Linux操作系统。PS4:基于x86-64架构的FreeBSD操作系统。Switch:基于ARMv8-A架构的NvidiaCustom操作系统,也被称为“HorizonOS”。STM32:无操作系统或基于实时操作系统(RTOS)的固件(裸机)编程。安卓:基于Linux内核的软件堆栈......
  • 智能风扇语音控制新方案,高品质语音识别芯片NRK3303
    随着人工智能技术的发展,人们可以使用语音助手随时随地进行语音控制电子设备。而针对风扇这种家居电器,智能语音控制的方案相对成熟,受到了越来越多用户的青睐。为了更好地提升用户体验,新一代智能风扇方案引进了语音识别芯片技术,使得用户可以更加方便地进行语音控制。语音识别芯片技术......
  • 智能风扇语音控制新方案,高品质语音识别芯片NRK3303
    随着人工智能技术的发展,人们可以使用语音助手随时随地进行语音控制电子设备。而针对风扇这种家居电器,智能语音控制的方案相对成熟,受到了越来越多用户的青睐。为了更好地提升用户体验,新一代智能风扇方案引进了语音识别芯片技术,使得用户可以更加方便地进行语音控制。语音识别芯片技......
  • Compose能拯救安卓开发吗?Jetpack Compose入门到精通(附资料)含实战、附Demo
    JetpackCompose简述JetpackCompose是用于构建原生AndroidUI的现代工具包。JetpackCompose使用更少的代码,强大的工具和直观的KotlinAPI,简化并加速了Android上的UI开发。这是AndroidDevelopers官网对它的描述。由于Compose基于Kotlin构建,因此可以与Java编程语言完全互操作,并......