相比GPT-4o更懂你的情绪，blsp-emo模型最新落地经验分享

时间：2024-07-02 22:27:36浏览次数：17

标签：模型 -- emo 4o blsp 语音 test Emo

BLSP-Emo是一个中英双语共情语音对话模型，由通义实验室与中国科学院自动化研究所联合开源，旨在赋予大语言模型理解语音输入中的语义与情感，并生成共情回复的能力。

BLSP-Emo的模型架构通过一个模态适配器将语音编码器Whisper和大语言模型Qwen-7B-Chat连接起来，实现了更好的语义和情感建模。

BLSP-Emo通过两阶段的对齐训练利用现有的语音识别（ASR）和语音情感识别（SER）数据，将语音中的语言信息和副语言情感信号有效对齐至大语言模型的语义理解空间中。

在语义对齐阶段依托于ASR数据，确保大语言模型对语义内容一致的语音和文本展现出一致的生成行为。

在情感对齐阶段，利用SER数据训练大语言模型，展示一致的生成行为，实现对语音输入中情感的理解和共情回复。

BLSP-Emo不仅能够执行多模态语音语言指令，还能对用户语音请求中蕴含的情感进行深刻的理解与共情响应，为构建更加人性化、更具有共情力的AI交互体验奠定了基础。

github项目地址：https://github.com/cwang621/blsp-emo。

一、环境安装

1、python环境

建议安装python版本在3.10以上。

2、pip库安装

pip install torch==2.0.1+cu118 torchvision==0.15.2+cu118 torchaudio==2.0.2 --index-url https://download.pytorch.org/whl/cu118

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

3、Qwen-7B-Chat Model模型下载：

git lfs install

git clone https://www.modelscope.cn/iic/Blsp-Emo-Qwen-7B.git

4、whisper-large-v2模型下载（用于模型训练）：

git lfs install

git clone https://huggingface.co/openai/whisper-large-v2

二、功能测试

1、命令行运行测试：

（1）语音情感识别命令测试

instruction="Please identify the emotion tone of the speech provided below. Select from the following options: neutral, sad, angry, happy, or surprise.

Speech: "

python3 generate.py \

--input_file "examples/test/test_iemocap.jsonl" \

--output_file "examples/test/output_iemocap.jsonl" \

--blsp_model "blsp-emo-model/Blsp-Emo-Qwen-7B" \ --instruction "$instruction" \

--audio_field "audio" \

--reference_field "emotion"

对于SpeechAlpaca，命令会有如下：

python3 generate.py \

--input_file "examples/test/test_alpaca.jsonl" \

--output_file "examples/test/output_alpaca.jsonl" \

--blsp_model "blsp-emo-model/Blsp-Emo-Qwen-7B" \

--instruction "" \

--audio_field "audio" \

--max_new_tokens 256 \

--batch_size 4 \

--use_emotion True

（2）web端测试

如果想在web端与模型进行交互对话，可以执行命令：

python chat_demo.py \

--blsp_model "blsp-emo-model/Blsp-Emo-Qwen-7B" \

--use_emotion

如果启动的web代码没有响应，可以将gradio的启动代码demo.launch(share=False, enable_queue=True)

修改为：

demo.launch(server_name="0.0.0.0" , server_port=7860, debug=True, share=False, enable_queue=True)

（3）python代码调用测试

未完......

更多详细的内容欢迎关注：杰哥新技术

标签：模型,--,emo,4o,blsp,语音,test,Emo
From： https://blog.csdn.net/m0_71062934/article/details/140080094

No native JavaCPP library in memory. (Has Loader.load() been called?)
Exceptioninthread"main"java.lang.RuntimeException:NonativeJavaCPPlibraryinmemory.(HasLoader.load()beencalled?) atorg.bytedeco.javacpp.BytePointer.<init>(BytePointer.java:103) atorg.bytedeco.javacv.Frame.<init>(Frame......
GPT-4o文科成绩超一本线，理科为何表现不佳？
目录01评测榜单02 实际效果什么？许多大模型的文科成绩竟然超过了一本线，还是在竞争激烈的河南省？没错，最近有一项大模型“高考大摸底”评测引起了广泛关注。河南高考文科今年的一本线是521分，根据这项评测，共有四个大模型的分数大于或等于这个分数，其中最值得关注的是前两名：......
springboot实现异步调用demo
springboot实现异步调用异步调用特点异步调用在开发程序中被广泛应用，在异步任务中，主线程不需要阻塞等待异步任务的完成，而是可以继续处理其他请求。异步调用的特点如下：非阻塞：主线程在调用异步方法后不会等待其完成，而是立即返回。后台处理：耗时操作在后台独立的线程中执行，不会......
解决PyTorch中的`CUDA out of memory`错误
解决PyTorch中的`CUDAoutofmemory`错误解决PyTorch中的`CUDAoutofmemory`错误......
Appium+python自动化（三十三）- 本地调试测试代码，远程控制测试环境-Remote（超详解）
简介在前边所有涉及启动app的时候有这样一行代码driver=webdriver.Remote('http://127.0.0.1:4723/wd/hub',desired_caps)，很多小伙伴们和同学们不知道这个ip和端口哪里来的，我觉得有必要给小伙伴解释一下，于是宏哥决定写一篇关于这个appium的服务器ip文章！来给大家答答疑......
谈谈JVM内存区域的划分，哪些区域可能发生OutOfMemoryError?(jvm)
Java虚拟机（JVM）在运行时将内存划分为多个区域，以便有效管理和分配内存资源。这些内存区域包括堆（Heap）、方法区（MethodArea）、程序计数器（ProgramCounterRegister）、虚拟机栈（JVMStack）和本地方法栈（NativeMethodStack）。每个区域的作用和管理方式有所不同，某些区域在特定情况下可能......
如何使用 Services.AddDistributedMemoryCache
参考资料：https://www.cnblogs.com/RainFate/p/16920591.html AI生成:在.NETCore中，Services.AddDistributedMemoryCache()方法用于注册分布式内存缓存。这是一个内存中的缓存解决方案，适用于需要在多个服务器或服务之间共享缓存数据的分布式系统。如何使用AddDistributedMemory......
demo
#include<ButtonConstants.au3>#include<EditConstants.au3>#include<GUIConstantsEx.au3>#include<WindowsConstants.au3>#include<FileConstants.au3>#include<MsgBoxConstants.au3>#include<Array.au3>;创建GUI$......
磐维数据库安装提示max_process_memory must greater than问题
很多人在个人虚拟机部署磐维测试环境时会碰上一个提示内存太少的报错，多数是因为虚拟机给的内存太少了。遇到报错也可以不用调整虚拟机内存，可以调整参数解决。报错示例如下：BACKEND]FATAL:thevaluesofmemoryoutoflimit,thedatabasefailedtobestarted,max_process_mem......
最新AI智能问答AI绘画ChatGPT系统、TTS & 语音识别，文档分析、GPT-4o多模态识图理解，一
一、前言人工智能语言模型和AI绘画在多个领域都有广泛的应用。以下是一些它们的主要用处人工智能语言模型内容生成写作辅助：帮助撰写文章、博客、报告、剧本等。代码生成：自动生成或补全代码，提高编程效率。创意写作：生成故事、诗歌、歌词等创意性内容。对话系统客服系......

相比GPT-4o更懂你的情绪，blsp-emo模型最新落地经验分享

一、环境安装

二、功能测试

相关文章

赞助商

阅读排行