首页 > 其他分享 >VisionMobile:虚拟助手(VA)- Siri背后的前沿UI技术(二)

VisionMobile:虚拟助手(VA)- Siri背后的前沿UI技术(二)

时间:2023-04-09 11:32:20浏览次数:35  
标签:VA VisionMobile Siri 用户 头像 助手 虚拟 语音 识别


二、虚拟辅手技术的演进

今日技术和明天发展

虚拟辅手技术建基5大技术模块:语音识别(SR),自然语言处理(NLP),用户分析,搜索和推荐,以及头像可视化。这些技术模块处于持续演化的状态,为大厂商和创业公司留下开放的创新空间。

VisionMobile:虚拟助手(VA)- Siri背后的前沿UI技术(二)_自然语言处理

语音识别

语音识别(SR),也称为自动语音识别(ASR)和语音到文字(STT),由机器将话音翻译为文本。文本到语音(TTS)则是将文本转换为话语。如果没有语音识别,人和虚拟助手之间对话就无法实现。声控虚拟助手使用语音识别来进行诸如网络搜索,语音拨号,听写文本消息(如短信,电邮,甚至整个文档)。

语音识别领域的核心成员是Nuance,Google,iSpeech和微软。

展望。以美国英语作为母语的虚拟助手有大量需求,对其他语种的需求亦在不断增加,厂商感受到其他本地语种不断增长的需求,研发本地语种的产品。最大的挑战是语言开发成本,每种新语言的语言识别基本上都是从零开始。语言的相互依赖性——事实上,大部分语言并非自成系统——这增加困难。目前,美国英语是虚拟助手首选语言,它是最理想的语言识别引擎的测试环境:美国是语言学上的同质化市场,有大量内容和第三方API提供给美国和英语国家访问。

自然语言处理—理解内容

语言识别将话语转化为文本,自然语言处理(NLP)将文本转化为有明确含义,可理解上下文。通过理解用户的上下文——过往历史,习惯,喜好,位置——虚拟助手返回最关联的信息和推荐,并以符合社交的方式处理。

自然语言处理技术领域上核心成员是SRI国际,Nuance,AT & T实验室,Google和Artificial Solutions。

展望。为了使虚拟助理可与用户充分对话,厂商目前正在研究前向后向对话和理解社交互动规则技术。不要忘记这些社交互动规则曾导致微软Office助理Clippit(又称Clippy)的失败。一个过渡解决方案是让用户根据场景设置互动规则,也即由用户告诉虚助手处理级别:开启聊天,对话,推荐,或者不开启这些。VA也需要学习并根据用户历史信息进行反应,这要求处理大量数据进行上下文训练,需要大量服务器能力。云处理是这类“大数据”的自然选择,但在可预见的将来,厂家倾向混合方式,即一些数据保存在设备本地,允许在没有网络连接的情况下使用虚拟助手功能。

“虚拟个人助理的下一个技术飞跃将是维持对话。”Norman D. Winarsky博士, SRI风险投资SRI国际副总裁。

用户分析(User Profiling)

用户分析包括用户信息收集,并据此为用户兴趣、喜好、上下文和意图建模。用户分析是虚拟助手提供个人信息、对话、推荐的基础。

用户分析技术的核心成员是SRI国际,Google,Apple,AT&T实验室,Artificial Solutions,和Tobii (Apple)。

展望。新的用户分析技术将不局限于数字内容跟踪,将从眼球跟踪、键盘跟踪,温度跟踪中收集信息。三星最新的智能手机,Galaxy S III,具有眼球跟踪技术,苹果公司在2009年部分购买眼球跟踪专家Tobii,说在未来集成Tobii技术。

虚拟化头像和个性化

虚拟头像是图像,是人物的动画表现,同样在很多虚拟助手中应用。虚拟人物实现了人物化助手,增加情感意图。头像的可视化游戏化方式,使互动更加有趣和投入。

展望。对于人物化头像,新技术例如3D身体扫描,脸部识别的潜力,与3D图像在设备集成时,将形象可视化提高到新的层次。头像在大量的虚拟助手中使用,但在定制化收入潜力上意见分歧。其中一个选择是作为应用销售,另一个是品牌植入,例如为头像提供某品牌毛衣的购买。


标签:VA,VisionMobile,Siri,用户,头像,助手,虚拟,语音,识别
From: https://blog.51cto.com/u_9877302/6178714

相关文章

  • VisionMobile:虚拟助手(VA)- Siri背后的前沿UI技术(三)
    三、虚拟助手的竞争Siri仅是充分竞争市场冰山的尖顶。Apple的产品在去年引发一波模仿和创新,有数十个智能手机应用。在报告中将分析Siri及另外4个应用:语言识别专家Nuance公司的DragonGo,i-Free创新工场的可视化驱动Everfriends,人工智能创业公司Dexetra的iris,和AT&T实验室的Speak4b......
  • VisionMobile:虚拟助手(VA)- Siri背后的前沿UI技术(一)
    VisionMobile发布报告《BeyondSiri:ThenextfrontierinUserInterface》,分析虚拟助手技术的市场,包括关键技术和商务模式,竞争点,和跨4屏虚拟助手的演化。自苹果在2011年推出Siri技术后,声控的移动虚拟助手(VirtualassistantsVAs)应用跨过技术裂缝进入大众市场,帮助用户通过语音命......
  • Java标准类
    Java标准类标准类的定义类的代码publicclassPerson{/*标准类:1.所有成员变量都用private修饰2.每个成员变量都有一个getter,setter方法3.一个无参构造方法4.一个全参构造方法这样的标准类也叫JavaBean*/privateStringn......
  • java中操作redis
             ......
  • Java SpringBoot Bean InitializingBean
    Spring中有两种类型的Bean,一种是普通Bean,另一种是工厂Bean,即FactoryBean。工厂Bean跟普通Bean不同,其返回的对象不是指定类的一个实例,其返回的是该工厂Bean的getObject方法所返回的对象。Spring初始化bean有两种方式:实现InitializingBean接口,实现afterPropertiesSet方法。(比通过反射......
  • Java SpringBoot Test 单元测试中包括多线程时,没跑完就结束了
    如何阻止JavaSpringBootTest单元测试中包括多线程时,没跑完就结束了使用CountDownLatchCountDownLatch、CyclicBarrier使用区别多线程ThreadPoolTaskExecutor应用JavaBasePooledObjectFactory对象池化技术@SpringBootTestpublicclassPoolTest{@Testvoid......
  • java面向对象编程-三大特性
    面向对象三大特性封装该露的露,该藏的藏我们程序设计要追求“高内聚,低耦合”。高内聚就是类的内部数据操作细节自己完成,不允许外部干涉;低耦合:仅暴露少量的方法给外部使用。封装(数据的隐藏)通常,应禁止直接访问一个对象中数据的实际表示,而应通过数据接口来访问,这称为信......
  • 【Java 并发】【十】【JUC数据结构】【一】CopyOnWriteArrayList原理
    1 前言我们前面看过了volatile、synchronized以及AQS的底层原理,以及基于AQS之上构建的各种并发工具,ReentrantLock、CountDownLatch、Semaphore、CyclicBarrier,那么我们这节该看什么了,是不是要看运用了。在日常的业务编程中经常使用到的内存数据结构有:Map、Set、List、Queue系列......
  • 基于FPGA的AES加密解密vivado仿真,verilog开发,包含testbench
    1.算法描述         AES,高级加密标准,是采用区块加密的一种标准,又称Rijndael加密法.严格上来讲,AES和Rijndael又不是完全一样,AES的区块长度固定为128比特,秘钥长度可以是128,192或者256.Rijndael加密法可以支持更大范围的区块和密钥长度,Rijndael使用的密......
  • JavaWeb-jsp-19课-JSP语法-2023-04-08
    <%@pagecontentType="text/html;charset=UTF-8"language="java"%><html><head><title>$Title$</title></head><body><%--注释JSP带百分号--%><%=newjava.util.Date()%>&l......