首页 > 其他分享 >Hume.ai 升级:自研情感模型集成 Claude 和 Fal;数字嗅觉公司 Osmo 用 AI 实现气味「传送」

Hume.ai 升级:自研情感模型集成 Claude 和 Fal;数字嗅觉公司 Osmo 用 AI 实现气味「传送」

时间:2024-11-05 17:47:20浏览次数:3  
标签:视频 ai 模型 气味 Osmo 自研 AI Suleyman

 

 

 

开发者朋友们大家好:

 

这里是**「RTE 开发者日报」**,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

 

本期编辑:@SSN,@鲍勃

01 有话题的新闻

1、消息称马斯克正与英伟达就 xAI 投资事宜进行谈判

 

据 New York Post 报道,知情人士称,芯片巨头英伟达正在与埃隆・马斯克就对 xAI 的潜在投资进行谈判。

 

xAI 是马斯克创立的人工智能公司,其开发的大语言模型 Grok 目前已部署在社交媒体平台 X 上。虽然 Grok 的推出时间晚于 OpenAI 的 ChatGPT 等竞争对手,但其增长和发展速度非常快。

 

尽管英伟达尚未就潜在投资 xAI 一事置评,但其首席执行官黄仁勋一直非常支持马斯克的人工智能初创公司。在 10 月份的一次采访中,黄仁勋指出,xAI 团队仅用 19 天就建立了一个拥有 10 万个 H200 Blackwell GPU 的超级计算机集群。黄仁勋表示,这样的项目通常从概念阶段到最终产出需要四年的时间。「据我所知,世界上只有一个人能做到这一点;埃隆对工程、建设、大型系统和资源调配的理解是独一无二的,这简直令人难以置信。」黄仁勋指出。(@IT 之家)

 

2、远程 「闻」 香,数字嗅觉公司 Osmo 用 AI 技术实现气味「传送」

 

一家名为 Osmo 的「数字嗅觉」公司宣布,已成功利用 AI 技术分析一个位置的气味,并在无需人工干预的情况下在其他地方复制它。

 

气味隐形传态使用传感器收集气味,并通过气相色谱质谱仪 (GC / MS) 进行分析。然后,数据被传输到专门的分子打印机,它可以合成和组合精确再现气味所需的化学物质。Osmo 之前曾进行过气味隐形传送,不过需要人工帮助,如今利用 AI 实现了自动化。

 

据介绍,Osmo 已成功利用 AI 将处理后的气味映射到其主要气味图(POM)上,该数据库可预测分子的特定组合如何与特定气味相对应。然后,AI 模型可以将气味的分子特征传达给机器人系统,以创建和混合香气的复制品。该公司已成功利用 AI 合成了「新鲜的夏季李子」气味,Osmo 首席执行官 Alex Wiltschko 在 10 月 30 日宣布了这一消息。(@IT 之家)

 

3、字节跳动内测新款 AI 模型分享社区——「炉米 Lumi」亮相

 

字节跳动近日悄然上线了一款名为「炉米 Lumi」的 AI 模型交流社区,该社区集模型分享、Workflow 构建及 LoRA 训练等多元化功能于一身。在这个平台上,用户不仅可以展示自己研发的 AI 模型,还能与其他同好进行深入交流,共同搭建完善的 AI 工作流程。

 

尽管「炉米 Lumi」当前仍处于内测阶段,并未在主流搜索引擎中公开露面,但已有部分用户通过特定网址「artistrylab.net」探寻到了这个神秘社区的踪迹。不过,尝试访问的用户可能会遇到扫码登录后提示无权限的情况,显示该平台仍在严谨地控制访问权限。

 

据悉,「炉米 Lumi」社区为 AI 爱好者们提供了一个全新的互动空间。在这里,他们可以自由地分享自己的 AI 创作,探索模型的无限可能,并借助社区的力量不断优化和完善自己的作品。同时,该平台还提供了丰富的工具和资源,帮助用户更高效地进行 AI 模型的开发和训练。(@极客公园)

 

4、颠覆视频编辑!开源神器 ComfyUI-MochiEdit 支持视频转视频,局部编辑

 

像操控文字一样编辑视频的情景一般都出现在人们的想象里,现在这个想法已经成为现实。

 

ComfyUI-MochiEdit 是一款基于 ComfyUI 和 Genmo Mochi 的开源视频编辑工具,它提供了一种全新的视频编辑思路:将视频转换为噪声,再通过目标提示重新采样噪声,生成全新视频。这种方法实现了局部编辑和视频转视频功能,让用户可以轻松修改视频的部分而无需处理整个视频。(@AIbase 基地)

 

5、Hume App 全新升级:EVI 2 语音技术引领 AI 助手新体验

 

多功能 AI 助手平台, 提供个性化的语音交互体验, 覆盖从快速问答到深度咨询的全方位服务

 

技术亮点

 

  • A. 自研核心 - EVI 2 语音语言模型

 

-可独立生成语言内容

 

-为 AI 助手提供独特声音和个性

 

-具备情感化表达能力

 

-能将其他 LLM 的文本响应转化为富有表现力的对话

 

  • B. 技术集成

 

-Anthropic Claude 系列模型(3.5 Haiku 和 Sonnet 版本)

 

-网络搜索能力

 

-fal 的图像生成技术

 

功能场景划分

 

- A. 快速问答

 

-技术组合:EVI 2 + Claude 3.5 Haiku + 网络搜索

 

-特点:实时性强, 响应快速准确

 

  • B. 故事讲述

 

-技术组合:纯 EVI 2 + fal 图像生成

 

-特点:注重情感表达和戏剧化效果

 

-配合图像增强叙事体验

 

  • C. 深度对话与生活建议

 

-技术组合:EVI 2 + Claude 3.5 Sonnet + 网络搜索

 

-特点:提供更深度的思考和建议

 

  • D. 情感支持

 

-贯穿各个场景的基础功能

 

-通过 EVI 2 的表达能力提供情感共鸣

 

Hume App:http://app.hume.ai

 

Developer:https://platform.hume.ai(@ Mengshao@X)

02 有态度的观点

1、微软 AI 负责人:情商对 AI 来说也很重要

 

微软 AI 部门的首席执行官 Mustafa Suleyman 在最近的一场对谈活动中,谈到了他对于 AI 技术的不少见解。

 

Suleyman 曾经也是 AI 初创公司 Pi 的联合创始人,这家公司强调「人性化」的 AI 产品。主持人就此向 Suleyman 提问,对于 AI 技术来说,情商意味着什么?

 

Suleyman 回答称,研究人员在不断推进 AI 的「智商」进步,却往往忽略了同样重要的信息传达方式。Suleyman 认为仅仅只是把事实列出是一个非常「书呆子」的事情。

 

AI 模型的语气、风格、情商,以及对特定语气的特别反馈,在 Suleyman 眼中,比维基百科式单纯罗列客观事实,对消费者来说更重要。

 

Suleyman 对未来如何设计 AI 的个性非常感兴趣,认为这才是人们真正会发现价值的东西。(@ APPSO)

 

写在最后:

 

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

 

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

 

 

 

素材来源官方媒体/网络新闻

标签:视频,ai,模型,气味,Osmo,自研,AI,Suleyman
From: https://www.cnblogs.com/Agora/p/18528446

相关文章

  • 智能 AI 视觉识别系统打造高效流量统计方案
    智能AI视觉算法解决方案,涵盖客流人数统计、车流量统计、牲畜养殖场计数、物品点包计数、超员报警、火焰识别报警及驾驶行为报警等功能。可精准统计商场、车站等地客流,区分车型统计车流量并预警拥堵,准确计数牲畜及物品,检测工厂超员并辅助管理,快速响应火焰降低损失,判断行为规范保......
  • AI 大模型重塑软件开发:传统与未来的碰撞
    目录引言传统软件开发流程与模式AI参与的软件开发流程AI带来的优势面临的挑战及应对策略展望未来结语引言        随着人工智能技术的飞速发展,AI大模型正逐步渗透至各行各业,其中软件开发领域尤为显著。从代码自动生成到智能测试,AI不仅简化了开发流程,还......
  • AI带货主播背景替换与虚拟场景融合的源代码!
    AI带货主播作为新兴的直播形式,正在逐步改变我们的购物体验,借助先进的人工智能技术,带货主播可以在虚拟环境中进行直播,背景可以实时替换,场景也可以灵活变换。这不仅增强了直播的趣味性,也大大提升了观众的沉浸感,接下来,本文将分享一些关于AI带货主播背景替换与虚拟场景融合的源代......
  • 这么多优秀的 AI 大模型,我应该选择哪个呢?
    前两次,我们向大家介绍了当前全球最有名的总共11个AI大模型。在此期间,openAI于8月6日最新推出另了一个超强AI大模型——GPT-4o(Aug6),强势跻入全球前列。不得不说,这才多久,openAI,谷歌,Meta等大厂对于大模型就发生了无数次的更新,每次更新,都是让人大呼哇塞!全球领先真......
  • 掌握这五大关键,轻松驾驭AI大模型项目落地
    随着AI技术的蓬勃发展,众多企业纷纷投身于大模型项目的浪潮中,力求在这场技术革新中占据一席之地。然而,成功与失败并存,背后的原因引人深思。本文将为您揭示五大关键因素,助您轻松驾驭AI大模型项目的落地过程。一、业务人员的深度参与与引领在AI大模型项目中,业务人员的角色至......
  • 当金庸遇上AI:小说变播客,躺着也能闯江湖!
    前言各位小伙伴们,你们有没有幻想过,自己能像古代的大侠一样,一边走着路,一边听着书童在耳边讲着江湖故事?现在,这个梦想不再是梦!感谢一位名叫chenwr727的大侠,他开发了一款神奇的工具——“Novels-Podcast-Generator”,让你躺在床上也能闯荡江湖啦!项目揭秘“Novels-Podcast-Ge......
  • 想高薪!普通人转行做AI,试试这5步!
    你有没有想过,有一天你可以转型成为AI专家,而且还能拿到高薪?在当今快速发展的科技时代,**人工智能(AI)**已经成为各行各业的核心驱动力。许多人对AI领域充满了浓厚的兴趣,渴望能够在这个充满机遇的领域中大展拳脚。面对这个看似高深莫测的领域,很多人却感到无从下手,不知道如何才......
  • AI智能分析视频分析网关打手机检测算法:科技赋能的智能监控新时代
    智能手机的广泛使用在便利我们生活的同时,也带来了一些挑战,特别是在教育、企业、家庭监护和公共场合等环境中,不恰当的手机使用可能会扰乱秩序和活动。为了应对这一挑战,打手机检测视频分析网关应运而生,成为一种高效、智能化的监控解决方案。一、技术背景打手机检测视频分析网关主......
  • AI辅助需求规格描述评审
    1.背景软件需求规格说明书(SRS)是软件项目中定义系统需求的关键文档,涵盖了功能、性能、设计限制等需求细节。SRS的质量直接影响到整个项目的成败,确保文档清晰、准确、无歧义是产品成功的基础。然而,由于需求规格描述的复杂性和人工审查过程的主观性,手动评审往往耗时且容易出现疏漏。......
  • [AAAI2024]AnomalyGPT Detecting Industrial Anomalies Using Large Vision-Language
    本篇论文将大语言模型应用在工业异常检测(IndustrialAnomalyDetection,IAD)任务。引言IAD任务旨在检测和定位工业产品图像中的异常。由于现实世界样本的稀有性和不可预测性,要求模型仅在正常样本上进行训练,并实现对测试时异常样本的检测。如图1,现有的IAD方法给出异常样本的概率,......