首页 > 其他分享 >爆火 AI 硬件遭差评,Ai Pin 上市即翻车;Grok 推出首个多模态模型丨 RTE 开发者日报 Vol.184

爆火 AI 硬件遭差评,Ai Pin 上市即翻车;Grok 推出首个多模态模型丨 RTE 开发者日报 Vol.184

时间:2024-04-15 16:23:46浏览次数:28  
标签:模态 Grok Pin 视频 AI Ai 开发者

 

 

开发者朋友们大家好:

 

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

 

本期编辑:@CY,@JLT,@鲍勃

01 有话题的新闻

1、马斯克的首款多模态大模型来了,GPT-4V 又被超越了一次

 

上个周末,X.AI 推出首个多模态模型 Grok-1.5V;能处理文本、文档、图表、截图和照片。

 

Grok-1.5V 在多领域性能媲美顶尖多模态模型,预计将提升图像、音频和视频处理能力,而在基准测试 RealWorldQA 上显示 Grok-1.5V 在理解物理世界方面的卓越性能。(@三易生活)

 

2、腾讯云披露 4 月 8 日服务故障原因:云 API 异常持续近 87 分钟

 

IT 之家 4 月 14 日消息,腾讯云官方公众号今日发文,披露了 4 月 8 日服务大范围故障的原因及细节。

 

官方表示,经过故障定位发现,客户登录不上控制台正是由云 API 异常所导致。云 API 是云上统一的开放接口集合,客户可通过 API 以编程方式管理和操控云端资源,云控制台通过组合云 API 提供交互式的网页功能。(@IT 之家)

 

3、Adobe 以每分钟约 3 美元的价格购买视频构建文本视频 AI 模型

 

Adobe 正以每分钟约 3 美元的价格购买视频构建文本视频生成模型,试图赶上 OpenAI 的 Sora。Adobe 要求摄影师和艺术家递交表现人们日常活动的视频,比如步行,或者表达情绪如快乐和生气。Adobe 要求提供逾百种人物动作和表现情感的短片,以及脚、手或眼睛的简单解剖片段。它不希望视频包含版权材料,裸体或其它冒犯性内容。视频的平均费用约为每分钟 2.62 美元,最高每分钟 7.25 美元。(@Solidot)

 

4、清华团队发布 AI 光芯片「太极」:灵感来自周易

 

清华大学科研团队的新成果发布在了 4 月 12 日凌晨的最新一期《科学》上,首创分布式广度智能光计算架构,研制出全球首款大规模干涉衍射异构集成芯片「太极(Taichi)」,实现了 160 TOPS/W 的通用智能计算,首次赋能光计算实现自然场景千类对象识别、跨模态内容生成等人工智能复杂任务。

 

据介绍,「太极」光芯片架构开发的过程中,灵感来自典籍《周易》,团队成员以「易有太极,是生两仪」为启发,建立了全新的计算模型,实现了光计算强悍性能的释放。

 

「太极」光芯片有望为大模型训练推理、通用人工智能、自主智能无人系统提供算力支撑。(@快科技)

02 有态度的观点

1、爆火 AI 硬件遭差评,Ai Pin 上市即翻车

 

最近,Ai Pin 的第一批用户拿到了他们的新玩具。

 

自从在 MWC 2024(世界移动通信大会)亮相后,标榜要做「AI 时代的 iPhone」的 Ai Pin 终于发货,第一时间上手的外媒也抱着极大的热情和好奇,全方位体验了这款「奇葩」产品。

 

大家都对 Ai Pin 有着高度一致的评价:

 

  • 设备做工精良,不愧是苹果前工程师的作品;

  • 看上去比图片里的要小,佩戴很方便,有多个模块可选;

  • 拍照质量不错;

  • 实时翻译很好用,译文挺准确。

 

但如果你想知道 Ai Pin 是否值得购买,所有人也都会异口同声地叫醒你:NO

 

  • 过于简陋,没多大用处。——Wired

  • 我真正可以依靠 Ai Pin 做的唯一一件事就是告诉我时间。——The Verge(@爱范儿)

03 有思考的文章

1、《做工具,开发者工具》

 

「信任开发者的技术能力非常重要,要做到『放权』。

 

何为信任他们的技术能力?就是针对他们的技术水平,给到他们不同程度的控制。

 

何为控制?就是支持不同 interface 层面上的操作,让他们有自主权。以下面的 interface 进行举例,我的理解,从控制度大小排序:APIs (Application Programming Interfaces) > Command-Line Interfaces (CLIs) > Configuration Files > GUI (Graphical user interface)」(@鸡汤挂面)

 

@鲍勃:是从@Tison 的推荐看到这篇文章的。作者作为一个非技术背景的产品设计师,分享了自己如何理解开发者,以及如何给开发者更多控制权,并在不同交互界面提供合适功能的思考。

 

写在最后:

 

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

 

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

 

 

素材来源官方媒体/网络新闻

标签:模态,Grok,Pin,视频,AI,Ai,开发者
From: https://www.cnblogs.com/Agora/p/18136224

相关文章

  • nginx报错:bind() to 0.0.0.0:80 failed (10013: An attempt was made to access a soc
    问题:1.nginx启动失败2.在logs/error.log文件下,出现报错信息:bind()to0.0.0.0:80failed(10013:Anattemptwasmadetoaccessasocketinawayforbiddenbyitsaccesspermissions) 目录:1、cmd输入命令netstat-aon|findstr"80"2.、查看80端口7532对应的任务3、......
  • LangChain轻松入门和开发实践
    LangChain是一个开发语言模型应用的框架。LangChain能够简化开发与语言模型工作流中的复杂部分,帮助开发人员能够更轻松地进行开发,并定制满足需求的应用。LangChain有两大优点,一是它能将外部数据,如文件、其他应用、API数据等,无缝地集成到语言模型中;二是它通过代理功能,让语言模型......
  • 4. Kubernetes 之 WebUI管理 Portainer
    1.安装PortainerPortainer是一个轻量级的容器管理工具,可以用来管理Docker和Kubernetes,它提供了一个Web界面来方便我们管理容器,官方网址:https://www.portainer.io/1.使用官方提供的yaml文件安装:在master节点上安装portainer,并将其暴露在NodePort30777上kubectlap......
  • Command PhaseScriptExecution failed with a nonzero exit code 错误解决记录
    xCode报这个错误,首先看是哪个文件报错,进入错误日志/Users/fanvil/Library/Developer/Xcode/DerivedData。因为我这边是FBReactNativeSpec这个文件下的错误,所以很容易找到错误日志:/Users/fanvil/Desktop/iOS/Demo/ios/Pods/../../node_modules/react-native/React/FBReactNativeSp......
  • async与await暂停作用
    1.asyncfunctionRequest(){awaitnewPromise(res=>{setTimeout(()=>{console.log(1)res()},1000)})console.log(4);newPromise(res=>{setTimeout(()=>{......
  • AI数字人互动大屏:如何改变我们的生活?
    随着科技的飞速进步和人工智能技术的日益成熟,智能制造正在成为推动制造业转型升级的核心力量。互动数字人具有强大的情感分析能力,可以根据观众的表情、语气等实时反馈,作出恰当而富有情感的回应。这不仅让每一次的交流变得更为生动和深入,也为观众提供了个性化、定制化的服务体验。......
  • 开源相机管理库Aravis例程学习(二)——连续采集multiple-acquisition-main-thread
    目录简介例程代码函数说明arv_camera_set_acquisition_modearv_camera_create_streamarv_camera_get_payloadarv_buffer_newarv_stream_push_bufferarv_camera_start_acquisitionarv_stream_pop_bufferarv_camera_stop_acquisition简介本文针对官方例程中的:02-multiple-acquisit......
  • Rust 的 Pin 机制
    背景我相信大多数人在学习Rust异步编程时都会被Futuretrait中的Pin指针感到困惑:pubtraitFuture{typeOutput;fnpoll(self:Pin<&mutSelf>,cx:&mutContext<'_>)->Poll<Self::Output>;}特别是搜索了一圈文档之后,更会对这个Pin一头雾水,彷佛自己也......
  • LlamaIndex 是什么
     LlamaIndex是一个基于LLM(大语言模型)的应用程序数据框架,适用于受益于上下文增强的场景。这类LLM系统被称为RAG(检索增强生成)系统。LlamaIndex提供了必要的抽象层,以便更容易地摄取、结构化和访问私有或特定领域的数据,从而安全可靠地将这些数据注入LLM中,以实现更准确的文......
  • LlamaIndex 高层次概念
     本篇内容为您快速介绍在构建基于大型语言模型(LLM)的应用程序时会频繁遇到的一些核心概念。 增强检索生成(RAG)LLM是基于海量数据训练而成,但并未涵盖您的具体数据。增强检索生成(Retrieval-AugmentedGeneration,RAG)通过将您的数据添加至LLM已有的数据集中,解决了这一问题。......