❝
气定则心定,心定则事顺
❞
大家好,我是「柒八九」。一个「专注于前端开发技术/Rust
及AI
应用知识分享」的Coder
。
前言
当今世界,上到 99,下到刚会走。在茶余饭后总有聊不完的话题。原来还是各种时事政治或者明星八卦。最近,坊间又多了一个谈资。那就是AI
。
有的会聊openAI
如何在世界刮起AIGC
的应用狂潮,也有人会聊奥特曼出走又回归的狗血剧情。
此奥特曼非彼奥特曼
更有甚者,现在还有人对百度问心一言的「车水马龙」和「驴肉火烧」的梗久久不能忘怀。
由于国内的一些不可明说的原因,AI
的应用还是偏向传统应用,它更多的是一种工具和高阶版的搜索引擎。
下面列举大厂各自的AI
应用
- 抖音-豆包[1]
- 腾讯-混元[2]
- 百度-问心一言[3]
- 讯飞-星火[4]
- 360-智脑[5]
- 昆仑-天工[6]
- 华为-盘古[7]
- 阿里-通义千问[8]
而关心AI
的同学,想必听过openAI
的Q*
计划。它的出现,让我们有了对Strong AI
,也被称为「人工通用智能」有了更多的幻想。
❝
关于
Strong AI
和Weak AI
可以参考之前的文章你真的了解 AI 吗?❞
「一千个人眼中有一千个哈姆雷特」,对于AI
能带给我们什么,其实大家都有自己独特的见解。但是,大部分都是从个人应用角度来分析这个问题。而今天我们就以前微软 CEO「比尔盖茨」的个人笔记[9]来窥探一下,AI
在商业中有哪些应用场景。毕竟,在大佬的世界中,有些见解是惊为天人的。
或许,我们能从大佬独特的商业视角中,找到我们可以实践的方向。毕竟,大佬吃肉,我们也可以跟着喝汤。亦或者,下面的某些观点能为以后的工作选择或者就业方向有一定的指导意见。
下文中都是以比尔盖茨
的口吻来讲述,所以大家对下面的信息有一定的甄别能力。
好了,天不早了,干点正事哇。
我今天对软件的热爱仍然与我和保罗·艾伦创办微软时一样强烈。但尽管在那之后的几十年里软件有了很大的改进,从很多方面来看,软件依然相当“愚蠢”。
在计算机上执行任何任务时,你必须告诉你的设备要使用哪个应用程序。你可以使用 Microsoft Word
和 Google Docs
来起草业务提案,但它们不能帮助你发送电子邮件、分享自拍照、分析数据、安排派对或购买电影票。即使是最好的网站对你的工作、个人生活、兴趣和关系也只有一种不完整的了解,并且利用这些信息为你做事情的能力有限。这种情况只有通过另一个人,像是亲密的朋友或个人助手才能实现。
「在接下来的五年里,这将发生彻底改变」。你将不再需要为不同的任务使用不同的应用程序。你只需用日常用语告诉你的设备你想做什么。根据你选择与之共享的信息多少,软件将能够以个性化的方式回应,因为它将对你的生活有丰富的了解。在不久的将来,「任何上网的人都将能够拥有一款由人工智能驱动的个人助手」,远远超过今天的技术水平。
这种类型的软件——能够对自然语言做出响应并根据对用户的了解完成许多不同任务的软件——被称为代理(agent
)。我已经思考代理(agent
)近 30 年,并在 1995 年的《未来之路》一书中写到过它们,但直到最近由于人工智能的进步才变得实际可行。
代理(agent
)不仅将改变每个人与计算机的互动方式。它们还将「颠覆软件行业,引发自从我们从键盘输入命令转变为点击图标以来的计算机革命」。
1. 一个人人都能拥有的个人助手
一些批评人士指出,软件公司以前曾提供过类似的东西,但用户并不是完全接受它们。(人们仍然拿微软办公套件中包含的数字助手 Clippy
开玩笑,并且后来我们将其删除了。)那么为什么人们会使用代理(agent
)呢?
答案是它们将会明显更好。你将能够与它们进行细致入微的对话。它们将会「更加个性化,而且不会局限于相对简单的任务」,比如写一封信。Clippy
与代理(agent
)的共同之处就像电话与移动设备一样少。
如果你愿意,代理(agent
)将能够帮助你完成所有活动。通过允许它跟踪你的在线互动和真实世界的位置,它将对你参与的人、地方和活动有深刻的理解。它将了解你的个人和工作关系、爱好、偏好和日程安排。你将选择它何时何地介入帮助或要求你做决定。
为了看到代理(agent
)将带来的巨大变化,让我们将它们与今天可用的人工智能工具进行比较。「大多数现有的工具都是机器人」。它们被限制在一个应用程序中,通常只在你写下特定的单词或寻求帮助时介入。因为它们不会记住你如何使用它们,所以下一次它们不会变得更好或学到任何你的偏好。
代理(agent
)更聪明。它们是主动的——能够在你「提出请求之前提出建议」。它们能够跨应用程序完成任务。它们随着时间的推移而改进,因为它们「记得你的活动并识别你行为中的意图和模式」。基于这些信息,它们会提供它们认为你需要的东西,尽管最终决定永远是你做的。
想象一下你想要计划一次旅行。一个旅行机器人可能会找到符合你预算的酒店。而一个代理(agent
)将知道你将在一年的哪个时候旅行,基于它对你是尝试新目的地还是喜欢重复去同一个地方的了解,它将能够提出建议。当被询问时,它会根据你的兴趣和对冒险的倾向建议事情,并且会预订你喜欢的餐馆类型的座位。如果你想要这种深度个性化的规划,今天你需要支付给一个旅行代理(agent
)并花费时间告诉他们你的需求。
人工智能代理(agent
)最令人兴奋的影响是它们将使现在对大多数人来说过于昂贵的服务变得民主化。它们将在四个领域特别产生重大影响:医疗保健
、教育
、生产力
以及娱乐和购物
。
2. 医疗保健
如今,人工智能在医疗保健中的主要作用是帮助「处理行政任务」。例如,Abridge
、Nuance DAX
和 Nabla Copilot
可以在预约期间捕捉音频,然后为医生编写需要审核的笔记。
真正的变革将在代理(agent
)能够帮助患者进行基本分类、获得有关如何处理健康问题的建议以及决定是否需要寻求治疗时发生。这些代理(agent
)还将帮助医护人员做出决策并提高工作效率。(已经有一些应用程序,比如 Glass Health
,可以分析患者摘要并为医生提供考虑的诊断建议。)对于那些从未能够看到医生的贫困国家的人们来说,帮助患者和医护人员将特别有益。
这些临床医生代理(agent
)将较慢地推出,因为把事情做对关系到生死。人们需要看到医疗代理(agent
)总体上是有益的证据,即使它们不会是完美的,也会犯错。当然,人类也会犯错,而且无法获得医疗保健也是一个问题。
心理保健
是代理(agent
)将向几乎所有人提供的服务的另一个例子。如今,每周一次的治疗会话似乎是一种奢侈。但需求很大,许多可以从心理治疗中受益的人无法获得这种服务。例如,RAND
发现一半需要心理保健的美国军人没有得到它。
经过良好训练的心理健康代理(agent
)将使心理治疗变得更加负担得起和更容易获得。Wysa
和 Youper
是早期的聊天机器人之一。但代理(agent
)将深入发展。如果你选择与心理健康代理(agent
)共享足够的信息,它将了解你的生活历史和人际关系。它将在你需要时可用,并且永远不会不耐烦。甚至在你允许的情况下,通过你的智能手表监测你对治疗的生理反应——比如当你谈论与老板的问题时心跳加速——并建议何时应该去看人类治疗师。
3. 教育
几十年来,我一直对软件能够简化教师工作、帮助学生学习的各种方式感到兴奋。它不会取代教师,而是会「为学生个性化工作,解放教师脱离文书工作和其他任务」,以便他们能够花更多时间在工作的最重要部分。这些变化终于开始以一种戏剧性的方式发生。
当前的尖端技术是 Khan Academy
创建的 Khanmigo
,一个基于文本的机器人。它可以辅导学生学习数学、科学和人文学科,例如,它可以解释二次方程式,并创建数学问题供练习。它还可以帮助教师制定课程计划。我长期以来一直是 Sal Khan
工作的支持者,并最近在我的播客中邀请他谈论教育和人工智能。
但基于文本的机器人只是第一波浪潮,代理(agent
)将开启更多学习机会。
例如,很少有家庭能够支付与学生一对一工作的导师,以补充他们在课堂上的学习。如果代理(agent
)能够捕捉到导师有效的要素,它们将为每个想要的人解锁这种补充教学。如果一个导师代理(agent
)知道一个孩子喜欢 Minecraft
和泰勒·斯威夫特,它将使用 Minecraft
教他们计算形状的体积和面积,使用泰勒的歌词教他们讲故事和押韵。体验将会更加丰富——例如图形和声音——比今天基于文本的导师更加个性化。
生产力
在这个领域已经存在着很多竞争。微软正在将其 Copilot
整合到 Word、Excel
、Outlook
和其他服务中。谷歌也在其 Bard
助手和生产力工具中进行类似的工作。这些合作伙伴可以做很多事情——比如将书面文件转换为幻灯片,使用自然语言回答有关电子表格的问题,并总结电子邮件线程,同时代表每个人的观点。
代理(agent
)将做得更多。拥有一个代理(agent
)将会像拥有一个专门帮助你完成各种任务并在需要时独立完成它们的人一样。如果你有一个创业的想法,代理(agent
)将帮助你起草一个商业计划,为此创建一个演示文稿,甚至生成你的产品可能看起来的图像。公司将能够为他们的员工提供直接咨询的代理(agent
),并使它们成为每次会议的一部分,以便它们可以回答问题。
无论你是在办公室还是其他地方工作,你的代理(agent
)都将能够以与今天的个人助手支持高管相同的方式帮助你。如果你的朋友刚刚做了手术,你的代理(agent
)将提供送花的建议,并能够为你订购。如果你告诉它你想与你的老大学室友见面,它将与他们的代理(agent
)合作找到一个见面的时间,并在你到达之前提醒你,他们的大孩子刚刚在当地大学开始上大学。
4. 娱乐和购物
已经有很多人工智能可以帮助你挑选新的电视并推荐电影、书籍、节目和播客。同样,我投资的一家公司最近推出了 Pix
,它允许你提问(“我可能会喜欢哪些罗伯特·瑞德福的电影,我在哪里可以观看它们?”),然后根据你过去的喜好提供建议。Spotify
有一位由人工智能驱动的 DJ
,不仅根据你的偏好播放歌曲,还与你交谈,甚至可以称呼你的名字。
代理(agent
)不仅仅会提供建议;它们将帮助你采取行动。如果你想购买相机,你的代理(agent
)将为你阅读所有评论,总结它们,提出建议,并在你做出决定后为它下订单。如果你告诉你的代理(agent
)你想看《星球大战》,它将知道你是否订阅了正确的流媒体服务,如果没有,它将提供注册。如果你不知道自己想要什么,它将提供定制建议,然后找出如何播放你选择的电影或节目。
你还将能够获取定制到你兴趣的新闻和娱乐。CurioAI
,它可以根据你询问的任何主题创建定制播客,就是未来的一个瞥见。
5. 技术行业的冲击
简而言之,代理(agent
)将能够在几乎任何活动和生活领域提供帮助。对软件业和社会的影响将是深远的。
在计算机行业中,我们谈论平台——应用程序和服务构建的技术基础。「像Android
、iOS
和 Windows
都是平台。代理(agent
)将是下一个平台」。
要创建新的应用程序或服务,你将不需要知道如何编写代码或进行图形设计。你只需告诉你的代理(agent
)你想要什么。它将能够编写代码,设计应用程序的外观和感觉,创建标志,并将应用程序发布到在线商店。OpenAI
最近推出的 GPT
提供了一个未来的预览,在那里「非开发人员可以轻松创建和共享自己的助手」。
代理(agent
)将影响我们使用软件的方式以及软件的编写方式。它们将「取代搜索站点」,因为它们在查找信息和为你总结信息方面更为优越。它们将「取代许多电子商务站点」,因为它们将为你找到最优惠的价格,并且不会受限于只有几个供应商。它们将「取代文字处理器、电子表格和其他生产力应用程序」。今天分开的业务——搜索广告、带广告的社交网络、购物、生产力软件——将成为一个业务。
我认为没有任何单一公司会主导代理(agent
)业务——将会有许多不同的人工智能引擎可用。今天,代理(agent
)嵌入在其他软件中,比如文字处理器和电子表格,但最终它们将独立运行。尽管一些代理(agent
)将是免费使用的(通过广告支持),但我认为你会为大多数代理(agent
)付费,这意味着公司将有动力使代理(agent
)为你工作而不是为广告商工作。如果今年已经开始研究 AI 的公司数量是任何指标,那么将会有异常激烈的竞争,这将使代理(agent
)非常廉价。
但在我描述的复杂代理(agent
)变为现实之前,我们需要面对关于技术以及如何使用它的许多问题。我之前曾写过有关 AI 引发的问题,所以我将专注于代理(agent
)的特定问题。
6. 技术挑战
到目前为止,尚无人知道代理(agent
)的数据结构将是什么样子。要创建个人代理(agent
),我们需要一种新类型的数据库,它可以捕捉到你兴趣和关系的所有细微差别,并在保护隐私的同时快速检索信息。我们已经看到了存储信息的新方法,例如矢量数据库,可能更适合存储由机器学习模型生成的数据。
另一个悬而未决的问题是人们将与多少代理(agent
)进行互动。你的个人代理(agent
)是否会与你的治疗代理(agent
)和数学导师分开?如果是这样,你希望它们在何时相互合作,何时应该保持各自的领域?
你将如何与你的代理(agent
)互动?公司正在探索各种选择,包括应用程序、眼镜、吊坠、胸牌,甚至全息图。所有这些都是可能性,但我认为人与代理(agent
)互动的第一个重大突破将是耳机。如果你的代理(agent
)需要与你核对,它将与你交谈或出现在你的手机上。(“你的航班延误了。你想等待吗,还是我可以帮你重新安排?”)如果你愿意,它将监视进入你耳朵的声音,并通过阻止背景噪音、放大难以听见的语音或使那些带有重口音的人更容易理解来增强声音。
还有其他挑战。目前还没有一种标准协议,允许代理(agent
)相互交流。成本需要下降,以便代理(agent
)对每个人都是负担得起的。它需要更容易以一种可以为你提供正确答案的方式提示代理(agent
)。我们需要防止幻觉,特别是在精度对健康等领域非常重要的地方,以及确保代理(agent
)不会因其偏见而伤害人。我们不希望代理(agent
)能够执行它们不应执行的操作。(尽管我担心的不太是流氓代理(agent
),而是人类罪犯使用代理(agent
)进行恶意用
途。)
7. 隐私和其他重大问题
随着所有这些因素的综合,在线隐私和安全问题将变得比它们已经是的更加紧迫。你将希望能够决定代理(agent
)可以访问哪些信息,以便你确信你的数据只与你选择的人和公司共享。
但与你的代理(agent
)分享的数据由谁拥有,如何确保它被适当使用呢?没有人希望开始收到与他们告诉他们的治疗代理(agent
)有关的广告。执法部门能否将你的代理(agent
)作为对你的证据?你的代理(agent
)何时会拒绝执行对你或他人有害的操作?是谁选择构建到代理(agent
)中的价值观呢?
还有一个问题是你的代理(agent
)应该分享多少信息。假设你想见一个朋友:如果你的代理(agent
)与他们的代理(agent
)交流,你不希望它说:“哦,她周二会见其他朋友,不想包括你。”如果你的代理(agent
)帮助你为工作写电子邮件,它将需要知道它不应该使用关于你的个人信息或前一份工作的专有数据。
这些问题对于科技行业和立法者来说已经是当务之急。我最近参与了由参议员查克·舒默组织、许多美国参议员参加的 AI 论坛。我们分享了关于这些和其他问题的想法,并谈到了立法者需要采取强有力的立法的必要性。
但其他问题将不会由公司和政府来决定。例如,代理(agent
)可能会影响我们与朋友和家人的互动方式。今天,你可以通过记住关于他们生活的细节——比如他们的生日——来表达你对他们的关心。但当他们知道你的代理(agent
)可能提醒你,并负责送花时,对他们来说是否还会有意义?
在遥远的未来,代理(agent
)甚至可能迫使人类面对有关目的的深刻问题。想象一下,代理(agent
)变得如此强大,每个人都可以在几乎不工作的情况下过上高质量的生活。在这样的未来,人们会用他们的时间做什么?当代理(agent
)拥有所有答案时,任何人是否仍然想要接受教育?当大多数人有很多空闲时间时,你是否能够拥有一个安全而繁荣的社会?
但我们距离那一刻还有很长的路要走。与此同时,代理(agent
)即将到来。在未来几年,它们将彻底改变我们的生活,无论是在线还是离线。
后记
「分享是一种态度」。
「全文完,既然看到这里了,如果觉得不错,随手点个赞和“在看”吧。」
Reference
[1]
抖音-豆包: https://www.doubao.com/
[2]
腾讯-混元: https://hunyuan.tencent.com/
[3]
百度-问心一言: https://yiyan.baidu.com/
[4]
讯飞-星火: https://xinghuo.xfyun.cn/
[5]
360-智脑: https://ai.360.com/
[6]
昆仑-天工: https://neice.tiangong.cn/
[7]
华为-盘古: https://pangu.huaweicloud.com/
[8]
阿里-通义千问: https://qianwen.aliyun.com/
[9]
个人笔记: https://www.gatesnotes.com/