从Claude发布了像人一样操作电脑的能力之后,一直有小伙伴问我,实在Agent和Claude的computer use能力有什么异同点。废话不多说,我们直接测试一波。
<iframe allowfullscreen="true" data-mediaembed="csdn" frameborder="0" id="NIW8kkg8-1731052310353" src="https://live.csdn.net/v/embed/433203"></iframe>AI巨头下场!揭秘实在Agent和Claude能力有啥区别?
第一步、安装。目前Claude的computer use,需要通过代码来部署,且需要提前充值;而实在Agent可以在官网免费下载,账户内免费赠送半个月的Tokens用量。
第二步、部署好之后,我们对比发现两者的UI使用差距还是挺大的。Claude的computer use是在左侧有一个对话窗口的输入框,在右侧进行工作;实在Agent则是拥有一个悬浮的对话框,可以随时通过快捷键呼出和隐藏,你们觉得哪个更方便呢?
第三步、我们先测试一个简单的问题,看它们能不能快速打开某个网页。我们在输入框输入打开的网站页面的任务后,Claude的computer use会首先拍拍摄桌面的截图,然后识别出了浏览器点击了执行;然后又拍摄了一张图片,点击地址栏输入网址并加载;等待页面加载完后,它会拍摄第三张图片,并对任务进行总结,目前因为每张照片都需要重新分析和识别,大概花了将近3分钟;让我们看看实在Agent表现如何,(在B站打开老塔的AI工具箱的主页),它自动把任务拆解成了X个步骤,点击执行它就打开了BiliBili,在搜索框中输入了对应账号名,点击搜索,打开了相应博主的主页,整体用时大约XX秒。
可以看到Claude的computer use和实在Agent的能力类似,但是速度差距还是很大。
本质上是因为,Claude是通过拍照来看见屏幕的,相当于需要重新认知每个桌面;而实在Agent不仅有屏幕语义理解的能力,还多市面上主流的浏览器和软件进行了加强训练,所以即便是当前页面没有的元素,它也能找到。如果说Claude是一个每一步都要查字典的电脑小白,那么实在Agent可以称之为软件专家啦!
下一次,等Claude更成熟之后。我们再测一测更复杂的任务
标签:use,AI,Agent,实在,Claude,computer From: https://blog.csdn.net/SHIZAIZHINENG/article/details/143628067