首页 > 其他分享 >这个彩蛋表明,图灵测试评估的也许不是计算机,而是人类……

这个彩蛋表明,图灵测试评估的也许不是计算机,而是人类……

时间:2023-06-25 13:35:53浏览次数:33  
标签:评判员 计算机 论文 图灵 智能 彩蛋 测试


题图 | ARCHIVIO GBB/CONTRASTO/REDUX

我们知道,图灵对人脑和机器之间的联系非常着迷,在1936年发表可计算数论文之后,他对这个问题的痴迷仍延续了很久。1950年,他在哲学期刊Mind上发表了另一篇著名论文《计算机器和智能》(Computing Machinery and Intelligence)的论文,这篇论文的技术性不是很强,图灵在文中提出一个问题:机器能思考吗?

模仿游戏

他并未试图去定义“机器”和“思考”,而是略述了一种思想实验,该方法源自维多利亚时代的一种叫做“模仿游戏”的娱乐活动:房间里有一男一女,房间外有一个评判员。评判员可以提问题,房间内的人通过手写卡片来回答。评判员要猜测对方是男是女。难点在于,男人一直设法模仿女人来欺骗评判员,而女人则设法让评判员相信自己才是女人。

这个彩蛋表明,图灵测试评估的也许不是计算机,而是人类……_游戏

模仿游戏 | 图源:Doug Rose

图灵受此启发,发明了一个测试,这个测试需要一个人坐在电传打字机前。这个人问问题,接受答案。如果另一端是计算机,而这个人无法判断它是否是一台计算机,那么就说计算机是具备人类智能的。

这个彩蛋表明,图灵测试评估的也许不是计算机,而是人类……_编程语言_02

图灵测试 | 图源:Diseño propio

这就是著名的图灵测试,它至今依旧存在争议。任何对图灵测试有适当反对意见的人都应该读一读图灵的这篇论文,里面有对很多合情合理的反对意见的解答。

图灵喜欢用术语“智能”而不是“思考”来处理这个问题,因为“思考”暗含在计算机内部进行的特定活动:

“机器能思考吗?”我认为,这个原始问题过于无意义,不值得讨论。不过,我认为到这个世纪末,这样的说法以及一般的教育观点都会有很大改观,那时候再谈及机器思考将不会受到抵触和反对。

上个世纪末已经过去了,若说有什么改观,那就是比以往任何时候都多的人知道了计算机能够干什么。但可以确定的是,计算机能干的事不是“思考”。我们还没到可以期待计算机媲美人类智能的地步。

图灵机和图灵测试是阿兰·图灵声明不朽的两大基石。有人认为,图灵机是以一种非常机械的方式展现人类如何进行数学运算的,而图灵测试则是对计算机能力的人为评估。但事实果真如此吗?

论文中的彩蛋

仔细阅读图灵的论文会发现一个小细节:测试中存在一处“歧义”,这也许表明图灵更多的是将图灵测试作为在哲学层面上对机器智能的挑衅,而不是作为一种实际测试。在论文中,图灵模拟了测试未来的智能计算机的场景(人类提问,计算机回答)。

问:请给我写一首关于福斯桥的十四行诗。

答:还是算了吧,我永远都不会写诗。

问:34957加70764等于多少?

答:(停顿约30秒后回答)105621。

问:你会下国际象棋吗?

答:会。

问:我在我的K1处有棋子K,除此之外再无其他。你在K6处有棋子K、R1处有棋子R。现在该你走了。你怎么走?

答:(停顿15秒后)把棋子R走到R8处,将军。

这个彩蛋表明,图灵测试评估的也许不是计算机,而是人类……_cstring_03

在这个测试中,计算机犯了一个数学上的错误。34957加70764实际上等于105721,而非105621。作为一位杰出的数学家,图灵应该不太可能犯下这种低级错误,他更有可能是将其作为送给敏锐读者的一个彩蛋。

图灵在论文的其他部分似乎有所暗示:计算错误是一种编程技巧,是欺骗评判员的手段。图灵很清楚,如果细心的读者发现了计算机的回答有误,那么他们就会认为自己是在跟人类对话。毕竟,计算机怎么会犯这种基本的运算错误呢?图灵写道:可以通过编程使机器“故意在计算上犯错,从而迷惑评判人员”。

虽然在1950年用“故意犯错”来暗示机器具有“人类智能”的想法或许难以理解,但如今的NLP程序员其实已经这么做了。

比如,2014年6月有报道称,一个叫做Eugene Goostman的聊天机器人成为首个通过图灵测试的计算机。但很快就有批评者指出,它之所以能通过测试,只是因为内置了作弊程序:Eugene模仿了一个以英语为第二语言的13岁小男孩,这就意味着它在文法和句法方面的错误,以及它的知识不完备,会被误认为是小孩的天真和不成熟,而不是自然语言处理能力上的缺陷。

再比如,2018年谷歌的语音助理Duplex因其能发出很像人类的“嗯”和“啊”声而艳惊四座。然而有很多人指出,这并非是系统真正思考之后的呈现,而是通过编程手段模拟的人类认知活动中的犹豫。

这两个案例都印证了图灵的想法:可以通过编程让计算机犯一些简单的错误,从而让人觉得它们是人。和图灵一样,Eugene和Duplex的程序员也很明白,让计算机在表面上展现出人类会犯的错误,就足以迷惑我们了。

也许图灵测试评估的并非机器是否具有智能,而是评估我们人类是否愿意接受机器是智能的。正如图灵本人所言:“对智能本身的判定是感性的,而非数学的。我们在多大程度上将某物的表现视为智能,取决于我们自己的心理状态和所受的教育,也取决于考察对象的特性。”

图灵似乎是在暗示我们,或许智能不是一种可以通过编程让机器获得的东西,而是一种通过社会互动构建的特质。

对此,你怎么看?

这个彩蛋表明,图灵测试评估的也许不是计算机,而是人类……_人工智能_04

References

[1]https://spectrum.ieee.org/untold-history-of-ai-why-alan-turing-wanted-ai-to-make-mistakes

[2]《图灵的秘密:他的生平、思想及论文解读》

编译:刘文元

标签:评判员,计算机,论文,图灵,智能,彩蛋,测试
From: https://blog.51cto.com/u_15767091/6545059

相关文章

  • 基于k6和python进行自动化性能测试
    摘要:在性能测试中,达到相应的性能指标对于一个软件来说十分重要,在本文中,将介绍一种现代化性能测试工具k6。本文分享自华为云社区《基于k6和python进行自动化性能测试》,作者:风做了云的梦。当我们开发完成一个应用程序时,往往需要对其进行性能测试,以帮助我们更好的优化程序以及发现......
  • 测试人员学习Linux
    1、Linux虚拟机IP地址冲突,修改后,重启网卡的命令是servicenetworkrestart2、修改/home/hzntest文件的权限,使所属用户有所有权限,所属组有可读可写的权限,其他只有可读的权限chmod-R764/home/hzntest3、将/home/hzn/hzn.tar.gz文件解压到/hzn/test目录下的命令tar-zxvf/home/......
  • mockito5.4.0单元测试(9) --调用同一个方法和参数依次返回不同的值thenReturn和thenTh
    mockito官方文档地址:https://www.javadoc.io/doc/org.mockito/mockito-core/latest/org/mockito/Mockito.html#exact_verification//mock一个对象ListsingleMock=mock(List.class);when(singleMock.get(20)).thenThrow(newRuntimeException())//mock第一次调用......
  • python测试
      importosimportshutildefcheck_dir_exist(dir):#如果目标路径不存在原文件夹的话就创建ifnotos.path.exists(dir):os.makedirs(dir)defremove_dir(dir):#如果目标路径存在原文件夹的话就先删除ifos.path.exists(dir......
  • Junit5 单元测试
    一、Junit5的架构JUnit5由三个不同子项目中的几个不同模块组成。JUnit5=JUnitPlatform+JUnitJupiter+JUnitVintage,如下:JUnitplatform:为了能够启动junit测试,IDE、构建工具或者插件需要包含和扩展平台API。它定义了用于开发在平台上运行的新测试框架的“TestEngine”A......
  • 锚点测试
    为模块定义main11test111111122222222222222一些python包可以通过传递-m来调用,比如:python-mpytestpython-mtryceratopspython-mfaustpython-mflake8python-mblack2.一旦你觉得你可以将不同的功能子集分组,就封装成类......
  • 第六节:基于.Net的OpenAI包测试使用ChatGPT的各种Api
    一.前置1. 说明 支持多种语言,详见:https://platform.openai.com/docs/libraries/community-libraries 以.Net为例,主要有三个包  OpenAI           https://github.com/OkGoDoIt/OpenAI-API-dotnet  Betalgo.OpenAI     https://g......
  • 三层靶机内网渗透测试
    三层靶机内网渗透测试信息收集目标ip:192.168.31.145端口信息收集:nmap-A-T4-p- 192.168.31.145开放端口:21/22/80/111/888/3306/8888   操作系统:Liunx分析利用21/22端口--弱口令爆破hydra-vV-lroot-P/usr/share/wordlists/metasploit/password.lst 192.1......
  • JUnit4单元测试介绍
     什么是JUnit?JUnit是测试框架,它用于Java代码的单元测试。JUnit=Java+UnitTesting什么是JUnit4?JUnit4是一个Java语言的单元测试框架,用于编写和执行单元测试。它是JUnit框架的第四个主要版本,并且是过去几年中最常用的版本。以下是一些关键特性和概念:注解驱动:J......
  • WEB安全-渗透测试-waf绕过信息收集
    waf绕过WAF拦截会出现在安全测试的各个层面,掌握各个层面的分析和绕过技术最为关键本文主要讲述以下四种环境下的waf绕过Safedog-默认拦截机制分析绕过-未开CCSafedog-默认拦截机制分析绕过-开启CCAliyun_os-默认拦截机制分析绕过-简要界面BT(防火墙插件)-默认拦截机制分......