原创 | 文 BFT机器人
2023年,随着GPT在各行各业的爆发,“是否能将GPT用于科研场景”成为了一个水到渠成的问题。当ChatGPT超越大部分人类在高考、SAT、美国法考、医考等领域取得令人咋舌的高分后,人们对于GPT驱动科研的兴趣愈发高涨。截止本报告发布时间(2023年8月)LLM在科研领域的实践已出具端倪,应用生态愈发丰富。在人类的历史长河中,科学以其神秘的魅力吸引着我们,不断引领着我们探索未知的世界,解答生命的奥秘,推动社会的进步与文明的发展。
而如今,当人工智能技术正在改变人们日常生活的同时,它也开始影响人类对科学边缘的探索。我们正处在这样一个交汇点——人工智能与科学探索开始相互碰撞并融合。在这个交汇点的中心,大语言模型(LargeLanguageModels,LLMs)正作为全新的媒介,重塑我们与知识本身的互动方式。在本篇中,我们将系统地探讨LLMs在科学研究中的变革潜力和挑战。首先,我们将阐述LLMs作为人类与知识双向接口的观点;然后,我们将深入探讨LLM处理科学内容的能力边界和改善方法;最后,我们将开放式的讨论当下LLM的最强潜力——思维链(Chain of Thoughts),以及其革新人类科研方法的可能性。
AI作为人与知识交互接口的可能性
印刷术跻身人类的四大发明,实至名归。每一个人的生命有限,然而,将每个人在有限的生命中创造的知识蒸馏沉淀并以文字的形式记录在文本上代代相传、迭代更新,这一范式可以说是人类文明存续的基础。
从原始人刻蚀甲骨、到今天人们在指尖就能调用复杂的数字数据库,人类永远在追求更高效的知识获取、存储和传播方法。正是由于人类以语言作为知识的“溶剂”,像GPT-4这样的大型语言模型(LLMs)才有潜力彻底改变我们与科学知识的互动方式。这场革命的核心在于将LLM 视为双向接口的概念,LLM是一种动态媒介,人们可以通过它提取和贡献知识。
这种双重功能重新定义了人类与无边无际的科学文献之间的关系。这在学科不断交叉,知识不断交汇的今天尤为重要。科学的进步和发展无疑在推动我们的社会向前发展,但在这个过程中,一个主要矛盾越来越显著:即愈发浩繁的知识量与有限人脑容量之间的矛盾。科学的各个领域正以前所未有的速度相互交织和交叉。如同浩瀚的宇宙中的星系碰撞和融合,这些交叉和碰撞产生了全新的领域和深远的影响。
最为明显的例子莫过于2022 年诺贝尔奖的“生物正交反应”,它结合了化学反应的设计和优化与生物体系的复杂性和特殊性,发出具有选择性、效率和生物相容性的反应体系,以满足生物研究、医学诊断和治疗等领域的需求。又如,生物信息学,这一新兴领域就是计算机科学与生物学的结合,正是通过对生物学数据的计算和分析,使得我们能更深入地理解基因,细胞和生态系统。亦如改变微尺度科研的“从头算分子动力学”,正是电子结构研究与分子动力仿真的融合;再比如量子计算,这一领域将量子物理学和计算机科学完美结合,有可能彻底改变我们对计算的理解和应用。
这种趋势的背后也带来了一个挑战:科研人员需要了解的知识面越来越广,而要获取、理解并应用这些跨领域的知识,无疑是一项艰巨的任务。正是在这样的背景下,大语言模型(LLM)的出现给我们带来了希望。
一方面,LLMs使得知识的提取和综合变得高效、便捷。通过解密和呈现复杂的科学信息,它们大大降低了进入新领域的门槛。这确保了即使是新手,也能够导航和理解科学话语,即使他们可能会被专业文献的复杂性所吓倒。例如,ChatPDF允许用户上传PDF文件(通常是一篇科学论文),然后向AI代理提问有关这篇论文的问题,而AI则可以基于其本身的知识理解用户PDF的内容并做出回答 —— 就像教授向学生的传道、授业、解惑一样。这样的能力对于科研人员来说无疑是一种解放。他们无需再浪费大量时间去处理无关的信息,而可以直接专注于自己的研究领域,或者探索新的研究领域。这使得科研人员能够更快地接触并进入新的领域,更好地实现跨领域的研究。
在未来,当进入科学的门槛被大幅降低后,不仅是刚进入科学殿堂的年轻人会大幅受益;已在专业领域深耕数十年的科学家也将得以轻松跨越越来越细分的学科壁垒,在他山找到可以攻玉之石。在世界领先的大学中,常举行跨学科的非正式交流活动,以促使不同领域知识与智慧的碰撞。LLM的出现,可以使得这样的机制在全球范围打破时空限制异步进行,推倒学科之墙,让知识再次自由流淌。
另一方面,LLMs可以加速并改进知识贡献的过程。例如,利用LLMs进行多步推理和决策的能力,研究人员可以在科学文献的迷宫般的广度中找到最相关的论文。这不仅加快了文献回顾的过程,还通过确保对现有知识的全面和相关审查,提高了科学论文的质量。这个过程并非简单的信息检索,而是一个深度学习、多步骤的推理过程,正是这样的推理能力,才能帮助研究人员在繁杂的信息中寻找到最有价值的知识。
此外,LLMs在撰写科学论文中也可以起到关键的作用。通过协助语言生成,它们可以为学者,尤其是英语为第二语言的学者提供必不可少的帮助。LLMs不仅能提供语言方面的帮助,还能帮助构建逻辑叙述并确保连贯性,这在科学话语中是至关重要的,因为复杂的观点和发现必须被精心组织和呈现。
然而,LLM的意义远不止于此。在更大的范围内,LLM让更多人有了贡献知识的机会。知识不再是高墙之内的象牙塔,不再是少数人的专利。任何人,无论他们的语言、背景或地位,都可以通过LLM参与到知识的探索和创新中来。这无疑是一种巨大的进步,是人类文明进入下一个阶段的必要工具。如果没有这样的工具,知识的发展可能只会被少数的传统机构所垄断,导致创新的停滞。
在科技迅猛发展的今天,旧有的知识获取和创新方式已经无法满足我们对进步的渴望。深度学习和人工智能的出现,以及DeepMind和OpenAI等机构的巨大成功,都向我们证明,新的科研方法能够更高效、更有创新性地推动知识的发展。为什么AlphaFold、ChatGPT(以及其背后的Transformer)这些震撼世界的成果没有诞生在大学?这一灵魂拷问也许值得大学管理者们思考。这些新的科研方法并非要取代大学,而是希望通过更开放、更公平的方式,让更多的人参与到知识的探索和创新中来。
AI不会取代大学,但是拥抱AI的大学会超越抵触AI的大学。
人类对知识的渴求是无尽的。LLM的出现不仅为我们解决了获取和处理跨领域知识的难题,也使得科学的交叉和碰撞变得更为自由和流畅。我们有理由期待,这种变革将为我们带来更多的科学突破和创新,这一点,确实令人充满期待和激动。
作者 | 春花
排版 | 春花
审核 | 猫
若您对该文章内容有任何疑问,请与我们联系,将及时回应。想要了解更多资讯,请关注BFT智能机器人系统~