首页 > 其他分享 >AI Scientist:世界上第一位 AI 科学家智能体!!(AI研究员 & 本地安装 & 撰写论文)

AI Scientist:世界上第一位 AI 科学家智能体!!(AI研究员 & 本地安装 & 撰写论文)

时间:2024-08-20 21:55:19浏览次数:8  
标签:撰写论文 AI 模型 论文 生成 Scientist 科学家

AI Scientist:世界上第一位 AI 科学家智能体!!(AI研究员 & 本地安装 & 撰写论文)

原创 Aitrainee AI进修生 2024年08月16日 23:08 湖南

Aitrainee | 公众号:AI进修生

Hi,这里是Aitrainee,欢迎阅读本期新文章。

分享来自Sakana AI的一个新的研究工具,名为AI Scientist。

你是否希望自己撰写关于机器学习或其他主题的研究论文,比如这样的内容?

图片

那么这个工具AI Scientist可以帮助你。

这是世界上第一个用于自动化科学研究和开放式探索的AI系统,你只需运行它,它就会为你生成一篇完整的论文,文末会附上部署视频教程链接~

图片

该公司致力于开发受自然系统启发的AI模型,比如鱼群和蜂群。旨在利用多个较小的模型协同工作,类似于自然界的群体活动

AI Scientist 从 创意生成 到 编写代码、运行实验、总结结果,再到撰写整篇论文和进行同行评审。

图片

我们可以看到AI科学家的概架构图:

图片

首先,AI科学家会构思一组想法,然后评估这些想法的新颖性,检查它们是否有新的创意,以及是否已经被探讨过。

接下来,基于最近的自动代码生成技术,AI科学家编辑代码库以实现这些新算法。

然后,AI科学家运行实验,收集结果,包括数值数据和视觉摘要,并撰写科学报告,解释和上下文化这些结果。

最后,AI科学家基于顶级机器学习会议的标准生成自动化的同行评审,这个评审帮助完善当前项目,并为未来的开放式创意提供反馈。

这就使得AI科学家能够通过连续反馈循环,不断改进其研究成果。

当与最强大的LLM结合时,AI科学家能够生成论文,并被自动评审员评定。

但我个人最大的疑问是,这些论文的质量如何 ??

他们在研究中使用的一个模型是Claude Sonnet 3.5,他们发现该模型在生成论文方面表现最佳,有几篇论文的得分甚至超过了顶级机器学习会议的接受门槛。

不过,根据提供的信息,AI科学家生成的论文包含了一些潜在的新见解,但整体质量参差不齐。

举例来说,一篇关于低维数据的扩散模型的论文在样本质量和分布匹配方面显示了显著改进;另一篇论文提出了一种新颖的双专家去噪架构,表现出性能改进。

这些是他们在项目页面上分享的一些示例,AI Scientist从摘要到结论到参考文献,全部写成了科学格式的论文。

图片

▲ 双尺度扩散:低维生成模型的自适应特征平衡

图片

▲ 通过 Q-Learning 实现 Transformers 的自适应学习率

图片

▲ 解锁 Grokking:Transformer 模型中权重初始化策略的比较研究

总体而言,这些论文被评定为中等质量,类似于早期机器学习研究人员的作品,他们能够正确执行想法,但可能缺乏深厚的背景知识。

虽然这些论文并不代表可以发表的新知识,但它们可以作为人类研究人员的起点或灵感来源

这个AI科学家目前没有视觉能力,因此无法修复论文中的视觉问题或读取图表。

生成的图表有时难以读取,表格有时会超出页面宽度,页面布局往往不理想。但添加多模态基础模型可以解决这个问题。

图片

部署教程

概览

AI Scientist(AI科学家)是一个旨在通过大型语言模型(LLMs)来自动化科学研究和开放式发现的综合系统。该系统可以自动生成研究想法、运行实验、撰写论文,甚至进行同行评审。这一系统能够独立操作,可能会通过降低生产科学工作所需的成本和努力,来促进研究的普及。

主要特点:

  • • 自动化研究过程:从想法生成到实验执行,再到论文写作,全部由AI完成。

  • • 模拟同行评审:系统还能对生成的论文进行评审,以评估其质量。

  • • 基于模板:AI Scientist 使用可定制的模板来处理不同的研究任务。

生成的示例论文:

以下是一些示例论文的主题:

  • • 低维生成模型的自适应特征平衡。

  • • 使用基于网格的噪声自适应增强扩散模型。

  • • 在扩散模型中通过双专家去噪提高模式捕获能力。

安装与设置:

要安装和设置该环境,您需要:

  1. 1. 创建 Conda 环境

    conda create -n ai_scientist python=3.11
    conda activate ai_scientist
  2. 2. 安装所需的包

    pip install anthropic aider-chat backoff openai
    pip install matplotlib pypdf pymupdf4llm
    pip install torch numpy transformers datasets tiktoken wandb tqdm
  3. 3. 安装 LaTeX

    sudo apt-get install texlive-full
  4. 4. 设置 API 密钥:提供不同模型的 API 密钥:

    export OPENAI_API_KEY="你的密钥"
    export S2_API_KEY="你的密钥"
  5. 5. 准备 NanoGPT 数据

    python data/enwik8/prepare.py
    python data/shakespeare_char/prepare.py
    python data/text8/prepare.py

运行实验:

您可以使用不同的模型和模板运行实验。示例命令如下:

python launch_scientist.py --model "gpt-4o-2024-05-13" --experiment nanoGPT_lite --num-ideas 2
python launch_scientist.py --model "claude-3-5-sonnet-20240620" --experiment nanoGPT_lite --num-ideas 2

获取由 LLM 生成的论文评审:

您还可以为论文生成评审:

import openai
from ai_scientist.perform_review import load_paper, perform_review

client = openai.OpenAI()
model = "gpt-4o-2024-05-13"
paper_txt = load_paper("report.pdf")
review = perform_review(
    paper_txt,
    model,
    client,
    num_reflections=5,
    num_fs_examples=1,
    num_reviews_ensemble=5,
    temperature=0.1,
)

标签:撰写论文,AI,模型,论文,生成,Scientist,科学家
From: https://blog.csdn.net/sinat_37574187/article/details/141367809

相关文章

  • AI Native应用中的模型微调
    在AINative应用中,模型微调是一个关键步骤,它允许开发者使用特定领域的数据对预训练模型进行二次训练,从而使其更好地适应特定任务或数据集。以下是对AINative应用中的模型微调进行详细解析:一、模型微调的定义模型微调(Fine-Tuning)是指在预训练模型的基础上,通过对其参数进行进......
  • 《AI办公类工具PPT系列之二——iSlide AI》
    一.简介官网:iSlide-让PPT设计简单起来|PPT模板下载平台iSlideAI是一款基于人工智能技术的PPT制作工具,它可以帮助用户快速高效地创建演示文稿二.功能介绍1.AI一键生成PPT文档导入与解析:用户可以直接上传本地文档(如Word、Markdown、思维导图等),iSlideAI将自动解析和梳......
  • AI电商全流程:轻松掌握Stable Diffusion AI绘画技巧
    前言本课程将带你全面掌握人工智能AI绘画的全流程操作,特别是针对StableDiffusion的实战教学。无论你是初学者还是想要提升技能的从业者,这门保姆级教程都将为你提供详细的操作指导和实用技巧,帮助你在电商领域充分发挥AI的潜力。整理和输出教程属实不易,觉得这篇教程对你有......
  • NoteGPT:快速掌握100本书的精华,尽在AI图书库
    无需操作,NoteGPT的AI图书库1天读完100本书的精华,阅读效率飙升!书海浩瀚,当我们打开一列书单,该从哪一本读起呢?当老师给我们阅读任务,从何处下手撰写读书笔记呢?当我们面对读不懂的书,怎么理解它呢?NoteGPT的AI图书库功能,用AI帮我们读了100本书,不需要输入任何指令,即可直接阅读该书本......
  • AI萌宠跳舞视频项目,单日收入200+,适合新手入局!
    前言如果你被割过N次韭菜却没挣过1分钱,可以加我好友,我可以免费送你我们团队亲自操作过绝对靠谱的副业项目合集《450个搞钱玩法合集》以及500位网友踩坑总结的《亏钱启示录》。我的微信(长按复制):luyuanlight创业八年,我认识了几百上千个不靠上班,做自己喜欢的事赚钱,自己构建自......
  • Datawhale AI夏令营第五期(最后一期啦)开始报名(友好型方向)
    ......
  • 跟着 iLogtail 学习高质量软件建设
    作者:余韬本文根据iLogtailPMC成员余韬2024年6月26日在DBAPlus社群的公开直播《云上千万级可观测AgentSRE实践》整理而成。引言近年来,关于可靠性工程这一话题的热议不断升温,这主要归因于当前形势的显著变化。首先,行业竞争日益激烈,以往的蓝海市场或空白领域已逐......
  • 讯飞星火极速超拟人交互技术:语音端到端,8 月底开放;昆仑万维发布 AI 短剧平台 SkyReels
       开发者朋友们大家好: 这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(Real-TimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观......
  • Java笔试面试题AI答之线程(2)
    文章目录7.如何确保N个线程可以访问N个资源同时又不导致死锁?1.资源排序与顺序访问2.资源分配策略3.避免占用并等待4.引入超时机制5.死锁检测与解决6.使用高级并发工具7.编程实践8.Java方法可以同时即是static又是synchronized的吗?9.什么是Java多线程同步?10......
  • 精度管理|AIRIOT智慧仓储解决方案
    随着国内数字化建设的持续深化,全行业对高效数字化管理的需求日益增长,仓储场景亦步入了一个更为高阶的数字化转型时代,智慧仓储作为工业4.0的核心支柱是现代物流体系中不可或缺的关键一环。然而,当前传统的仓储管理模式在实践中仍面临诸多痛点与挑战: 高度人工依赖、效率低下:传......