首页 > 其他分享 >生物信息学家、计算机科学家和遗传学家,谁主导开发的生物信息学工具更好?

生物信息学家、计算机科学家和遗传学家,谁主导开发的生物信息学工具更好?

时间:2024-08-30 13:15:24浏览次数:12  
标签:信息学 遗传学家 领域 准确性 生物 软件工具 学术

新西兰奥塔哥大学高级讲师(Senior Lecturer ) Paul P. Gardner 在 bioRxiv 上发表了一篇名为《A Bioinformatician, Computer Scientist, and Geneticist lead bioinformatic tool development — which one is better?》的预印版文章,旨在探讨生物信息学软件工具开发中,作者所属学术部门与他们开发的工具准确性之间的关系。以下解读由 Kimi AI 生成,人工小修改。

image

摘要

  • 研究强调了开发准确的生物信息学软件工具对于复杂生物数据有效分析的重要性。
  • 通过分析一系列已经基准测试过的生物信息学软件工具,研究者将这些工具与相应作者的学术领域进行了映射,并评估了各领域的工具准确性。
  • 结果表明“医学信息学”在生物信息学软件准确性方面表现优于其他领域,但其平均获胜比例超过了随机预期。
  • 然而,在多重测试校正后,所有结果都不具有统计学意义(p > 0.05)。
  • 研究发现学术领域与生物信息学软件准确性之间没有强关联,表明跨学科软件应用的有效开发可以由任何拥有足够资源和培训的部门承担。

背景

  • 学术界内部的部门划分通常表示研究和教学专长,影响招聘决策、资金获取、出版和研究项目中招募的学生培训。
  • 生物信息学打破了传统部门和学科领域的界限,融合了生物学、计算机科学和数学。
  • 生物信息学工具和软件的开发对于解释复杂的生物学问题至关重要。

方法

  • 研究的数据和代码可从 https://github.com/ppgardne/departments-software-accuracy 获取。
  • 使用了来自68个出版物的基准测试数据,对498个不同的软件工具的准确性进行了排名。
  • 作者所属部门的名称被映射到最接近的“研究领域”,并分析了这些领域在三个层次上:特定领域、更广泛的一般领域和专业知识类型。

结果

  • 研究者探索了生物信息学软件工具的准确性与开发者所属学术领域之间的关系。
  • 使用已发布的基准测试数据,将工具映射到相应的学术领域,并评估了开发者学术隶属与软件准确性的相关性。
  • “医学信息学”在准确性排名中表现最佳,但经过多重测试校正后,P值为0.29,没有统计学意义。
  • 而“生物信息学”和“工程学”领域的工具准确性较低,但同样没有统计学意义。

结论和限制

  • 研究没有发现学术部门的专业与生物信息学工具的准确性有显著关联,表明学术部门隶属不应作为判断软件开发项目潜力的代理。
  • 研究的局限性包括基准测试的多样性和准确性度量标准的潜在缺陷,以及基准测试样本量较小可能带来的影响。

文章链接

https://doi.org/10.1101/2024.08.25.609622

标签:信息学,遗传学家,领域,准确性,生物,软件工具,学术
From: https://www.cnblogs.com/shiyanhe/p/18386022

相关文章

  • 信息学奥赛初赛天天练-78-NOIP2015普及组-基础题3-中断、计算机病毒、文件传输协议FTP
    NOIP2015普及组基础题38所谓的“中断”是指()A操作系统随意停止一个程序的运行B当出现需要时,CPU暂时停止当前程序的执行转而执行处理新情况的过程C因停机而停止一个程序的运行D电脑死机9计算机病毒是()A通过计算机传播的危害人体健康的一种......
  • 生物实验室远程文件同步,怎么做才能既安全又高效?
    在生物实验室中,有许多数据需要及时地同步,这些数据的同步对于确保实验结果的准确性、保障实验人员的安全、提高实验室管理效率以及满足外部合规性要求至关重要。以下是一些具体需要同步的文件类型:实验原始数据:包括实验过程中收集的所有直接测量结果,如基因序列、蛋白质表达水平、......
  • UDP-6-Biotinyl-GlcNAc中生物素化修饰对糖蛋白的功能具有哪些影响?
    UDP-6-Biotinyl-GlcNAc中生物素化修饰对糖蛋白的功能具有哪些影响?UDP-6-Biotinyl-GlcNAc是一种具有特定化学结构的分子。一、分子结构特点它由尿苷二磷酸(UDP)、6-生物素修饰基团以及N-乙酰葡糖胺(GlcNAc)组成。结构式:二、作用与用途1.在生物学研究中,常被用作工具分子......
  • 在生物体内UDP-2-Biotinyl-GlcNAc是如何被代谢的?
    在生物体内UDP-2-Biotinyl-GlcNAc是如何被代谢的?UDP-2-Biotinyl-GlcNAc是一种具有特定化学结构和重要生物学功能的分子。一、分子结构特点它由尿苷二磷酸(UDP)、2-生物素修饰基团和N-乙酰葡糖胺(GlcNAc)组成。这种独特的结构使其在糖基化研究和生物技术领域中具有重要价值......
  • 信息学奥赛一本通1314:【例3.6】过河卒(Noip2002)
    【题目描述】棋盘上A点有一个过河卒,需要走到目标B点。卒行走的规则:可以向下、或者向右。同时在棋盘上的某一点有一个对方的马(如C点),该马所在的点和所有跳跃一步可达的点称为对方马的控制点,如图3-1中的C点和P1,……,P8,卒不能通过对方马的控制点。棋盘用坐标表示,A点(0,0)、B点(n,......
  • 信息学奥赛一本通1328:【例7.7】光荣的梦想
    【题目描述】Prince对他在这片大陆上维护的秩序感到满意,于是决定启程离开艾泽拉斯。在他动身之前,Prince决定赋予King_Bette最强大的能量以守护世界、保卫这里的平衡与和谐。在那个时代,平衡是个梦想。因为有很多奇异的物种拥有各种不稳定的能量,平衡瞬间即被打破。KB决定求助于......
  • 信息学奥赛初赛天天练-77-NOIP2015普及组-基础题2-二进制、连通图、最小生成树、链表
    NOIP2015普及组基础题24在计算机内部用来传送、存贮、加工处理的数据或指令都是以()形式进行的A二进制码B八进制码C十进制码D智能拼音码5下列说法正确的是()ACPU的主要任务是执行数据运算和程序控制B存储器具有记忆能力,其中信息任何时候都不会......
  • 南沙信息学家教陈老师: 1349:【例4-10】最优布线问题
    ​【题目描述】学校有nn台计算机,为了方便数据传输,现要将它们用数据线连接起来。两台计算机被连接是指它们有数据线连接。由于计算机所处的位置不同,因此不同的两台计算机的连接费用往往是不同的。当然,如果将任意两台计算机都用数据线连接,费用将是相当庞大的。为了节省费用,我们......
  • 从生物到人工智能——论神经元模型
    前言本系列主要讲述人工神经网络基础知识,并结合数学公式与生物模型,对比分析人工智能与生物计算的区别与联系。鄙人不才,所有观点与想法均为笔者所理解内容,同时所有图表均为网络搜寻图片,请尊重原创,欢迎大家批评指正。神经元模型本文从生物神经元入手,由生物神经元模型逐步过......
  • 信息学奥赛初赛天天练-76-NOIP2015普及组-基础题1-计算机存储、硬件系统、操作系统、
    NOIP2016普及组基础题111MB等于()A10000字节B1024字节C1000×1000字节D1024×1024字节2在PC机中,PENTIUM(奔腾)、酷睿、赛扬等是指()A生产厂家名称B硬盘的型号CCPU的型号D显示器的型号3操作系统的作用是()A把源程序译成目......