- 2024-11-04AutoBA:一个用于生信多组学分析的完全自动化AI代理
分享一篇近期由华为和阿卜杜拉国王科技大学合作完成的一项生信分析与大语言模型相结合的工作,相关成果发表在《AdvancedScience》上。该文介绍了一个名为AutoBA(AutomatedBioinformaticsAnalysis)的人工智能代理,它专门设计用于全面自动化的多组学分析。AutoBA基于大型语言模型(LL
- 2024-10-06生信软件开发原则与未来方向
分享一篇Y叔(余光创)联合同行老师近期在TheInnovationLife上发表的综述文章:Bioinformaticssoftwaredevelopment:Principlesandfuturedirections。文章主要讨论了生物信息学软件开发的原则和未来的发展方向,强调了人工智能(AI)在加速和增强生物信息学软件开发过程中的重要性,并展
- 2024-09-19生信软件35 - AI代码编辑器Cursor
1.Cursor-AI代码编辑器Cursor的核心功能是利用生成式AI,帮助程序员通过自然语言描述快速生成代码。让程序员未来需要关注的是“做什么”(What)而不是“怎么做”(How),即在使用AI生成代码的基础上,思考能为用户创造什么样的功能。cursor官网地址:https://www.cursor.com/点击【
- 2024-09-02生信phageannotator安装
创建Conda环境:condacreate-nphageannotator_envpython=3.8condaactivatephageannotator_env安装Nextflow:通过Conda安装Nextflow:condainstall-cbiocondanextflow安装nf-core:通过pip安装nf-core工具:pipinstallnf-core下载和安装nf-
- 2024-09-01各位天命人!国自然评审意见出来了,那如何判断是否上会?
公众号:生信漫谈,获取最新科研信息!各位天命人!国自然评审意见出来了,那如何判断是否上会?https://mp.weixin.qq.com/s?__biz=MzkwNjQyNTUwMw==&mid=2247487055&idx=1&sn=1dc8b66e10323d37e477e8829dad0c76&chksm=c0e9ebbff79e62a94fcd49341ae18cfe19aa3aa8ba339bed8ff329a080022dc7
- 2024-08-29生信学习好帮手——生信云服务器,分析更[省心]的云
开篇生物信息学(Bioinformatics)相关领域的快速迭代带来了学习门槛的显著变化,呈现出一种k型分化。一方面,人工智能(AI)和云计算技术的融合降低了原本高门槛的生物信息学技术的入门难度。另一方面,随着越来越多的研究者涌入这一领域,发表文章的难度也随之增加,这要求研究者在专业
- 2024-08-21Python处理生信分析流程配置文件4种方法
在编写生信分析流程时,通常会通过配置文件来定义一些固定的参数,比如软件路径、参考基因组fasta文件路径、基线路径和阈值参数等。1.ini配置文件文件名称:cconfig.iniINI(Initialization)文件是一种简单的配置文件格式,通常由节(section)、键(key)和值(value)组成,是较为常用的配置
- 2024-08-21什么是生信分析?深入探讨生物信息学的技术、方法与广泛应用
介绍生物信息学分析,简称生信分析,是一个结合了生物学、计算机科学、信息学和统计学的多学科领域,旨在处理、分析和解释海量的生物数据。随着现代生物技术的发展,尤其是高通量测序(Next-GenerationSequencing,NGS)技术的广泛应用,生物研究的维度和深度都发生了巨大的变化。生信分
- 2024-08-10生信技能总汇,总有一个技能可以帮助你!
2022年教程总汇2023年教程总汇2024年更新文档对于教程,我们会持续更新!!!!若我们的教程对你有所帮助,请点赞+收藏+转发,这是对我们最大的支持。往期部分文章1.最全WGCNA教程(替换数据即可出全部结果与图形)WGCNA分析|全流程分析代码|代码一WGCNA分析|
- 2024-07-28最近植物科学、生信、育种相关会议集锦
整理了下最近(按时间顺序)举办的一部分与植物科学、基因组学、生物育种、智慧农业等相关会议。点击链接查看详情,供大家参考。第十一届国际园艺研究大会会议时间:2024年7月14日至18日会议地点:云南昆明海埂会堂2024植物分子育种与生物技术学术交流研讨会大会时间:2024年7月19-21日(1
- 2024-07-11生信软件25 - 三代测序数据灵敏比对工具ngmlr
1.ngmlr简介CoNvexGap-costMentsforLongReads(ngmlr)是一种长reads比对工具,可以将PacBio或OxfordNanopore灵敏地与(大)参考基因组(比如人类参考基因组)对齐,能快速和正确地比对reads,包括那些跨越(复杂)结构变异的reads。Ngmlr使用结构变异(SV)感知的k-mer搜索来找到reads的近
- 2024-07-10Hyper-V在Windows 11部署本地Ubuntu虚拟机
挣扎在生信泥潭的兄弟们都知道,目前生信分析所用的大部分软件/package/环境/pipline都是基于Linux系统建立的,因此跳入生信泥潭的第一步便是建立一个Linux环境并开始学习。鉴于本人的谨慎(怕搞乱实验室LinuxServer且Serveroffline)、懒惰(懒得在自己的电脑上安装双系统)以
- 2024-07-07生信算法9 - 正则表达式匹配氨基酸序列、核型和字符串
建议在Jupyter实践。1.使用正则表达式匹配指定的氨基酸序列importre#氨基酸序列seq='VSVLTMFRYAGWLDRLYMLVGTQLAAIIHGVALPLMMLI'#正则表达式匹配match=re.search(r'[A|G]W',seq)#打印match及匹配到开始位置和结束位置print(match)#<re.Matchobject;
- 2024-07-06代谢组数据分析(十三):评估影响代谢物的重要临床指标
欢迎大家关注全网生信学习者系列:WX公zhong号:生信学习者Xiaohong书:生信学习者知hu:生信学习者CDSN:生信学习者2介绍相关性分析是通过计算两个变量之间的相关系数来评估它们之间线性关系的强度和方向。最常用的是皮尔逊相关系数(Pearsoncorrelationcoefficient),其值范
- 2024-06-23发文指南 | 生信植物科学类期刊近五年影响因子分享
前几天(2024.6.20)科睿唯安发布了《期刊引证报告》,公开2023年期刊最新影响因子。本号对植物科学领域和农林科学领域期刊做了及时分享:重磅出炉!2024植物科学领域&农林科学领域期刊影响因子参与本号运营的小伙伴们基本都是生物信息、植物科学类的背景,因此我们对这类期刊近五年来的影响
- 2024-06-16如何从vcf文件中快速提取基因型GT?
如题,如何从vcf文件中快速提取基因型Genotype,得到基因型表格文件?vcf作为标准的存储变异的文件格式。虽是标准格式,但可扩展性极强,变异属性可随意添加,真是很妙的设计!其实vcf格式和vcftools软件文章发表也不过13年而已。基因型矩阵,类似于HapMap格式,市场上大多数芯片也是这种。比如,
- 2024-06-15Sandbox | 免费在线的生信交互学习平台
Sandbox.bio是一个生物信息学沙盒平台,允许用户在安全隔离的环境中运行生物信息学实验。它提供各种工具和资源,包括数据库、算法和工具包,可用于各种生物信息学任务,例如数据分析、模型构建和机器学习。网站:https://sandbox.bio/可以从零练习Linux基本操作,以及生信相关的一些基础
- 2024-06-15文章MSM_metagenomics(一):介绍
介绍欢迎大家关注全网生信学习者系列:WX公zhong号:生信学习者Xiaohong书:生信学习者知hu:生信学习者CDSN:生信学习者2用于复现Huangetal.[@huang2024establishment]研究分析的计算工作流程,所有复现数据和代码见WX公zhong号:生信学习者。目录累积分布函数Read质量检查:Rea
- 2024-06-15R可视化:微生物相对丰度或富集热图可视化
欢迎大家关注全网生信学习者系列:WX公zhong号:生信学习者Xiaohong书:生信学习者知hu:生信学习者CDSN:生信学习者2介绍热图(Heatmap)是一种数据可视化方法,它通过颜色的深浅或色调的变化来展示数据的分布和密度。在微生物学领域,热图常用于表示微生物在不同分组(如不同的环境
- 2024-04-15多个生信分析上游分析Snakemake的编写
准备基本的包condainstall-cbiocondasnakemakesamtoolshisat2trim-galoresubread-y准备数据wgethttps://ftp.ensembl.org/pub/release-110/fasta/sus_scrofa/dna/Sus_scrofa.Sscrofa11.1.dna.toplevel.fa.gzwgethttps://ftp.ensembl.org/pub/release-110/gtf/sus_
- 2024-04-15生信公共数据库下载处理
下载数据基础知识首先了解一下SRA数据库的架构:SRP(项目Project)—>SRS(样本Sample)—>SRX(数据产生Experiment)—>SRR(数据本身)国际上的三大生物数据库:SRA,ENAorDDBJ,分别在美国、欧洲、日本,它们之间的数据是同步的,所以可以在任意一个数据库中下载数据,而EBI数据库能够
- 2024-04-02生信小白菜之关于mutate函数的一切
RforDataScience准备包和示例数据library(dplyr)library(nycflights13)mutate()函数基本用法#作用是添加新列,新列是由原有数据计算的来#添加的新列在数据集的最后#举例flights_sml<-select(flights,year:day,ends_with("delay"),distance,air_time)mu
- 2024-04-02生信小白菜之关于summarize函数的一切(part 1)
准备包和示例数据library(dplyr)library(nycflights13)library(ggplot2)summarize()的基本用法#获取摘要的函数#作用是将数据框折叠成一行#举例summarise(flights,delay=mean(dep_delay,na.rm=T))#第二个参数新的一列,也是根据数据框原有数据计算得来#返回结
- 2024-03-25生信小白菜之GEO芯片数据分析流程--附画图代码
title:“GEOdataanalysis”author:“yuluyang”date:“2024-03-22”生信技能树数据挖掘课程笔记~小洁老师授课主要内容:数据分组的内容关键词的分组和多分组比较idmap报错的原因及解决方法基因组的注释流程数据的行列互换及方差数值画图示例代码示例数据libr
- 2024-03-19生信项目之生信名词解释
目录一、高通量测序与Hi-C测序二、宏基因组三、启动子,终止子,起始密码子,终止密码子四、Read,Reads,Contig,Contigs五、CDS与ORF六、测序深度与覆盖度七、进化树,分子树,系统发生树一、高通量测序与Hi-C测序高通量测序技术(High-throughputsequencing)又称“下一代”测序技术