• 2024-11-01py使用df合并一万个xls到一个xls
    importpandasaspdimportglobpd.set_option('display.float_format',lambdax:f'{x:.0f}'ifpd.notna(x)elsex)dtypes={'所属区':str,'个人编号':str,'身份证号码':str,'姓名':str,'单位编号':str,&#
  • 2024-10-03use combined and 'and' or query in the mongo
    1、description:  usecombinedandandorqueryinthemongo2、sqlquerystatement:    select*fromdeviceInfo wheredevId='11010001' and (sndStatus=0orsndCount<3);3、matchmongosqlquery:   db.getCollection("deviceInfo&qu
  • 2024-09-29生信机器学习入门4 - 构建决策树(Decision Tree)和随机森林(Random Forest)分类器
    机器学习文章回顾生信机器学习入门1-数据预处理与线性回归(Linearregression)预测生信机器学习入门2-机器学习基本概念生信机器学习入门3-Scikit-Learn训练机器学习分类感知器生信机器学习入门4-scikit-learn训练逻辑回归(LR)模型和支持向量机(SVM)模型1.决策树(Dec
  • 2024-07-03LLM大模型: RAG的最优chunk方法 — 利用本地离线LLM的embedding实现Semantic Chunking
     1、RAG整个流程的核心节点如下:第一个重要的节点就是chunk。chunk最核心的目的就是把相同语义的token聚集在一起,不同语义的token互相分开,利于后续的retrieve和rerank。举个例子:今天天气很好,我和小明在一起打篮球。隔壁老王在家里看电视。小明的妈妈在家里做晚饭,晚上我
  • 2024-03-19py
    importpandasaspdimportnumpyasnpfromsklearn.preprocessingimportOneHotEncoderfromsklearn.manifoldimportTSNEimportplotly.expressaspx#1.加载数据并转化为DataFramedata=pd.read_csv('ma2.csv',header=None)#假设第一列至第三列分别为年龄聚类、城市
  • 2024-02-15P1618 三连击(升级版)
    三连击(升级版)题目描述将\(1,2,\ldots,9\)共\(9\)个数分成三组,分别组成三个三位数,且使这三个三位数的比例是\(A:B:C\),试求出所有满足条件的三个三位数,若无解,输出No!!!。//感谢黄小U饮品完善题意输入格式三个数,\(A,B,C\)。输出格式若干行,每行\(3\)个数字。按照每行
  • 2023-09-17Go - Merge Sort
    MergeSort.gopackagemainfuncMergeSort(items[]int)[]int{n:=len(items)varcombined[]intswitch{casen<=1:combined=itemscasen==2:ifitems[0]<=items[1]{combined=items
  • 2022-11-13单细胞基础教程:跨条件整合分析
    导读撰写本文的主要目的是:整合处理与对照后的PBMC(Humanperipheralbloodmononuclearcell,人外周血单个核细胞)数据集以了解细胞类型特异性反应和整合的作用。本教程
  • 2022-10-29Theory and practice are combined
    Theoryiswhenyouknoweverythingbutnothingworks.Practiceeiswheneverythingworksbutnooneknowswhy.inoutlab,theoryandpracticearecombined:No
  • 2022-10-05VMware Workstation安装软路由OpenWrt
    OpenWrt可以被描述为一个嵌入式的Linux发行版。(主流路由器固件有dd-wrt,tomato,openwrt,padavan四类)对比一个单一的、静态的系统,OpenWrt的包管理提供了一个完全可写的文