- 2024-11-01py使用df合并一万个xls到一个xls
importpandasaspdimportglobpd.set_option('display.float_format',lambdax:f'{x:.0f}'ifpd.notna(x)elsex)dtypes={'所属区':str,'个人编号':str,'身份证号码':str,'姓名':str,'单位编号':str,
- 2024-10-03use combined and 'and' or query in the mongo
1、description: usecombinedandandorqueryinthemongo2、sqlquerystatement: select*fromdeviceInfo wheredevId='11010001' and (sndStatus=0orsndCount<3);3、matchmongosqlquery: db.getCollection("deviceInfo&qu
- 2024-09-29生信机器学习入门4 - 构建决策树(Decision Tree)和随机森林(Random Forest)分类器
机器学习文章回顾生信机器学习入门1-数据预处理与线性回归(Linearregression)预测生信机器学习入门2-机器学习基本概念生信机器学习入门3-Scikit-Learn训练机器学习分类感知器生信机器学习入门4-scikit-learn训练逻辑回归(LR)模型和支持向量机(SVM)模型1.决策树(Dec
- 2024-07-03LLM大模型: RAG的最优chunk方法 — 利用本地离线LLM的embedding实现Semantic Chunking
1、RAG整个流程的核心节点如下:第一个重要的节点就是chunk。chunk最核心的目的就是把相同语义的token聚集在一起,不同语义的token互相分开,利于后续的retrieve和rerank。举个例子:今天天气很好,我和小明在一起打篮球。隔壁老王在家里看电视。小明的妈妈在家里做晚饭,晚上我
- 2024-03-19py
importpandasaspdimportnumpyasnpfromsklearn.preprocessingimportOneHotEncoderfromsklearn.manifoldimportTSNEimportplotly.expressaspx#1.加载数据并转化为DataFramedata=pd.read_csv('ma2.csv',header=None)#假设第一列至第三列分别为年龄聚类、城市
- 2024-02-15P1618 三连击(升级版)
三连击(升级版)题目描述将\(1,2,\ldots,9\)共\(9\)个数分成三组,分别组成三个三位数,且使这三个三位数的比例是\(A:B:C\),试求出所有满足条件的三个三位数,若无解,输出No!!!。//感谢黄小U饮品完善题意输入格式三个数,\(A,B,C\)。输出格式若干行,每行\(3\)个数字。按照每行
- 2023-09-17Go - Merge Sort
MergeSort.gopackagemainfuncMergeSort(items[]int)[]int{n:=len(items)varcombined[]intswitch{casen<=1:combined=itemscasen==2:ifitems[0]<=items[1]{combined=items
- 2022-11-13单细胞基础教程:跨条件整合分析
导读撰写本文的主要目的是:整合处理与对照后的PBMC(Humanperipheralbloodmononuclearcell,人外周血单个核细胞)数据集以了解细胞类型特异性反应和整合的作用。本教程
- 2022-10-29Theory and practice are combined
Theoryiswhenyouknoweverythingbutnothingworks.Practiceeiswheneverythingworksbutnooneknowswhy.inoutlab,theoryandpracticearecombined:No
- 2022-10-05VMware Workstation安装软路由OpenWrt
OpenWrt可以被描述为一个嵌入式的Linux发行版。(主流路由器固件有dd-wrt,tomato,openwrt,padavan四类)对比一个单一的、静态的系统,OpenWrt的包管理提供了一个完全可写的文