• 2024-07-03LLM大模型: RAG的最优chunk方法 — 利用本地离线LLM的embedding实现Semantic Chunking
     1、RAG整个流程的核心节点如下:第一个重要的节点就是chunk。chunk最核心的目的就是把相同语义的token聚集在一起,不同语义的token互相分开,利于后续的retrieve和rerank。举个例子:今天天气很好,我和小明在一起打篮球。隔壁老王在家里看电视。小明的妈妈在家里做晚饭,晚上我
  • 2024-03-19py
    importpandasaspdimportnumpyasnpfromsklearn.preprocessingimportOneHotEncoderfromsklearn.manifoldimportTSNEimportplotly.expressaspx#1.加载数据并转化为DataFramedata=pd.read_csv('ma2.csv',header=None)#假设第一列至第三列分别为年龄聚类、城市
  • 2024-02-15P1618 三连击(升级版)
    三连击(升级版)题目描述将\(1,2,\ldots,9\)共\(9\)个数分成三组,分别组成三个三位数,且使这三个三位数的比例是\(A:B:C\),试求出所有满足条件的三个三位数,若无解,输出No!!!。//感谢黄小U饮品完善题意输入格式三个数,\(A,B,C\)。输出格式若干行,每行\(3\)个数字。按照每行
  • 2023-09-17Go - Merge Sort
    MergeSort.gopackagemainfuncMergeSort(items[]int)[]int{n:=len(items)varcombined[]intswitch{casen<=1:combined=itemscasen==2:ifitems[0]<=items[1]{combined=items
  • 2022-11-13单细胞基础教程:跨条件整合分析
    导读撰写本文的主要目的是:整合处理与对照后的PBMC(Humanperipheralbloodmononuclearcell,人外周血单个核细胞)数据集以了解细胞类型特异性反应和整合的作用。本教程
  • 2022-10-29Theory and practice are combined
    Theoryiswhenyouknoweverythingbutnothingworks.Practiceeiswheneverythingworksbutnooneknowswhy.inoutlab,theoryandpracticearecombined:No
  • 2022-10-05VMware Workstation安装软路由OpenWrt
    OpenWrt可以被描述为一个嵌入式的Linux发行版。(主流路由器固件有dd-wrt,tomato,openwrt,padavan四类)对比一个单一的、静态的系统,OpenWrt的包管理提供了一个完全可写的文