• 2024-07-04Windows Server2022怎么做文件共享?
    一、共享设置1、在打开的“服务器管理器”仪表板中,点击左侧菜单栏中的“文件和存储服务”-->“共享” 新建共享,我们这里使用“SMB共享-快速”、如果需要也可以使用“SMB共享-高级”两者各有侧重,看自己的实际需要:选择要共享的文件夹位置: 设置共享权限比较重要,我们要禁用
  • 2024-06-01Spire.Doc for Java 12.5.1 -2024-05-30
    Spire.DocforJavaisaprofessionalWordAPIthatempowersJavaapplicationstocreate,convert,manipulateandprintWorddocumentswithoutdependencyonMicrosoftWord.Byusingthismultifunctionallibrary,developersareabletoprocesscopioustasks
  • 2024-05-31山东大学项目实训-基于LLM的中文法律文书生成系统(十四)- RAG(3)
    文档问答过程大概分为以下5部分,在Langchain中都有体现。上传解析文档文档向量化、存储文档召回query向量化文档问答今天主要讲langchain在文档embedding以及构建faiss过程时是怎么实现的。源码入口langchain中对于文档embedding以及构建faiss过程有2个分支,1.当第一次
  • 2024-05-31山东大学项目实训-基于LLM的中文法律文书生成系统(十三)- RAG(2)
    今天主要讲langchain在上传解析文档时是怎么实现的。文档解析逻辑,以txt类型的文件解析为例子step1:寻找上传逻辑入口:local_doc_qa.py,关注TextLoader(),ChineseTextSplitter()defload_file(filepath,sentence_size=SENTENCE_SIZE,using_zh_title_enhance=ZH_TITLE_ENHANCE):
  • 2024-05-30Spire.Office for Java 9.5.0 is released
    Spire.OfficeforJavaisacombinationofEnterprise-LevelOfficeJavaAPIsofferedbyE-iceblue.ItincludesSpire.DocforJava,Spire.XLSforJava,Spire.PresentationforJava,Spire.PDFforJavaandSpire.BarcodeforJava.DeveloperscanuseSpire.Off
  • 2024-05-27db.collection.find(query, projection)
    Selectsdocumentsinacollectionandreturnsa cursor totheselecteddocuments.ParameterTypeDescriptionquerydocumentOptional.Specifiesselectionfilterusing queryoperators.Toreturnalldocumentsinacollection,omitthisparameterorpass
  • 2024-05-01使用 AWS CLI 操作 S3
    使用cp命令将本地文件拷贝到S3,或者将S3中的文件拷贝到本地。awss3cplocal-file-paths3://your-bucket-name/optional-folder-path/remote-file-namelocal-file-path:您的本地机器上的文件路径,比如C:/Documents/example.txt或者/home/user/example.txt。your-bu
  • 2024-04-20语义搜索相关配置
    1.打开services项目,在pom文件中引入依赖如下<dependency><groupId>com.hankcs</groupId><artifactId>hanlp</artifactId><version>portable-1.8.3</version></dependency>2.在hanlpgithub下载语言模型,放入项目根目录下3.在service
  • 2024-04-14LlamaIndex 常见问题解答(FAQ)
     提示:如果您尚未完成,请安装LlamaIndex并完成起步教程。遇到不熟悉的术语时,请参考高层次概念部分。在这个章节中,我们将从您为起步示例编写的代码开始,展示您可能希望针对不同应用场景对其进行的常见定制方法:python fromllama_index.coreimportVectorStoreIndex,Simp
  • 2024-03-28tar命令使用
    最后修改时间2024-03-28参数作用-c创建新的归档文件(打包)-x从归档文件中提取文件(解包)-f<文件名>指定归档文件名-v显示操作的详细信息-z通过gzip压缩归档文件-j通过bzip2压缩归档文件-C<目录>切换到指定目录--exclude=<模式>排除匹配模式
  • 2024-03-24向量数据库Chroma极简教程
    向量数据库Chroma极简教程转载自:https://zhuanlan.zhihu.com/p/665715823引子向量数据库其实最早在传统的人工智能和机器学习场景中就有所应用。在大模型兴起后,由于目前大模型的token数限制,很多开发者倾向于将数据量庞大的知识、新闻、文献、语料等先通过嵌入(embeddi
  • 2024-03-21LeetCode 剑指Offer 练习
    目录题目整理来源:[https://zhuanlan.zhihu.com/p/112990684](LeetCodeByPython:剑指Offer第2版解题目录)数据结构[https://leetcode.cn/problems/shu-zu-zhong-zhong-fu-de-shu-zi-lcof/solutions/](LCR120.寻找文件副本)[https://leetcode.cn/problems/er-wei-
  • 2024-03-14Langchain-ChatGLM源码解读(一)-文档数据上传
    一、简介Langchain-ChatGLM 相信大家都不陌生,近几周计划出一个源码解读,先解锁langchain的一些基础用法。文档问答过程大概分为以下5部分,在Langchain中都有体现。上传解析文档文档向量化、存储文档召回query向量化文档问答今天主要讲langchain在上传解析文档时是怎么实
  • 2024-01-18Stirling-PDF docker安装
    有时候pdf文件需要处理,有个开源工具。https://github.com/Stirling-Tools/Stirling-PDF docker安装1、下载dockerpullfrooodle/s-pdf:latest2、安装dockerrun-d\-p8380:8080\-v/Users/xxxx/Documents/Stirling-PDF/data/:/usr/share/tesseract-ocr/4.
  • 2023-12-30langchain 系列
    langchain-基础langchain-LCELlangchain-Documentslangchain-Modellangchain-Retrievallangchain-Chainslangchain-Agentlangchain-Memory与多轮对话
  • 2023-12-21linux 的别名功能alias
    环境centos7.9介绍Alias是Linux系统中一个非常有用的命令,它可以为常用的命令或复杂的命令序列创建别名。通过使用alias,我们可以简化命令的输入,提高工作效率。使用在~/.bashrc或~/.bash_profile文件中添加以下新行,保存后source下查看当前已设置的别名alias设置单个命令
  • 2023-12-15vulnhub-wp Bob 1.0.1
  • 2023-12-13用python实现电子公文传输系统中遇到的数据库连接问题
    在实现电子公文传输系统时,数据库连接是一个重要的问题。Python中有多种库可以用于数据库连接,比如SQLite、MySQL、PostgreSQL等。下面是一个简单的示例,演示如何使用Python连接MySQL数据库:importmysql.connector#连接数据库conn=mysql.connector.connect(host="localhos
  • 2023-11-29检索增强生成 (RAG)的原理——传统检索+LLM生成相结合
    RAG是一种检索增强生成模型,由信息检索系统和seq2seq生成器组成。它的内部知识可以轻松地随时更改或补充,而无需浪费时间或算力重新训练整个模型。举个例子,假设你正在写一篇关于猫的文章,但你不确定如何描述猫的行为。你可以使用RAG来检索与猫行为相关的文档,然后将这些文档作为上下文
  • 2023-11-14VS2017 fail: An XML declaration with an encoding is required for all non-UTF8 documents
    VS2017打开一个别人的项目,报错无法打开,提示:AnXMLdeclarationwithanencodingisrequiredforallnon-UTF8documents研究一番,没有找到直接原因。换个思路,是不是IDE版本问题?检查一下项目文件,IDE版本是:VisualStudioVersion=17.5.33414.496这个是VS2022的版本。于是下载安装V
  • 2023-11-06ModuleNotFoundError: No module named 'google_drive_downloader'&&No matching distribution f
    安装googledrivedownloader(adaface)C:\Users\liruilong\Documents\GitHub\caface_demo\demo>pythonmain.py--fusion_methodcluster_and_aggregateTraceback(mostrecentcalllast):File"main.py",line17,in<module>fromface_d
  • 2023-11-03How to format lists in pandoc-generated docx documents?
    Sorry,thelistindentationsarecurrentlyhard-codedandcan'tbecustomized.Youcould,however,postprocessthedocxproducedbypandoc,changingthefilenumbering.xmlinthedocxcontainer.Oryoucouldmodifythesourcecodeandrecompile.Thes
  • 2023-10-05算法学习——“原地哈希法”
    这个方法名是一名网友给起的,很形象。简单理解就是,在一个数组中,将数值为a的元素放到索引为a的位置上去,这是一种降低空间复杂度的方法,在一些有条件限制的场景中非常适用。下面给两个力扣的例子进行详解。练习题目1:LCR120.寻找文件副本设备中存有 n 个文件,文件 id 记于数组
  • 2023-09-28Ubuntu压缩文件夹zip命令
    一、安装zip命令如果您的Ubuntu系统没有安装zip命令,可以使用以下命令进行安装:sudoapt-getupdatesudoapt-getinstallzip输入密码并等待安装完成。二、压缩单个文件夹在命令行中,使用zip命令压缩单个文件夹非常简单。以下是基本的命令格式:zip-r压缩包名.zip要压缩的文件夹路
  • 2023-09-22[884] How to generate automated Word documents by Python
    ref:python-docxref:HowtoGenerateAutomatedWordDocumentswithPythonref:AutomatingWordDocumentsfromExcelUsingPython|‘docxtpl’Tutorialref:docxtpl快速上手使用,数据填入以及循环写入表格ref:探究Python中的文档自动化工具——docxtplref:Python