- 2024-11-15【Python】将同一目录下的多个doc文件批量转为docx文件
同一目录有多个doc文件: importwin32com.clientaswcimportos#设置.doc文件所在的目录docs_directory=r'F:\xxx\PycharmProjects\Python学习项目\doc文件'defgetpath(docs_directory):#输出docx文件的路径和名称[路径,名称]#遍历目录中的所有.doc文件
- 2024-11-14movie-recommender-chatbot
movie-recommender-chatbothttps://github.com/7AM7/movie-recommender-chatbot/tree/mainimportloggingfromsemantic_routerimportRoute,RouteLayerfromsemantic_router.encodersimportOpenAIEncoderfromconfigimportConfiglogger=logging.getLogger(&
- 2024-11-08【NLP】使用 SpaCy 通过 LLM 合成数据微调 NER 模型
在我们之前的文章“使用SpaCy、ollama创建用于命名实体识别的合成数据集”中,我们探讨了如何使用Qwen生成合成数据,以自动化命名实体识别(NER)的注释过程。通过利用合成数据,我们能够高效地准备来自SmoothNLP金融新闻数据集 的高质量数据集。现在,在这篇文章中,我们将更进
- 2024-11-06基于langchain的RAG问答(QA)链实现
文章目录概要整体架构流程1.加载JSON数据2.创建文档对象并添加元数据3.初始化嵌入模型4.初始化Chroma向量存储5.向向量数据库添加文档6.基于相似度检索文档7.通过嵌入向量检索相似文档8.初始化检索器9.加载RAG提示模板10.定义RAG链并生成回答总结技
- 2024-10-31被认为是准确率最高的色彩提示笔!推荐这款神奇的AI自动上色技术!真正二次元的福音(带私活)
今天带来一款不需要安装任何环境、做任何配置,下载然后双击,就可以给线描图画上色的开源项目。它就是style2paints真正二次元的福音介绍Stylepaints2 被认为是准确率最高的色彩提示笔,被称为「神经提示笔(neuralhintpen)」有着 最高准确度、最自然的风格 、最协调的风格
- 2024-10-31linux使用者须知!Ls命令输出的颜色究竟由什么含义?教你轻松区分~(带私活源码)
在linux中我们经常会用到Ls命令,我们发现Ls的输出中有各种各样的颜色,今天和大家共同了解一下Ls背后的故事。简介Linux ls(英文全拼:listdirectorycontents)命令用于显示指定工作目录下之内容(列出目前工作目录所含的文件及子目录)。我们可以看到ls的输出中有着不同的颜色
- 2024-10-30推荐一款免费开源的PDF文件处理神器!上手简单,一步到位(带私活源码)
背景介绍PDFGuru致力于打造一款PDF文件处理神器,具有PDF合并、拆分、旋转、水印、加密、等20多项常用功能,本项目完全开源,个人用户使用免费,上手简单,超级好用。功能特点本地化:本地安全,离线运行,不必担心隐私泄露功能丰富:支持包括PDF批量合并、拆分、添加水印、加密/解密、
- 2024-10-27使用VitePress+Github Pages搭建VitePress网站(亲测有效)
1.安装Termux请自行到GithubReleases下载地址下载。此处提供加速链接地址:gh.llkk.cc加速服务2.安装软件包执行命令换源termux-change-repo选择第一项回车–>第三项回车安装软件pkgigitnodejsvimopenssh2.5配置ssh连接秘钥(可选)为了方便之后上传MarkDown
- 2024-10-21编写HiveQL语句实现WordCount算法
确保启动hadooop和hive 创建测试文件echo"helloworld">file1.txtecho"hellohadoop">file2.txt#创建HDFS上的/input目录hdfsdfs-mkdir-p/input#将本地文件上传到HDFShdfsdfs-putfile1.txt/input/hdfsdfs-putfile2.txt/input/打开Hiveshell
- 2024-10-082018_10_31_02
vuepress侧边栏module.exports={themeConfig:{sidebar:{//docs文件夹下面的accumulate文件夹文档中md文件书写的位置(命名随意)'/accumulate/':['/accumulate/',//accumulate文件夹的README.md不是下拉框形式{ti
- 2024-10-05litellm
litellmhttps://github.com/BerriAI/litellm/tree/mainPythonSDK,ProxyServer(LLMGateway)tocall100+LLMAPIsinOpenAIformat-[Bedrock,Azure,OpenAI,VertexAI,Cohere,Anthropic,Sagemaker,HuggingFace,Replicate,Groq]LiteLLMmanages:Transla
- 2024-10-01python - 合理的入门编程语言
盗版资源我就一个人独享了,分享的大部分为“开源”,不小心则为侵权。当两国战争后,谁在乎“侵权”?编程语言心法参考:http://www.yinwang.org/blog-cn/2017/07/06/master-pl英语阅读速成:http://www.yinwang.org/blog-cn/2018/11/23/grammar文档部分:教程https://docs.python.org/3
- 2024-09-2410. RAG多维查询
在RAG的pipeline如何使用多维查询。!pipinstall-qU\pinecone-client==3.1.0\langchain==0.1.1\langchain-community==0.0.13\datasets==2.14.6\openai==1.6.1\tiktoken==0.5.2获取数据我们将从HuggingFace数据集中下载一个已存的数据集。fromd
- 2024-09-18VUE 分组取最大,生成子集合
//分组函数 constgroupByAge=(docs:TOSDepositoryDTO[]):Record<number,TOSDepositoryDTO[]>=>{ returndocs.reduce((acc,d)=>{ if(!acc[d.approvalId])acc[d.approvalId]=[]; acc[d.approvalId].push(d); returnacc; },{}asR
- 2024-09-14ragflow
ragflowhttps://github.com/infiniflow/ragflowRAGFlowisanopen-sourceRAG(Retrieval-AugmentedGeneration)enginebasedondeepdocumentunderstanding.ItoffersastreamlinedRAGworkflowforbusinessesofanyscale,combiningLLM(LargeLanguageMode
- 2024-09-13react-intl
react-intl6.6.8 • Public • Published 4monthsago ReadmeCode Beta10Dependencies3,811Dependents330VersionsReactIntlWe'vemigratedthedocsto https://formatjs.io/docs/getting-started/installation.ReadmeKeywordsintli18nin
- 2024-09-10使用MindFormers本地部署大模型
MindSporeTransformers即时MindFormers套件的目标是构建一个大模型训练、微调、评估、推理、部署的全流程开发套件,提供业内主流的Transformer类预训练模型和SOTA下游任务应用,涵盖丰富的并行特性。期望帮助用户轻松的实现大模型训练和创新研发。安装MindFormers直接使用pip安
- 2024-09-05合宙面向全体用户的一封求助信
各位合宙的用户:感谢你们一直以来对合宙的支持!为了让用户的开发体验更丝滑,合宙决定在doc.openluat.com和wiki.openluat.com文档中心的基础上,新建一个docs.openluat.com,重构合宙的产品文档。在这个重构的合宙docs文档中心,会改变之前合宙文档难以查找,描述不完整的状态。
- 2024-09-04一个开源、跨平台的.NET UI框架 - Avalonia UI
前言今天大姚给大家分享一个开源、免费(MITLicense)、跨平台的.NETUI框架:AvaloniaUI。Avalonia是一个成熟稳定的平台,用于构建桌面、嵌入式、移动的和Web应用程序。一个代码库,无限可能!!!项目介绍Avalonia是一个强大的框架,使开发人员能够使用.NET创建跨平台应用程序。它使
- 2024-09-04合宙向所有用户的一封求助信
各位合宙的用户:感谢你们一直以来对合宙的支持!为了让用户的开发体验更丝滑,合宙决定在doc.openluat.com和wiki.openluat.com文档中心的基础上,新建一个docs.openluat.com,重构合宙的产品文档。在这个重构的合宙docs文档中心,会改变之前合宙文档比较难以查找,描述不完
- 2024-09-04一个开源、跨平台的.NET UI框架 - Avalonia UI
前言今天大姚给大家分享一个开源、免费(MITLicense)、跨平台的.NETUI框架:AvaloniaUI。Avalonia是一个成熟稳定的平台,用于构建桌面、嵌入式、移动的和Web应用程序。一个代码库,无限可能!!!项目介绍Avalonia是一个强大的框架,使开发人员能够使用.NET创建跨平台应用程序。它使用自己的
- 2024-09-02折腾 Quickwit,Rust 编写的分布式搜索引擎-官方配置详解
Nodeconfiguration(节点配置)节点配置允许您为集群中的各个节点自定义和优化设置。它被分为几个部分:常规配置设置:共享的顶级属性Storage(存储)设置:在storage部分定义https://quickwit.io/docs/configuration/node-config#storage-configurationMetastore(元存储)设置:在metastore
- 2024-08-30【Python机器学习】NLP词中的数学——主题建模
目录齐普夫定律相关度排序工具其他工具OkapiBM25在文档向量中,词计数是有用的,但是纯词计数,即使按照文档长度进行归一化处理,也不能告诉我们太多该词在当前文档相对于语料库中其他文档的重要度信息。如果能弄清楚这些信息,我们就能开始描述语料库中的文档了。假设我们有一
- 2024-08-30laravel11+vue项目
laravel11+vue项目视频地址https://www.youtube.com/watch?v=s6P1dDfl56s&list=PL38wFHH4qYZUdIKP9jG371N3G4kbWAg2c&index=2项目初始化地址直接下载https://github.com/JonVadar/Laravel-Inertia-Vue-Starter``composerinstallnpminstall复制.env.example文件并将其
- 2024-08-27折腾 Quickwit,Rust 编写的分布式搜索引擎-官方配置详解
Nodeconfiguration(节点配置)节点配置允许您为集群中的各个节点自定义和优化设置。它被分为几个部分:常规配置设置:共享的顶级属性Storage(存储)设置:在storage部分定义https://quickwit.io/docs/configuration/node-config#storage-configurationMetastore(元存储)设置:在