• 2024-07-022024.7.2 集训
    ###数位DP1.记录:1.是否顶上限;2.是否当前填了的都是前导$0$;3.当前位是否是从左往右数第一位。(2和3是两种做法,2是在Query里只调用一次DFS,3是在Query里枚举第一个非$0$位调用多次DFS)。2.记忆化的数组可以不用记所有内容。3.注意DFS返回时要返回res,而不是记
  • 2024-07-01​RAG与LLM原理及实践(7)--- Chroma query应用层策略及实现原理
    背景Chromaquery底层查询的 query思想是相同的,甚至在vectordb的世界中,都大同小异。如果你有看前面写的  RAG与LLM原理及实践(5)---Chromaquery源码分析应该比较清楚query的运作原理,说直白就是在memory或是disk中通过暴力查询比较与HNSW算法(NSW算法的变种,分层可导航
  • 2024-06-24[题解]CF1070C Cloud Computing
    思路考虑用线段树维护区间信息:价格在\([l,r]\)之间的CPU的数量。购买所有价格在\([l,r]\)之间CPU所需的钱。容易将区间修改转化为差分,从而实现单点修改。于是可以使用\(n\)个vector存储第\(i\)天所需进行的修改。查询第\(i\)天的答案时,如果不足\(k\)
  • 2024-06-23CF1707E Replace
    题目描述给定一个长为\(n\)的序列\(a_1,\ldots,a_n\),其中对于任意的\(i\)满足\(1\leqa_i\leqn\)。定义一个二元组函数如下:\[f((l,r))=(\min\{a_l,\ldots,a_r\},\max\{a_l,\ldots,a_r\})(l\leqr)\]你需要回答\(q\)次询问,每次给定\((l_i,r_i)\),问其最少经过多少
  • 2024-06-23elasticsearch 全文搜素 query_string 搭配其他条件
    elasticsearch全文搜素query_string搭配其他条件{"query":{"bool":{"must":[{"term":{"item_type":"question"
  • 2024-06-22数据库优化及慢查询日志分析
    在数据库调优中,我们的目标就是响应时间更快,吞吐量更大。利用宏观的监控工具和微观的日志分析可以快速帮我们找到调优的思路和方式。一、数据库服务器的优化步骤1、观察服务器状态是否存在周期性波动(双11,618等),如果是执行2,否跳到3;2、加缓存,更改缓存失效策略。如果解决则
  • 2024-06-22填空题回答(Power Query)
    问题:由问题+答案生成结果let源=Excel.CurrentWorkbook(){[Name="表1"]}[Content],结果=Table.AddColumn(源,"结果",eachText.Combine(List.Combine(List.Zip({Text.Split([问题],"__"),Text.Split([答案],"、")}))))in结果逆向(根据结题和答案反推问
  • 2024-06-21双AdguardHome配置做DNS服务器
    双AdguardHome配置做DNS服务器概述看到网上dns泄露的文章,准备重新修改一下家里的网络配置后面准备使用mosDns作为53端口入口,使用两个adguardHome,一个插件的,专门用于国内的dns服务器,一个使用docker安装adguardHome,专门用于国外dns服务器MosDns配置使用docker安装adguardHome
  • 2024-06-20Uipath 如何连接SQLite数据进行操作
      1、下载SQLiteDatabaseActivitiesforUipathpackages,无需安装SQLite数据库驱动。2、SQLite查询操作   2.1添加查询活动:在UIPathStudio的“Activities”面板中,搜索并添加“ExecuteQuery”活动。这个活动用于执行SQL查询语。在“ExecuteQuery”活动的属
  • 2024-06-20RAG优化技巧|7大挑战与解決方式|提高你的LLM能力
    在当今快速发展的人工智能领域,大型语言模型(LLM)已经成为无处不在的技术,它们不仅改变了我们与机器交流的方式,还在各行各业中发挥着革命性的影响。然而,尽管LLM+RAG的能力已经让人惊叹,但我们在使用RAG优化LLM的过程中,还是会遇到许多挑战和困难,包括但不限于检索器返回不准确或
  • 2024-06-20打开 RAG 对接大模型的黑盒 —— 9 大隐藏问题
    前一段时间,各个大模型在争斗:谁能携带更长、更大的上下文Prompt,比如Kimi说200万字,阿里通义千问又说自己能达1000万字;大家都知道Prompt很重要,但是RAG和长的上下文文本携带是两个不同的技术方向。RAG先来简单介绍一下什么是RAG(增强搜索生成),很简单:当我们问Ch
  • 2024-06-20ElasticSearch入门(实战)
    环境准备:VMwaredocker   创建一个linux虚拟机,使用dockerpullelasticsearch 部署单体服务: dockerpullelasticsearch:6.8.13#elasticsearch十分占用内存,用这种方式启动会导致Linux卡机dockerrun-d--nameelasticsearch-p9200:9200-p9300:9300-e"discover
  • 2024-06-20【论文阅读】Co-Occ: Coupling Explicit Feature Fusion With Volume Rendering Regularization for Multi-Modal
    论文:https://arxiv.org/pdf/2404.04561v1代码:https://github.com/Rorisis/Co-Occ?tab=readme-ov-fileQ:这篇论文试图解决什么问题?A:这篇论文提出了一个名为Co-Occ的多模态3D语义占据预测框架,旨在解决自动驾驶领域中的3D语义占据预测问题。具体来说,它关注以下几个挑战:
  • 2024-06-19MySQL 查询数据库响应时长详解
    前言作为一名测试工程师,在性能测试中,查询数据库的响应时长是一个重要指标。MySQL提供了多种方法来监控和优化查询性能。本文将详细介绍如何使用MySQL的内置功能和工具来查询数据库响应时长,并分享一些性能优化的技巧。启用查询日志开启慢查询日志慢查询日志用于记录执
  • 2024-06-19LLM大模型: FlagEmbedding-BiEncoderModel原理和源码解析
    NLP常见的任务之一是高效检索:在大规模语料库中快速检索与查询相关的段落或文档;用户输入query,要在语料库中找到语义最接近、最匹配的回答!此外,还有文本分类、情感分析等下游任务需要先把文本的embedding求出来,这些功能都能通过"双塔结构"(Bi-Encoder)实现!核心思路很简单:用两个不同
  • 2024-06-18LeetCode 2055. Plates Between Candles
    原题链接在这里:https://leetcode.com/problems/plates-between-candles/description/题目:Thereisalongtablewithalineofplatesandcandlesarrangedontopofit.Youaregivena 0-indexed string s consistingofcharacters '*' and '|' only,
  • 2024-06-17Semantic-SAM: Segment and Recognize Anything at Any Granularity论文阅读笔记
    Motivation&Abs现有的结构限制了模型以端到端的方式预测多粒度分割mask;同时目前没有大规模的语义感知&粒度感知数据集,同时不同数据集之间语义和粒度的固有差异给联合训练工作带来了重大挑战。本文提出通用图像分割模型,能够以任何粒度分割识别任何内容,给一个点作为prompt能够生
  • 2024-06-17【AI开发】RAG基础
    RAG的基本流程:用一个loader把knowledgebase里的知识做成一个个的document,然后把document切分成snippets,把snippets通过embedding(比如openai的embedding模型或者huggingface的)向量化,存储到vectordb向量数据库,以供后续相关性检索。至此便完成了私域数据集的索引indexing。
  • 2024-06-16微服务开发与实战Day09 - Elasticsearch
    一、DSL查询Elasticsearch提供了DSL(DomainSpecificLanguage)查询,就是以JSON格式来定义查询条件。类似这样:DSL查询可以分为两大类:叶子查询(Leafqueryclauses):一般是在特定的字段里查询特定值,属于简单查询,很少单独使用。复合查询(Compoundqueryclauses):以逻辑方式组合多个叶
  • 2024-06-16百度202425
    #include<bits/stdc++.h>usingnamespacestd;#definelsu<<1#definersu<<1|1constintN=3e5+7;inta[N];structnode{intl,r,tag,odd[2],even[2];}tr[N<<3];intok;voidpushup(intu){tr[u].odd[0]=tr[ls].odd[0]+
  • 2024-06-15Sigir2024 ranking相关论文速读
    简单浏览一下Sigir2024中与ranking相关的论文。不得不说,自从LLM大热后,传统的LTR方向的论文是越来越少了,目前不少都是RAG或类似场景下的工作了,比如查询改写、rerank等。目录TheSurprisingEffectivenessofRankersTrainedonExpandedQueriesCanQueryExpansionImproveGene
  • 2024-06-14数据库SQL优化
    数据库SQL优化通常涉及以下方面:1.查询优化:确保使用正确的索引来优化查询。2.避免全表扫描:避免不必要的全表扫描,使用索引就是为了避免全表扫描。3.使用EXPLAIN分析查询:检查SQL查询的执行计划,判断sql语句存在的问题。4.使用JOIN代替子查询:适当情况下,使用JOIN来合并表。5.使用视
  • 2024-06-13数据库的读现象浅析
    “读现象”是多个事务并发执行时,在读取数据方面可能碰到的状况。先了解它们有助于理解各隔离级别的含义。其中包括脏读、不可重复读和幻读。脏读脏读又称无效数据的读出,是指在数据库访问中,事务T1将某一值修改,然后事务T2读取该值,此后T1因为某种原因撤销对该值的修改,这就导致了T2
  • 2024-06-12LLM大模型: llama源码要点解读(二)
    1、attention机制:这算是transformer架构最大的创新点了!利用attention机制,找到token之间的相似度(或则说距离),根据相似度调整token本身的embedding值,本质就是根据token的context调整自身的embedding值,这个思路非常符合人脑对语言和语义的理解!比如”苹果“这个词,如果只看这一个t
  • 2024-06-12clickhouse简介
    什么是ClickHouseClickhouse云数据库是开源列式数据库管理系统ClickHouse在OPPOCloud上的托管服务,用户可搭建自己的ClickHouse集群。总体架构如下:ClickHouse中无中心节点,所有节点是完全对等的,每一个节点都可以承载查询请求和写入请求,以及后台数据的计算和操作。每个ClickHou