• 2024-07-04LLM大模型: RAG的上下文语义retrieval — RAPTOR
    1、RAG有很多优点,但是缺点也很明显,其中一个硬伤就是:只会“断章取义”!如果文本有明确的答案,现有的retrieve方式大概率能找到,但是如果文本没有明确的答案了?比如android逆向和windows逆向,哪个更有钱途?很多资料会介绍android逆向、windows逆向的原理和技术细节,但是没有哪个更有钱
  • 2024-07-02打包警告:chunk common [mini-css-extract-plugin]Conflicting order between:
    1.问题webpage5打包告警:chunkcommon[mini-css-extract-plugin]Conflictingorderbetween:2.解决方案:-vue.config.js配置//vue.config.jsmodule.exports={//...,css:{extract:{ignoreOrder:true},}};或者:调整组件引入的顺序3.
  • 2024-07-02webpack概念
    总体简单来说:Webpack通过内部的事件流机制,保证了插件的有序性Webpack底层利用了发布订阅模式,在运行过程中会广播事件Webpack插件只需要监听它所关心的事件,在特定的时机对资源做处理站在代码逻辑的角度:Webpack在编译过代码程中,会触发一系列Tapable钩子事件插件需
  • 2024-07-01heap
    堆块:chunk堆是以一个个的堆块构成的,这些堆块就叫chunkchunk的大小是8字节对齐,但是一个堆块的具体大小是16字节对齐的,比如一个堆块只能是0x40,0x50,0x60不会是0x48这样的数据其中一个堆块的header头部字节占16字节大小,也就是0x10字节64位程序下的最小长度是32字节大小的这里
  • 2024-06-19Pytorch:合并分割
    1前言记录一下Pytorch中对tensor合并分割的方法2合并Pytorch中对tensor合并的方法有两种:torch.cat()torch.stack()其中,torch.cat()直接将两个变量进行拼接,不会产生新的维度而torch.stack()则会将tensor堆叠,产生新的维度tensor1=torch.randn(2,3)tensor2=torch.rand
  • 2024-06-17(26-4-02)基于OpenAI和LangChain的上市公司估值系统:OpenAI API和Langchain探索(2)Langchain和OpenAI处理
    10.5.2 Langchain和OpenAI处理编写文件summarizer.py,定义了使用Langchain和OpenAI处理文本和文档的功能处。其中,类UnstructuredStringLoader用于加载未结构化的字符串内容,将其分割成适当大小的块。方法split_text_in_chunks和方法split_doc_in_chunks分别用于将文本
  • 2024-06-17JS 控制并行度
    consturls=["url1","url2",...,"url100"];constmaxConcurrentNum=10;//最大并发数//数组分块,chunk表示每批次数量,返回数组二维数组functionchunk(arr,chunk){letresult=[];for(leti=0,len=arr.length;i<len;i+=chunk
  • 2024-06-15gbase8s的select查询数据物理位置寻址分析和学习
    1.执行的sql语句和目的执行的sql语句selectrowid,*fromtest1whereid=1;目的:查找到test1表中id=1这个值在硬盘中的真实位置并取出2.寻址的过程-确定表的数据空间和逻辑页的信息根据表名查看这张表的数据空间位置和逻辑页号[gbasedbt@iZ2ze5s78e4tanwe5q2znxZ~]$
  • 2024-06-14长城杯CTF2024-PWN-kawayi复现
    文件保护libc版本uaf漏洞free函数没有进行置0操作GDB断点断点:0xD90泄漏libc由于v1>3会退出,所以必须在四次申请堆块中拿到shell第一次申请-创建largebinchunk因为创建largebin的chunk堆块,所以申请的是0x430第二次申请-创建tcachebinchunk申请一个tcache
  • 2024-06-11[20240601]简单探究free list chunk size的分布.txt
    [20240601]简单探究freelistchunksize的分布.txt--//前几天探究探究freelist,无意中发现12c版本freelistchunksize的发生了变化.单独另外写一篇blog.--//我开始分析以为脚本执行有问题,仔细查看12c版本freelistchunksize分布发生了变化.--//我找了以前的11g下的转储,发
  • 2024-06-11堆基础知识
    arenachunk通俗地说,一块由分配器分配的内存块叫做一个chunk,包含了元数据和用户数据。具体一点,chunk完整定义如下:structmalloc_chunk{INTERNAL_SIZE_Tmchunk_prev_size;/*Sizeofpreviouschunk(iffree).*/INTERNAL_SIZE_Tmchunk_size;/
  • 2024-05-30pwn堆的结构及堆溢出理解
    堆其实就是程序虚拟地址空间的一块连续的线性区域,它由低地址向高地址方向增长(栈由高地址向低地址增长)。我们一般称管理堆的那部分程序为堆管理器。堆是分配给程序的内存空间与栈不同,堆内存可以动态分配。这意味着程序可以在需要的时候从堆段中请求和释放内存。此外,此内存
  • 2024-05-29knit样式 + ggplot 样式
    knit{rsetup,include=FALSE}knitr::opts_chunk$set(echo=TRUE)knitr::opts_chunk$set(warning=FALSE,message=FALSE)knitr::opts_chunk$set(tidy=TRUE,tidy.opts=list(width.cutoff=60))library(tidyverse)library(knitr)ggplot箱线图案例#Loadthegg
  • 2024-05-27RAG-GPT实践过程中遇到的挑战
    引言大型语言模型(LLM)的新进展,包括ChatGPT,为AI应用提供了新的能力,使其能够构建新的人机交互解决方案、完成复杂任务、总结文档、回答文献中的问题并生成新内容。然而,LLM在获取最新知识或企业内部知识库中的领域特定知识时仍存在局限性。解决此问题的两个选项是:微调LLM(继
  • 2024-05-25Gradio官方文档学习记录(一)
    一、Gradio基本使用方式:Gradio是一个开源的Python包,允许您快速为您的机器学习模型、API或任意Python函数构建演示或Web应用程序。然后,您可以使用Gradio内置的分享功能在几秒钟内分享您的演示或Web应用程序链接。无需JavaScript、CSS或Web主机经验。基本使用:importgradi
  • 2024-05-24前端大文件上传
    首先,我们需要使用Blob对象的slice方法将文件切分成多个切片。constCHUNK_SIZE=1024*1024;//我们选择1MB作为每个切片的大小letfile=document.getElementById("upload").files[0];//得到所选文件lettotalSize=file.size;letchunks=[];//用于存储文
  • 2024-05-23jvm调优的案例-自编
    一、优化目标通常来说,我们的JVM参数配置大多还是会遵循JVM官方的建议,例如:-XX:NewRatio=2,年轻代:老年代=1:2-XX:SurvivorRatio=8,eden:survivor=8:1堆内存设置为物理内存的3/4左右JVM有哪些核心指标?合理范围应该是多少?jvm.gc.time:每分钟的GC耗时在1s以内,500ms以内尤
  • 2024-05-22PWN系列-Unsorted Bin Attack
    PWN系列-UnsortedBinAttack概述UnsortedBinAttack,顾名思义,该攻击与Glibc堆管理中的的UnsortedBin的机制紧密相关。UnsortedBinAttack被利用的前提是控制UnsortedBinChunk的bk指针。UnsortedBinAttack可以达到的效果是实现修改任意地址值为一个较大的数值
  • 2024-05-20常回家看看之off_by_one
    ❗off_by_one这个漏洞比较特殊,它不像上一期的堆溢出,可以溢出很多字节,它只能溢出一个字节,在栈里面也可以通过这个漏洞修改返回地址什么的,在堆里面我们主要利用它来修改堆块的大小,形成fake_chunk也就可以进行堆的重叠,在64位的时候如果申请0x18,0x28,0x38这样的堆它的size位是0x21,0x31
  • 2024-05-19常回家看看之堆溢出
  • 2024-05-14基于Python实现MapReduce
    一、什么是MapReduce首先,将这个单词分解为Map、Reduce。Map阶段:在这个阶段,输入数据集被分割成小块,并由多个Map任务处理。每个Map任务将输入数据映射为一系列(key,value)对,并生成中间结果。Reduce阶段:在这个阶段,中间结果被重新分组和排序,以便相同key的中间结果被传递到同一个R
  • 2024-05-10开源相机管理库Aravis例程学习(七)——chunk-parser
    目录简介例程代码函数说明arv_camera_create_chunk_parserarv_camera_set_chunksarv_chunk_parser_get_integer_value简介本文针对官方例程中的:05-chunk-parser做简单的讲解。并介绍其中调用的arv_camera_create_chunk_parser,arv_camera_set_chunks,arv_chunk_parser_get_integer
  • 2024-05-05通过劫持线程arena实现任意地址分配 n1ctf2018_null
    通过劫持线程arena,当堆开了一个线程之后,如果没有做好保护随之的危险也悄然而至❗BUU上的n1ctf2018_null很好的说明了这个问题题目链接:BUUCTF在线评测(buuoj.cn)看一下保护:除了pie保护剩下的保护全开了,64位ida载入看一下上来是一个输入密码,密码是i'mreadyforchallenge
  • 2024-04-27Fastbin attack&&Double free和Unsortbin leak的综合使用
    Fastbinattack&&Doublefree和Unsortbinleak的综合使用✅今天做一个综合题目,包括利用Fastbinattack实现多指针指向一个地址,以及利用Unsortbinleak泄露libc基地址和修改__malloc_hook地址为one_gadget题目是buuctf上面的一道题目,题目链接https://buuoj.cn/challenges#babyhe
  • 2024-04-26python2 http响应中文显示unicode \uXXX的问题
    python2编码解码会以unicode作为中间码,要用decode和encode解码后再编码其中decode解码,是把bytes以给定的编码格式解码成unicodeencode是以给定的编码格式将unicode编码为bytes数据是以bytes形式传递和存储的,程序需要用正确的编码来将bytes解码显示decode:FrombytesToUnic