• 2024-07-02go binary 与 gob
      在Go中,除了使用encoding/binary包将结构体转换为字节切片,还可以使用encoding/gob包进行序列化。两者各有优缺点,适用于不同的场景。以下是对比和示例:encoding/binary优点:高效:直接将结构体的内存布局写入字节切片,效率较高。简单:适用于简单的固定大小结构体。跨语
  • 2024-06-21如何手撸一个自有知识库的RAG系统
    RAG通常指的是"Retrieval-AugmentedGeneration",即“检索增强的生成”。这是一种结合了检索(Retrieval)和生成(Generation)的机器学习模型,通常用于自然语言处理任务,如文本生成、问答系统等。我们通过一下几个步骤来完成一个基于京东云官网文档的RAG系统数据收集建立知识库向量
  • 2024-06-21一个简单的python脚本,把latex项目的调用资源放在同一级,以便arxiv
    据说上传arxiv时所有资源需要在同一目录,也就是不能有文件夹(只是据说,有人说有文件夹也行,我没试过),所以写了一个简单的小脚本把latex项目的资源(主要是图片)放在和.tex一个路径下:importosimportshutiltex_file='main.tex'img_folder='imgs'encoding_type='utf-8'withopen
  • 2024-06-20关于文件的open方法
    open(file,mode='r',encoding="utf-8")t文本模式b二进制模式f=open(文件名或路径)#打开文件f.close()#关闭文件encoding编码utf-8是针对Unicode的一种可变长度字符编码f=open(file="test.txt",mode="w",encoding="utf-8")f.write("你好世界!&qu
  • 2024-06-19解决 执行 jar 命令 控制台乱码
    Springboot项目,编码为utf8打包后,为了在控制台运行时不乱码,需要在控制台中依次执行以下命令:第一步:chcp65001第二步:java-jar-Dfile.encoding=utf-8你的.jar
  • 2024-06-19python模块之codecs
    python模块codecspython对多国语言的处理是支持的很好的,它可以处理现在任意编码的字符,这里深入的研究一下python对多种不同语言的处理。有一点需要清楚的是,当python要做编码转换的时候,会借助于内部的编码,转换过程是这样的:原有编码->内部编码->目的编码python的内部
  • 2024-06-18python:create file
     #os.mkdir(path)filename='1.py'try:ifnotos.path.exists("Common"):os.mkdir("Common")else:ifos.path.exists("Common/"+filename):print(fi
  • 2024-06-18对象reids
    对象redis并没有直接使用之前学的数据结构来实现键值对数据库,而是基于这些数据结构创建了一个对象系统这个对象系统包含了字符串对象、列表对象、哈希对象、集合对象、有序集合对象这五种,每个对象都用到了至少一种之前的数据结构redis可以在执行命令之前,根据对象的类
  • 2024-06-17Kaggle比赛:成人人口收入分类
    拿到数据首先查看数据信息和描述 importpandasaspdimportseabornassnsimportmatplotlib.pyplotasplt#加载数据(保留原路径,但在实际应用中建议使用相对路径或环境变量)data=pd.read_csv(r"C:\Users\11794\Desktop\收入分类\training.csv",encoding
  • 2024-06-17如何手撸一个自有知识库的RAG系统
    RAG通常指的是"Retrieval-AugmentedGeneration",即“检索增强的生成”。这是一种结合了检索(Retrieval)和生成(Generation)的机器学习模型,通常用于自然语言处理任务,如文本生成、问答系统等。我们通过一下几个步骤来完成一个基于京东云官网文档的RAG系统数据收集建立知识库向
  • 2024-06-12关于IDEA控制台中文乱码问题
    最近我正在尝试把JDK8升级到JDK21。我新建了一个SpingBoot3.3.0的项目,SDK设置为OracleOpenJDK21.0.2,并在main方法中写了一个简单的System.out.println(“你好,世界”),运行后得到一串乱码。按照JDK8的经验,我检查了IDEA的相关配置:1.File->Settings有关encoding的选项已经
  • 2024-06-07解释Servlet过滤器的作用和用法
    Servlet过滤器在JavaWeb开发中扮演着重要的角色,主要用于拦截客户端(如浏览器)与服务器资源之间的请求和响应,并进行相应的处理。以下是关于Servlet过滤器的作用和用法的详细解释:作用请求和响应的拦截:Servlet过滤器可以动态地拦截客户端发送的请求和服务器返回的响应,以便在请求
  • 2024-06-07从零手写实现 nginx-09-compress http 文件压缩
    前言大家好,我是老马。很高兴遇到你。我们为java开发者实现了java版本的nginxhttps://github.com/houbb/nginx4j如果你想知道servlet如何处理的,可以参考我的另一个项目:手写从零实现简易版tomcatminicat手写nginx系列如果你对nginx原理感兴趣,可以阅读:从零
  • 2024-06-04python 字节转化为字符串
    str()在字节转化为字符串时,需要显式地提供encoding参数,否则返回的非正式的字符串表示。官方文档是这样说的:还可以使用decode()方法来将字节转化为字符串参考资料:Pythonstr()——将数据转换为字符串(freecodecamp.org)来自为知笔记(Wiz)
  • 2024-06-03C#使用HttpClient上传文件至阿里云oss失败的解决方案。
    ThebodyofyourPOSTrequestisnotwell-formedmultipart/form-data在使用C#的HttpClient上传文件到阿里云oss的时候,根据postman生成的代码,但是用C#发起请求的时候会返回400错误以及错误信息>ThebodyofyourPOSTrequestisnotwell-formedmultipart/form-data主要因
  • 2024-06-01【MISC】一道假的二维码题目学习zxing库[python解读二维码]
    引言这道题目的考点是文件格式、双图差值、Ook!编码、PRC等,我做这题的重点是复习巩固python读取二维码zxing库的使用。例题┌───────────────────────────────────────────────────┐│马老师的秘籍
  • 2024-05-30jmeterQA之Sampler响应结果编码修改(解决乱码问题)
    #问题分析当响应数据或响应页面没有设置编码时,jmeter会按照jmeter.properties文件中,sampleresult.default.encoding设置的格式解析默认ISO-8859-1,单字节解析中文肯定不对,配置片段如下#Theencodingtobeusedifnoneisprovided(defaultISO-8859-1)#sampleresult.def
  • 2024-05-24【Text2SQL 论文】SQLova:首次将 PLM 应用到 NL2SQL 中
    论文:AComprehensiveExplorationonWikiSQLwithTable-AwareWordContextualization⭐⭐⭐⭐KR2MLWorkshopatNeurIPS2019,arXiv:1902.01069Code:SQLova|GitHub参考文章:将预训练语言模型引入WikiSQL任务|CSDN一、论文速度这篇论文对SQLNet进行改进,首
  • 2024-05-22CF Round946 (Div. 3)B:如何写映射
    SymmetricEncoding题目描述Polycarphasastring$s$,whichconsistsoflowercaseLatinletters.Heencodesthisstringusingthefollowingalgorithm:first,heconstructsanewauxiliarystring$r$,whichconsistsofalldistinctlettersofthestrin
  • 2024-05-13返回txt文档编码格式
    安装chardetpipinstallchardet获得文本文档编码类型importchardetfromchardet.universaldetectorimportUniversalDetectordefGetEncoding(file_path):txt=open(file_path,"rb")detector=UniversalDetector()forlineintxt.readlines():
  • 2024-05-10批处理文本替换脚本
    将AAA文件里全部子文件中包含aaabbbccc的内容分别替换为eeefffggg点击查看代码chcp65001@echooffsetlocalenabledelayedexpansion::创建一个临时文件来保存包含目录列表的文件名dir/b/ad"AAA">temp_dirs.txt::检查临时文件是否存在
  • 2024-05-06[Paper Reading] LSS: Lift, Splat, Shoot: Encoding Images from Arbitrary Camera Rigs by Implicitly Un
    名称Lift,Splat,Shoot:EncodingImagesfromArbitraryCameraRigsbyImplicitlyUnprojectingto3D时间:20.08机构:NVIDIATL;DR后融合方法将每一目感知结果通过相机参数转换到BEV空间再后融合,LSS开启前融合的先河,将特征通过先lift再splat到BEV空间,通过BEV空间特征直接预
  • 2024-04-292.文件读写操作
    """一.有如下文件,1.txt,里面的内容为:键盘敲烂,月薪过万,键盘落灰狗屎一堆""""""分别完成以下功能:a:将原文件全部读出来并打印b:在原文件后面追加一行内容:信不信由你,反正我信了.c:将原文件全部读出来,并在后面添加一行内容:信不信由你,反正我信了
  • 2024-04-15python--文件操作指南
    '''1.什么是文件:文件是操作系统给用户/应用程序操作硬盘的一种虚拟的概念/接口用户/应用程序操作系统(文件)计算机硬件(硬盘)2.为何要用文件用户/应用程序可以通过文件将数据永久保存的硬盘中,即操作文件就是操作硬盘用户/应用程序直接操作的是文件,对文件进行的所有的操作
  • 2024-04-12golang JSON序列化和反序列化
    目录JSON序列化(Marshaling)JSON反序列化(Unmarshaling)错误处理和注意事项在Go语言(通常被称为Golang)中,JSON(JavaScriptObjectNotation)是一种常用的数据交换格式。Go标准库提供了encoding/json包,使得JSON的序列化(将Go数据结构转换为JSON格式的字符串)和反序列化(将JSON格式的字符串