• 2024-12-07CodeBERT: A Pre-Trained Model for Programming and Natural Languages
    本次介绍的论文是《CodeBERT:APre-TrainedModelforProgrammingandNaturalLanguages》原文链接:http://www.semanticscholar.org/paper/0fe2636446cd686830da3d971b31a004d6094b3c源代码和数据集:GitHub-microsoft/CodeBERT:CodeBERT本篇论文主要是介绍了CodeBERT
  • 2024-11-302024.11.30
    连续两天从不同的人那里听到相同的话是什么感受?昨天晚上利用导师答疑时间和童老师谈话(目前接触到的统计系的老师们都好温柔),突发奇想问了他有关未来方向选择的问题。他和我介绍了他研究的领域,统计学确实再很多领域都能发挥作用呢。不过大一就决定未来的方向有点早,老师认为要先打好
  • 2024-08-10python 提取日志错误请求批量重新请求
    因为有服务器线上偶发异常,所以需要获取Nginx访问日志重新请求补全数据,这时会借助python获取错误请求的URL,然后重新请求。具体如下:importtimeimportrequestsfromurllib.parseimporturljoin#定义一个集合用于存储已处理的URL,避免重复处理processed_urls=set()with
  • 2024-08-10Nginx日志切分脚本
    因为学习初期都是习惯自己去解决问题没有使用工具切分日志,所以当时写了一个根据天数日志切分脚本,现在记录下。LOG_FILE="/data/log/nginx/filter.access1.log"PROCESSED_LOG_FILE="/data/log/nginx/filter.access.log"month=$(LC_ALL=Cdate"+%b")year=$(date"+%Y")
  • 2024-05-16rm -rf误删Oracle数据库恢复---惜分飞
    联系:手机/微信(+8617813235971)QQ(107644445)标题:rm-rf误删Oracle数据库恢复作者:惜分飞©版权所有[未经本人同意,不得以任何形式转载,否则有进一步追究法律责任的权利.]有客户把虚拟化环境中装有oracle数据库的linux操作系统,由于操作失误在/下面执行了rm-rf*,导致所有文件
  • 2024-02-15为了将照片导入iPhone并保留时刻信息漫漫之路
    由于Android对EXIF信息的管理混乱,导致Android转iPhone后在相册看照片时间线一片混乱,特开此篇
  • 2023-12-09is not eligible for getting processed by all BeanPostProcessors 问题解决
    问题在做Springboot项目时遇到如下报错18.684INFOo.s.c.s.PostProcessorRegistrationDelegate$BeanPostProcessorChecker:350restartedMainBean'org.apache.rocketmq.spring.autoconfigure.RocketMQAutoConfiguration'oftype[org.apache.rocket
  • 2023-12-08Bert-vits2新版本V2.1英文模型本地训练以及中英文混合推理(mix)
    中英文混合输出是文本转语音(TTS)项目中很常见的需求场景,尤其在技术文章或者技术视频领域里,其中文文本中一定会夹杂着海量的英文单词,我们当然不希望AI口播只会念中文,Bert-vits2老版本(2.0以下版本)并不支持英文训练和推理,但更新了底模之后,V2.0以上版本支持了中英文混合推理(mix)
  • 2023-11-16JavaScript: Checkbox onChange event is differently processed by IE and FF
     DropDownList onchange=""TextBoxonchange=""CheckBoxonclick=""RadioButtononclick="" JavaScript:CheckboxonChangeeventisdifferentlyprocessedbyIEandFFTrytoclick thefollowingbuttonsonIEandFirefox.U
  • 2023-10-31trafilatura 网页解析原理分析
    trafilatura介绍Trafilatura是一个Python包和命令行工具,用于收集网络上的文本。其主要应用场景包括网络爬虫下载和网页解析等。今天我们不讨论爬虫和抓取,主要看他的数据解析是如何做的。extract初体验fromtrafilaturaimportfetch_url,extracturl='https://haokan.baid
  • 2023-09-13dbv检查数据文件是否有坏块
     环境:OS:Centos7DB:11.2.0.4 1.ASM磁盘需要带上userid参数[oracle@rac01~]$dbvfile='+DATA/slnngk/datafile/users.259.1146388217'userid=oracle/oracleDBVERIFY:Release11.2.0.4.0-ProductiononWedSep1314:49:152023Copyright(c)1982,2011,O
  • 2023-08-28hdu:Machine Schedule(二分图匹配)
    ProblemDescriptionAsweallknow,machineschedulingisaveryclassicalproblemincomputerscienceandhasbeenstudiedforaverylonghistory.Schedulingproblemsdifferwidelyinthenatureoftheconstraintsthatmustbesatisfiedandthetypeof
  • 2023-08-24ocr 文字识别 服务
    ocr文字识别服务利用百度开源模型:地址:https://github.com/PaddlePaddle/PaddleHub/tree/develop/modules/image/text_recognition/chinese_ocr_db_crnn_mobile一个开发web服务demofromflaskimportFlask,render_template,request,jsonifyimportrequests,jsonapp=
  • 2023-08-22flask接收json,开启服务demo
    demofromflaskimportFlask,render_template,request,jsonifyapp=Flask(__name__)@app.route('/',methods=['GET','POST'])defindex():processed_data=Noneifrequest.method=='POST':try
  • 2023-07-19Since Redis always uses the last processed
    RedisandItsUseofLastProcessedDataRedisisanopen-source,in-memorydatastructurestorethatcanbeusedasadatabase,cache,andmessagebroker.OneoftheuniquefeaturesofRedisisitsabilitytousethelastprocesseddataefficiently.Int
  • 2023-06-20数据结构代码整理_基于邻接表的拓扑排序(C++_DFS_BFS_递归)
    目录Chat图解基于栈实现(dfs)基于队列实现(bfs)基于递归实现(dfs)Chat1.代码所属的类在数据结构代码整理_基于邻接表存储结构的有向图的实现(C++)2.拓扑排序的思想就是不断找入度为0的节点并将其输出并标记,标记后与他相连的节点的入度都会减一,不断进行标记直至所有的节点都被输出为止
  • 2023-06-05实验五
    withopen('data6.csv','r',encoding='gbk')asf:data=f.readlines()processed_data=[]foriinrange(1,len(data)):row=data[i].strip()processed_item=round(float(row))processed_data.append(proces
  • 2023-05-26一、 采集北京市政百姓信件内容
    letter.pyimportscrapyfromscrapy.linkextractorsimportLinkExtractorfromscrapy.spidersimportCrawlSpider,RulefromletterBeijing.itemsimportLetterbeijingItemimportjsoni=1classLetterSpider(scrapy.Spider):name="letter"