• 2024-07-13用Python生成一个漂亮的圣诞节词云
    展示效果代码#-*-coding:UTF-8-*-importjiebaimportrefromstylecloudimportgen_stylecloudfromPILimportImageimportnumpyasnpwithopen('./圣诞素材/Christmas.txt',encoding="utf-8")asf:data=f.read()#文本预处理去除一些无用的字符
  • 2024-07-13[LeetCode]953. 验证外星语词典
    /*953.验证外星语词典已解答简单某种外星语也使用英文小写字母,但可能顺序order不同。字母表的顺序(order)是一些小写字母的排列。给定一组用外星语书写的单词words,以及其字母表的顺序order,只有当给定的单词在这种外星语中按字典序排列时,返回true;否则,返回false。示例1:
  • 2024-07-08Python排序,你用对了吗?一文教你sorted和sort的正确姿势!
    目录1、sorted基础用法
  • 2024-07-08docx转html方案验证-支持latex,表格,图片(aspose)
    方案总结:1:poi(html属性支持)存在一个bug,对于table中的cell中既有文本又有图片的在转化后图片丢失2:tika(主要是提取内容,转换出来的html不太好)3.openoffice(依赖安装,转出的html不太好)4.aspose(功能强大但是付费),但也可以免费使用,缺点:不支持扩展原因代码不是开源的5.mamm
  • 2024-07-03pwn_wp汇总
    目录pwnwriteup记录1.BUUhitcon_2018_children_tcache(offbynone,free_hook)Ulink学习BUU_hitcon2014_stkof原理介绍BUU_hitcon2014_stkof2.buu护网杯_2018_gettingstart3.buuciscn_2019_en_3(puts函数漏洞,uaf)4.buugyctf_2020_some_thing_exceting(2.23doublefree)5.NSSCTF
  • 2024-07-02tensor版CBOW
    小小技能1key=['a','b','c']value=[1,2,3]vocab=dict(zip(key,value))print(vocab)运行效果:{'a':1,'b':2,'c':3}2key=['a','b','c']vocab=dict(zip(key,ran
  • 2024-06-19软工日报3.25
    代码量:8-3【Python0035】英文统计分数10全屏浏览作者 doublebest单位 石家庄铁道大学编写程序实现对特定英文文章(文本文件)的单词数和有效行数的统计,其中要求空行不计数;代码:importrefile="HarryPotterAndTheChamberOfSecrets.txt
  • 2024-06-194.24
    8-2【Python0026】图书评论数据分析与可视化分数10全屏浏览作者 doublebest单位 石家庄铁道大学【题目描述】豆瓣图书评论数据爬取。以《平凡的世界》、《都挺好》等为分析对象,编写程序爬取豆瓣读书上针对该图书的短评信息,要求:(1)对前3页短评信息进
  • 2024-06-195.31
    完成8-2【Python0026】图书评论数据分析与可视化分数10全屏浏览作者 doublebest单位 石家庄铁道大学【题目描述】豆瓣图书评论数据爬取。以《平凡的世界》、《都挺好》等为分析对象,编写程序爬取豆瓣读书上针对该图书的短评信息,要求:(1)对前3页短评信
  • 2024-06-166.5博客
    python和工程数学俩实验真累啊python学习:importrefromcollectionsimportCounterimportrequestsfromlxmlimportetreeimportpandasaspdimportjiebaimportmatplotlib.pyplotaspltfromwordcloudimportWordCloudheaders={"User-Agent":"Mozilla
  • 2024-06-145.29
    今天初试爬虫来爬取平凡的世界这本书再豆瓣的点赞数最多的排行。importrefromcollectionsimportCounterimportrequestsfromlxmlimportetreeimportpandasaspdimportjiebaimportmatplotlib.pyplotaspltfromwordcloudimportWordCloudheaders={
  • 2024-06-14基于profanity-check实现不文明用语识别和斗殴行为预测
    一、语音识别不文明用语1.1、语言检查库profanity-check这是一个快速、强大的Python库,用于检测字符串中的不雅或冒犯性语言。更多关于profanity-check如何构建以及为何要构建它的信息可在这篇博客文章中找到。1.2、测试模型运行环境:python               
  • 2024-06-13华为OD机试:40 知识图谱新词挖掘
    packagea_od_test;importjava.util.Arrays;importjava.util.Scanner;/*知识图谱新词挖掘知识点滑窗时间限制:1s空间限制:256MB限定语言:不限题目描述:小华负责公司知识图谱产品,现在要通过新词挖掘完善知识图谱。薪词挖掘:给出一个待挖掘文本内容字符串Content和
  • 2024-06-132024.5.30
    8-2【Python0026】图书评论数据分析与可视化分数10全屏浏览作者 doublebest单位 石家庄铁道大学【题目描述】豆瓣图书评论数据爬取。以《平凡的世界》、《都挺好》等为分析对象,编写程序爬取豆瓣读书上针对该图书的短评信息,要求:(1)对前3页短评信息进
  • 2024-06-13Stream API用好了效率倍增,优缺点对比
    https://mp.weixin.qq.com/s/Oc-WpS2hdMgPtHWuhwgzCw 既然JDK的大神们,设计出StreamAPI,肯定是优点大于缺点,程序汪必须拥抱变化,下面我列出了他的优缺点,后面还有常见函数的例子。优点:代码简洁:StreamAPI使用Lambda表达式,使得集合操作的代码更加简洁易读,减少了传统的for循环
  • 2024-06-122024.06.06
    完成概率论、计网作业并提交python实验:importrefromcollectionsimportCounterimportrequestsfromlxmlimportetreeimportpandasaspdimportjiebaimportmatplotlib.pyplotaspltfromwordcloudimportWordCloudheaders={"User-Agent":"Mozilla/5.0(Wi
  • 2024-06-07LeetCode 2559. 统计范围内的元音字符串数
    2559.统计范围内的元音字符串数给你一个下标从 0 开始的字符串数组 words 以及一个二维整数数组 queries 。每个查询 queries[i]=[li,ri] 会要求我们统计在 words 中下标在 li 到 ri 范围内(包含 这两个值)并且以元音开头和结尾的字符串的数目。返回一个整
  • 2024-06-072559. 统计范围内的元音字符串数(前缀和) o(n)时间复杂度
    给你一个下标从 0 开始的字符串数组 words 以及一个二维整数数组 queries 。每个查询 queries[i]=[li,ri] 会要求我们统计在 words 中下标在 li 到 ri 范围内(包含 这两个值)并且以元音开头和结尾的字符串的数目。返回一个整数数组,其中数组的第 i 个元素对
  • 2024-06-065.18
    图书评论爬取importrefromcollectionsimportCounterimportrequestsfromlxmlimportetreeimportpandasaspdimportjiebaimportmatplotlib.pyplotaspltfromwordcloudimportWordCloudheaders={"User-Agent":"Mozilla/
  • 2024-06-04ltp模型报错 model no loded
     打印了一下路径。莫名奇妙的路径,在网上找了很久的答案,丢是说这个路径的符号有问题改一下试试吧 后面有查到说的是不能中文路径,我觉得很奇怪,因为我新建了一个test文件来测试,那个文件中的模型路径采用的是当前的文件路径:并且运行成功了但是我在想,他会不会因为我这个项目里面
  • 2024-06-03LeetCode 720. Longest Word in Dictionary
    原题链接在这里:https://leetcode.com/problems/longest-word-in-dictionary/description/题目:Givenanarrayofstrings words representinganEnglishDictionary,return thelongestwordin words thatcanbebuiltonecharacteratatimebyotherwordsin wor
  • 2024-06-02【大模型应用开发极简入门】构建新闻稿生成器:提示词的使用与基于事实的提示词
    文章目录一.提示词怎么写二.完整代码三.基于事实的promptGPT-4和ChatGPT等LLM专用于生成文本。我们可以使用GPT-4和ChatGPT在各种场景中生成文本,举例如下。电子邮件合同或正式文档创意写作逐步行动计划头脑风暴广告职位描述对于本项目,我们将创建一个工具,它可
  • 2024-05-31Leetcode-2828. 判别首字母缩略词
    2828.判别首字母缩略词给你一个字符串数组words和一个字符串s,请你判断s是不是words的首字母缩略词。如果可以按顺序串联words中每个字符串的第一个字符形成字符串s,则认为s是words的首字母缩略词。例如,"ab"可以由["apple","banana"]形成,但是无法从["bear"
  • 2024-05-30TF-IDF算法
    TF-IDF(termfrequency–inversedocumentfrequency,词频-逆向文件频率)TF-IDF本质上是一种统计方法,用来评估一个词/token在整个语料库中当前文档中的重要程度,字词的重要性随着它在当前文档中出现的频率成正比增加,随着它在整个语料库中出现的频率成反比降低。主要思想:某个单词在当
  • 2024-05-268-3 【Python0035】英文统计
    编写程序实现对特定英文文章(文本文件)的单词数和有效行数的统计,其中要求空行不计数; defcount_words_and_lines(filename):word_count=0line_count=0withopen(filename,'r')asfile:forlineinfile:stripped_line=line.strip()ifs