首页 > 编程语言 >python代码将文件夹里面pdf全部出现单词出现频次显示出来并且出现意思,保存到excle

python代码将文件夹里面pdf全部出现单词出现频次显示出来并且出现意思,保存到excle

时间:2024-10-14 17:21:11浏览次数:10  
标签:meanings python import 列表 pdfminer pdf excle nltk wordnet

英语考试和代码结合(自动化人哭了)

需要教程可以私信我,我可以出视频B站

import csv
import re
from collections import Counter
from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument
from pdfminer.pdfpage import PDFPage
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import PDFPageAggregator
from pdfminer.layout import LTTextBoxHorizontal, LAParams
import pandas as pd
import nltk
from nltk.corpus import wordnet as wn
import os

# 下载wordnet数据库
nltk.download('wordnet')

# 停用词列表,您可以根据需要扩展此列表
stopwords = set([
    # ... 您的停用词列表 ...
])

def get_word_meanings(word):
    meanings = []
    for 

标签:meanings,python,import,列表,pdfminer,pdf,excle,nltk,wordnet
From: https://blog.csdn.net/2401_82947696/article/details/142923708

相关文章

  • Python 实现Excel XLS和XLSX格式相互转换
    在日常工作中,我们经常需要处理和转换不同格式的Excel文件,以适应不同的需求和软件兼容性。Excel文件的两种常见格式是XLS(Excel97-2003)和XLSX(Excel2007及以上版本)。本文将详细介绍如何使用Python在XLS和XLSX格式之间进行转换。Python库安装所需Python库-Spire.XLSforPython......
  • Python3 元组
    一、引入元组是什么?它既能像列表一样容纳不同类型的元素,也拥有字符串不可变的特性,所以元组是退化的列表吗?列表:[元素1,元素2,元素3,...,元素n]元组:(元素1,元素2,元素3,...,元素n)但事实上,元组的话可以不带小括号,只要用逗号隔开就行,如下所示:>>>rhyme=(1,2,3,......
  • 【最新原创毕设】基于SpringCloud的一站式热点推荐平台+23649(免费领源码)可做计算机毕
    目 录摘要1绪论1.1选题背景与意义1.2开发现状1.3论文结构与章节安排2 开发环境及相关技术介绍2.1MySQL数据库2.2 Tomcat服务器2.3 Java语言2.4 SpringCloud框架介绍3 一站式热点推荐平台系统分析3.1可行性分析3.1.1技术可行性分析3.1......
  • (2024最新毕设合集)基于SpringBoot的通江银耳销售管理系统-15998|可做计算机毕业设计JAV
    摘要随着人们健康意识的增强,银耳这种传统的中药食材备受关注。而通江银耳是四川省通江县特产,中国国家地理标志产品。四川省通江县是银耳的发源地,中国银耳之乡,通江银耳因主产于此而得名,以其独到的质厚、肉嫩、易炖化和非常高的营养价值及药用价值而享誉海内外。需要一个高效便......
  • (强烈建议收藏)PDF 术语表 - Part 2
     (续Part1)本系列解释了与PDF开发相关的常用术语,强烈建议收藏。我们同样还有英文版的术语表。如果这篇文章对您有帮助,欢迎关注,后续我们会带来更多相关文章。 DCT离散余弦变换是 JPEG 和 WebP 中常用的压缩算法。已弃用任何被描述为已弃用的功能都不建议使用,因为......
  • python3.6 解析svg保存到mysql
     1importjson2fromcollectionsimportCounter3fromjsonimportJSONDecodeError45importmysql6importrequests7fromlxmlimportetree89#定义远程SVG文件的URL10file=r'D:\tmp_files\jmx\0919_3568.txt'11dat......
  • 【python爬虫案例】利用python爬取豆瓣音乐评分TOP250的排行数据!
    一、爬取案例-豆瓣音乐TOP250之前给大家分享了2个豆瓣的python爬虫案例:【python爬虫案例】利用python爬虫爬取豆瓣电影评分TOP250排行数据!【python爬虫案例】利用python爬虫爬取豆瓣读书评分TOP250的排行数据! 今天再给大家分享一下:豆瓣音乐排行榜TOP250的python爬虫案例!爬......
  • Python学习方式有哪些?
    目前,市面上从事Python培训的机构有很多,五花八门、规模不一,且教学质量也存在很大的差异,培训方式更是各有千秋,那么Python培训班都有哪些学习方式?我们通过这篇文章来看看吧。1、Python面授培训班面授班也叫做脱产班,是最为常见的一种Python培训方式,通过线下脱产的方式学习......
  • 按键精灵脚本转python
    importreimportpyautoguiimporttime#定义映射关系command_map={'MoveTo':'pyautogui.moveTo','LeftClick':'pyautogui.click','LeftDown':'pyautogui.mouseDown','LeftUp'......
  • 按键精灵转python脚本中文输入的问题以及解决办法
    在使用pyautogui进行自动化操作时,如果你想在指定位置输入中文,可能会遇到一些问题,因为pyautogui本身并不直接支持输入非英文字符。不过,你可以通过结合其他库(如pyperclip)来实现输入中文。以下是一个示例代码,展示了如何在指定位置输入中文:importpyautoguiimportpyperclip......