首页 > 编程语言 >python代码将文件夹里面pdf全部出现单词出现频次显示出来并且出现意思,保存到excle

python代码将文件夹里面pdf全部出现单词出现频次显示出来并且出现意思,保存到excle

时间:2024-10-14 17:21:11浏览次数:14  
标签:meanings python import 列表 pdfminer pdf excle nltk wordnet

英语考试和代码结合(自动化人哭了)

需要教程可以私信我,我可以出视频B站

import csv
import re
from collections import Counter
from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument
from pdfminer.pdfpage import PDFPage
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import PDFPageAggregator
from pdfminer.layout import LTTextBoxHorizontal, LAParams
import pandas as pd
import nltk
from nltk.corpus import wordnet as wn
import os

# 下载wordnet数据库
nltk.download('wordnet')

# 停用词列表,您可以根据需要扩展此列表
stopwords = set([
    # ... 您的停用词列表 ...
])

def get_word_meanings(word):
    meanings = []
    for 

标签:meanings,python,import,列表,pdfminer,pdf,excle,nltk,wordnet
From: https://blog.csdn.net/2401_82947696/article/details/142923708

相关文章