我使用 spire pdf,但出现以下错误:“DllNotFound_Windows,libSkiaSharp,No se puede encontrar el módulo especificado.:....”
def extract_text_from_pdf(file_path, output_file):
# Load a PDF document
doc = PdfDocument()
doc.LoadFromFile(file_path)
extracted_text = []
# Iterate over the pages of the document
for i in range(doc.Pages.Count):
page = doc.Pages.get_Item(i)
# Extract the text from the page
textExtractor = PdfTextExtractor(page)
option = PdfTextExtractOptions()
text = textExtractor.ExtractText(option) ## in this line is the error
extracted_text.append(text)
return extracted_text
我下载了 dll,但我不确定将其保存在哪里。我在 google colab 上运行了相同的代码并且它有效
看起来你遇到了 Spire.PDF 中缺少
libSkiaSharp
DLL 的问题。 这个问题通常是由于 Spire.PDF 找不到所需的依赖项导致的。
以下是如何解决此问题的步骤:
1. 确认 libSkiaSharp.dll 存在于项目中
-
Spire.PDF for Python 依赖于 SkiaSharp 进行图形渲染。你需要确保
libSkiaSharp.dll
文件存在于你的项目目录中。你可以在 Spire.PDF NuGet 包下载的\Runtimes\win-x64\native
(或类似路径,根据你的系统架构)文件夹中找到它。
2. 将 DLL 文件复制到正确的目录
-
将
libSkiaSharp.dll
文件复制到你的 Python 脚本所在的目录。 - 或者,你也可以将其复制到你的系统 PATH 环境变量中列出的任何目录中。
3. 检查 DLL 平台兼容性
-
确保
libSkiaSharp.dll
文件与你的 Python 环境的体系结构(x86 或 x64)兼容。如果你使用的是 64 位 Python,则需要 64 位版本的 DLL。
4. 重新启动你的 Python 环境
- 在你进行任何更改后,请确保重新启动你的 Python 环境(例如,关闭并重新打开你的 Jupyter Notebook 或 IDE),以便它可以加载更新后的 DLL 路径。
如果以上步骤都没有解决问题,请尝试以下操作:
- 重新安装 Spire.PDF: 尝试卸载并重新安装 Spire.PDF for Python 包,以确保所有依赖项都已正确安装。
- 检查 Spire.PDF 文档: 参考 Spire.PDF for Python 的官方文档,以获取有关解决 DLL 问题的任何特定说明或故障排除步骤。
- 搜索 Spire.PDF 论坛: 在 Spire.PDF 论坛或其他在线社区中搜索类似的错误消息,以查看其他人是否遇到过类似问题并找到了解决方案。
完成这些步骤后,你的代码应该可以运行,并且能够从 PDF 文件中提取文本。
请注意: 将 DLL 文件复制到系统目录中可能会产生安全风险,因此请谨慎操作并确保 DLL 文件来自受信任的来源。
标签:python,spire.pdf From: 78813802