• 2024-07-25Python3打开图片时请求ConnectionResetError(10054)
    我试图从'http://xxx.jpg'之类的网站下载图片。代码:headers={'user-agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/66.0.3359.139Safari/537.36'}url='http://xxx.jpg'resp
  • 2024-07-24在 Katana CLI 批处理中将发现的 URL 映射到原始 URL 时出现问题
    我使用KatanaCLI进行网络爬行,并使用Python包装器来管理批处理和输出解析。我的目标是将所有发现的URL映射回其原始URL,但我面临着一些发现的URL无法正确映射的问题,特别是当域相似或涉及子域时。以下是我的设置:|||输入:powerui.f​​oo.com、acnmll-en.foo.co
  • 2024-07-21爬取前 250 部电影 IDMb 中的数据
    拜托,我需要有人帮助我。我不明白为什么我只爬取25部电影而不是250部电影。我的代码:importpandasaspdimportrequestsfrombs4importBeautifulSoupheaders={'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)C