首页 > 编程语言 >python数据分析——lxml已下载但pycharm中使用仍然报错

python数据分析——lxml已下载但pycharm中使用仍然报错

时间:2022-10-27 16:04:26浏览次数:75  
标签:lxml img get python book books 报错 find


参照一本书(《python数据分析入门 从数据获取到可视化》-沈祥壮)上的代码准备学习一下爬虫,但是卡在了标题中的错误中,尝试了很多方法:pip install lxml / pip uninstall lxml、直接在官网上下载相应版本的lxml 使用绝对路径安装等等,仍然无法解决。

 

期间有许多提示内容,其中就包括下图所示:

Requirement already satisfied: lxml in c:\users\许逍遥\appdata\local\programs\python\python37\lib\site-packages (4.4.1)

python数据分析——lxml已下载但pycharm中使用仍然报错_绝对路径

显示的意思很明显,已经安装过了lxml,所以问题就在pycharm配置这块,具体解决办法可以参考下面这篇文章(主要是

注意!敲黑板了!

进入到pycharm,选择file-setting-project interpreter:

这块):

​python 中安装lxml包出现的问题​

修改相应配置后,就可以正常运行了!

附(实验代码):

import requests
from bs4 import BeautifulSoup

url = 'https://book.douban.com/latest'

data = requests.get(url)
#data = requests.get(url)
#print(data.text)

soup = BeautifulSoup(data.text,'lxml')
books_left = soup.find('ul',{ 'class':'cover-col-4 clearfix' })
books_left = books_left.find_all('li')

books_right = soup.find('ul',{ 'class':'cover-col-4 pl20 clearfix' })
books_right = books_right.find_all('li')

books = list(books_left) + list(books_right)
#print(soup)

img_urls = []
titles = []
ratings = []
authors = []
details = []
for book in books:
#封面图片url地址
img_url = book.find_all('a')[0].find('img').get('src')
img_urls.append(img_url)

#图书标题
title = book.find_all('a')[1].get_text()
titles.append(title)

# 评价星级
rating = book.find('p', {'class': 'rating'}).get_text()
rating = rating.replace('\n', '').replace(' ', '')
ratings.append(rating)

# 作者及出版信息
author = book.find('p', {'class': 'color-gray'}).get_text()
author = author.replace('\n', '').replace(' ', '')
authors.append(author)

# 图书简介
detail = book.find_all('p')[2].get_text()
detail = detail.replace('\n', '').replace(' ', '')
details.append(detail)

print("img_urls: ", img_urls)
print("titles: ", titles)
print("ratings: ", ratings)
print("authors: ", authors)
print("details: ", details)

 

标签:lxml,img,get,python,book,books,报错,find
From: https://blog.51cto.com/u_15849465/5801380

相关文章

  • Java 使用发送请求报错
    问题发送post请求报错javax.net.ssl.SSLHandshakeException:sun.security.validator.ValidatorException:PKIXpathbuildingfailed:sun.security.provider.cer......
  • Python从进阶到高级—通俗易懂版(五)
    #==================================#Author:Mikigo#Env:deepin20.4os#==================================自定义序列1、可切片对象切片大家都很熟悉,......
  • 解决vue报错 Failed to mount component: template or render function not defined.
    今天npmrundev的时候,有个页面报错,提示[Vuewarn]:Failedtomountcomponent:templateorrenderfunctionnotdefined.昨天还好好的,今天就报错了,也没改啥。经过查资......
  • python | 算法-最短路径-dijikstra改进算法
    写在前面:我自己用python练习算法与数据结构的典型算法汇总在这里:汇总-算法与数据结构-python版,欢迎翻阅!1️⃣参考链接:https://github.com/algorithmzuo/algorithmbasic......
  • Python之JSON用法解析
    前景Python编写HDFS服务安装的过程中,需要将构建好的JSON对象输出到文件,采用那种方式更便捷方案1open函数defwriteExecCmdCheckActionsFile(self,out_res,che......
  • Python在接口测试中的应用
    1.介绍接口测试的方式有很多,可以使用的工具有jmeter,postman,soapUI等,也可以自己写代码进行接口测试(Python,java,go等等),工具的使用相对来说都比较简单,开箱即用。但如果接口中定......
  • 一文带你了解 Python 中的继承知识点
    1类继承Python是面向对象的编程语言,因此支持面向对象的三大特性之一:继承。继承是代码重用的一种途径,Python中的继承就像现实生活中的继承一样,子类可以顺利继承父类的属性......
  • Python7-实战
    实战01(修改手机默认语言)1classPhone:2'''手机类'''3def__init__(self,language='英文'):4iflanguage=='英文':5print("智能手......
  • conda管理python环境
    Anaconda使用教程Anaconda详细安装使用教程condacreate-nlearnpython=3//创建一个名为learn的环境并指定python版本为3(最新版本)condaactivatelearn//激活l......
  • python遇到IndexError: only integers, slices (`:`), ellipsis (`...`)……
    完整错误信息如下:IndexError:onlyintegers,slices(​​:​​​),ellipsis(​​...​​​),numpy.newaxis(​​None​​)andintegerorbooleanarraysarevalid......