Beautiful Soup4
使用requests库获取html页面并将其转换成字符串之后,需要进一步解析html页面格式,提取有用信息。
BeautifulSoup4库,也被成为bs4库,用于解析和处理html和xml
1.先通过requests获取页面源代码
2.创造一个BeautifulSoup对象
bs_1=BeautifulSoup(网页源代码,'lxml')
//第一个参数是要解析的html文本,第二个参数是使用那种解析器,对于HTML来讲就是html.parser,这个是bs4自带的解析器。
标签:源代码,Python,BeautifulSoup,bs4,html,解析,页面
From: https://www.cnblogs.com/instser/p/16791925.html