首页 > 编程语言 >python 基础之 scrapy 当当数据一演示

python 基础之 scrapy 当当数据一演示

时间:2024-07-16 19:18:16浏览次数:14  
标签:xpath src python price 当当 scrapy context print

Items 程序

import scrapy

class DangdangItem(scrapy.Item):
    # define the fields for your item here like:
    # name = scrapy.Field()
    src = scrapy.Field()
    name = scrapy.Field()
    price = scrapy.Field()

spider 程序

import scrapy

class DangSpider(scrapy.Spider):
    name = "dang"
    allowed_domains = ["category.dangdang.com"]
    start_urls = ["https://category.dangdang.com/cp01.01.02.00.00.00.html"]

    def parse(self, response):
        context_list = response.xpath("//ul[@id='component_59']/li")
        # # print(context_list)
        # name = context_list.xpath("//a/@title")
        # # print(name)
        # src = context_list.xpath("//a@href")
        # # print(src)
        # price = context_list.xpath("//p[@class='price']/span[1]/text()")
        # print(price)
        book=[]
        for context in context_list:
            name = context.xpath(".//img/@alt").extract_first()
            # print(name)
            src = context.xpath(".//img/@data-original").extract_first()
            if src:
                src = src
            else:
                src = context.xpath(".//img/@src").extract_first()
            # print(src)
            price = context.xpath(".//p[@class='price']/span[1]/text()").extract_first()
            # print(price)
            print(name,price,src)

标签:xpath,src,python,price,当当,scrapy,context,print
From: https://www.cnblogs.com/dhcc/p/18305940

相关文章

  • 量化交易:如何在QMT中运行Python策略并在VSCode中高效调试?
    哈喽,大家好,我是木头左!为何选择QMT和VSCode进行量化策略开发?在量化交易的世界里,选择正确的工具与拥有优秀的策略同等重要。调用用VisualStudioCode(简称VSCode)或pycharm,方式都差不多。结合QMT的数据处理能力和VSCode的便捷调试功能,可以极大地提高量化策略的开发效率和质量。......
  • 第十一章Python 函数
    定义一个函数你可以定义一个由自己想要功能的函数,以下是简单的规则:函数代码块以 def 关键词开头,后接函数标识符名称和圆括号 ()。任何传入参数和自变量必须放在圆括号中间,圆括号之间可以用于定义参数。函数的第一行语句可以选择性地使用文档字符串—用于存放函数说明。函......
  • 利用wps的com口用python实现excel转pdf
    因为最近每天都要进行表格相关的工作,每天都要整理数据导出pdf,因为导出的表格格式比较复杂,要求也比较严格,所以python导出pdf的库都满足不了需求,比较好用的又需要付费,最后摸索到了可以用应用的com口完成导出因为微软excel在导出多个sheet时比较大的sheet页并不会缩小内容而是扩大......
  • 【2024年7月新版教程】python安装
    【2024年7月新版教程】python安装python安装一、下载Windows版python安装包1.访问python官网下载页2.选择python安装版本3.下载python安装程序二、在Windows系统安装python(全自动安装教程)1.启动安装2.python安装进度3.python安装完成4.查看python安装版本......
  • python 解题 洛谷B2021到B2025
    B2021输出保留3位小数的浮点数n=float(input())n=n-0.000000000000001print('%.3f'%n)B2022输出保留12位小数的浮点数m=float(input())print('%.12f'%m)B2023空格分隔输出a=input()b=int(input())c=float(input())d=float(input())print(a,"",b,"......
  • python+flask计算机毕业设计基于Vue.js的付费阅读小程序(程序+开题+论文)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着互联网技术的飞速发展,数字化阅读已成为现代人获取知识、娱乐休闲的重要方式之一。然而,在海量信息面前,如何有效保护知识产权,激励内容创......
  • python+flask计算机毕业设计技术的恩施婴童健康服务系统(程序+开题+论文)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着社会对婴幼儿健康关注度的不断提升,特别是在恩施地区,作为一个快速发展且对婴幼儿健康服务需求日益增长的地域,构建一个高效、全面的婴童......
  • 【Python】pyppeteer简单使用
    爬取百度搜索python的第一页标题importsyssys.path.append("/home/user/.local/lib/python3.9/site-packages")#将包的路径添加到环境变量importasynciofrompyppeteerimportlaunchfrompyppeteer_stealthimportstealth#反检测模块,隐藏浏览器特征importrandomw......
  • 使用Python和Selenium爬取京东商品数据
    简介❤❤码农不是吗喽(大学生版)-CSDN博客在本文中,我们将探讨如何使用Python编程语言结合Selenium库来爬取京东网站上的商品数据。Selenium是一个强大的工具,可以模拟真实用户对网页的交互操作,非常适合进行网页自动化测试和数据抓取。一、环境准备......
  • Python Part6 函数
    1.参数传递位置参数关键字参数若同时有位置参数和关键字参数,则位置参数在前,否则报错默认值参数:defhappy_birthday(name='小李',age=10):print('祝'+name+'生日快乐!')print(str(age)+'岁生日快乐!')happy_birthday()happy_birthday('小王')happy_birthday(......