这一周主要学习了python爬虫,主要是列表,元组,函数,文件操作,异常处理和爬虫基本概念的学习,除此之外还学习了一点xml。
列表:[],列表可以存储混合类型,for循环遍历输出,以及列表的增删改查,增:append,extend,insert:删:pop,del,remove,查in,not in,以及列表的排序和反转,默认升序。
元组:元组是(),注意一个元素需要加,元组不可以更改,只可以连接,删除整个元组。
字典:即键值对,{},注意不存在的元素用get方法,还可以设置默认值。另外字典删除有删除和清空。
函数:主要是不含参的函数,含参的函数,带返回值的函数,带多个返回值的函数,全局变量和局部变量,全局变量和局部变量共同使用。
文件操作:open函数,另外文件打开一定要close,还有read方法读取文件内容,os对文件的操作。
异常处理:主要是异常要与捕获的类型一致,还要包含所有的异常。另外还要注意try finally的嵌套,尤其是打开文件的操作。
爬虫:即模拟浏览器打开网页,获取网页中需要的数据。以及爬取的基本流程:获取数据,处理内容,保存数据。
xml:可拓展标记语言,用来存储数据,配置文件。另外还要注意其严格的语法