首页 > 其他分享 >正则表达式(爬虫)

正则表达式(爬虫)

时间:2023-01-29 19:56:25浏览次数:46  
标签:group 读取 正则表达式 Pattern 爬虫 find String

  1. Pattern表示正则表达式
  2. matcher:文本匹配器,作用按照正则表达式的规则去读取字符串,重头开始读取,在大串中去寻找字串
  3. 案例:
      String s = "java带安抚阿富汗发货 爱的哈佛哈hi氟化物 哇大负荷和慰问活动iava17,java18,wdwdjava19";
    //Pattern表示正则表达式
    //matcher:文本匹配器,作用按照正则表达式的规则去读取字符串,重头开始读取,在大串中去寻找字串

    //Pattern p = Pattern.compile("java\\d{0,2}");//获取正则表达式
    //获取文本匹配器的对象,m表示文本匹配器对象,s表示大串,p表示规则
    //m要在s中寻找符合p规则的小串
    // Matcher m= p.matcher(s);
    //拿着文本匹配器去重头开始读取,寻找符合规则的子串,有则返回true,在底层记录起始索引和结束索引+1没有返回false
    // boolean b = m.find();
    //方法底层会根据find方法记录的索引进行字符串的截取
    //subString(起始索引,结束索引);包头不包尾
    //(0,4),不包括4,最后把截取到的小串返回
    // String group = m.group();
    //System.out.println(group);
    //再次调用,理由同上
    //b=m.find();
    //String group1 = m.group();
    // System.out.println(group1);
    //强化
    Pattern p= Pattern.compile("java\\d{0,2}");
    Matcher m = p.matcher(s);
    while (m.find()){
    String group2 = m.group();
    System.out.println(group2);

标签:group,读取,正则表达式,Pattern,爬虫,find,String
From: https://www.cnblogs.com/lyjzht/p/17073701.html

相关文章

  • 爬虫对于protobuf协议的处理
    第一步处理1.首先抓包2.复制请求值的hex3.打开010编辑器4.创建hexfile5.ctrl+shift+c复制内容,并保持6.protoc--decode_raw<存的文件路径1:12:165000108201......
  • 网络爬虫(三)爬取B站视频
    尝试着用request库去爬取了一些B站视频参考和抄了一些博主的代码和思路,我略作了修改,目前是不能爬取带分页的视频(只需要略作修改,也可爬取):b站视频爬虫_哔哩哔哩_bilibiliP......
  • 爬虫入门第1课:代理池概述及开发环境
    1.什么是代理池代理池就是有代理IP组成的池子,它可以提供多个稳定可用的代理IP2.为什么要实现代理池我们在做爬虫的时候,最常见一种反爬手段就是ip反爬;也就是当同一......
  • 正则表达式练习(安装快捷插件any-rule,使用时右键打开)
    正则表达式心得:拿到正确的数据,从左到右依次书写正则表达式中():表示分组,|:表示或者  如果出现或者,一定要加上小括号表示分组  验证邮箱   简单验证身份证: ......
  • js逆向——酷狗音乐&酷狗音乐爬虫
    寒假期间当然要开卷了。今天我们要爬取酷狗音乐的歌曲,个人觉得酷狗还是比较容易的。虽然付费音乐的apl我没找到,但有个会员就能听,能听就能下载,就不用单曲购买了,会员到期了也......
  • Python爬虫实践代码示例
    对于刚入门爬虫的小伙伴来说,累积经验多练习代码是非常有必要的,下面就是有关爬虫的一些小案例,欢迎大家指正。importrequestsfrombs4importBeautifulSoup#importpandas......
  • JavaScript学习笔记—正则表达式
    用来定义一个规则通过这个规则计算机可以检查一个字符串是否符合规则或者将字符串中符合规则的内容提取出来也是JS中的一个对象,所以要使用正则表达式,需要先创建正则表达......
  • Python selenium 拉钩爬虫
    selenium用作自动化测试工具,并非爬虫工具,用作爬虫性能没那么好。但既然可以读取网页信息,那还是可以用来爬取数据的。用该工具模拟访问,网站会认为是正常的访问行为。项目创......
  • Day19 - 正则表达式
    正则表达式的概述正则表达式的介绍在实际开发过程中经常会有查找符合某些复杂规则的字符串的需要,比如:邮箱、图片地址、手机号码等,这时候想匹配或者查找符合某些规则的......
  • LeetCode正则表达式匹配(lambda/dp)
    lambda表达式[捕获列表](参数列表)mutable(可选)异常属性->返回类型{//函数体}所谓捕获列表,其实可以理解为参数的一种类型,lambda表达式内部函数体在默认情况下......