首页 > 其他分享 >腾讯用户画像——如何为QQ画像和代理IP画像

腾讯用户画像——如何为QQ画像和代理IP画像

时间:2023-06-01 12:36:54浏览次数:30  
标签:QQ IP 端口 代理 腾讯 画像

腾讯用户画像

画像,实质

上就是给账号、设备等打标签。

用户画像 = 打标签

我们这里主要从安全

的角度动身
来打标签,比如

IP画像,我们会标注IP是不是代理IP,这些对我们做战略
是有辅佐

的。

以QQ的画像为例,比如

,一个QQ只登录IM、不登录其他腾讯的业务、不聊天、频繁的加好友、被好友删除、QQ空间要么没开通、要么开通了QQ空间但是评论多但回复少,这种号码我们普通
会标注QQ养号(色情、营销),相似

的我们也会给QQ打上其他标签。

标签的类别和明细,需求
做风控的人自己

去设定,比如

:天文
位置,按省份标志
。性别,安男女标志
。其他细致规则以此规律自己

去设定。

我们看看腾讯的IP画像,沉淀的逻辑如下图:

普通
的业务都有针对IP的频率、次数限制的战略
,那么黑产为了对立
,必然会大量采用代理IP来绕过限制。

既然代理IP的辨认

如此重要,那我们就以代理IP为例来谈下腾讯辨认

代理IP的过程。

辨认

一个IP是不是代理IP,技术不外乎就是如下四种:

  1. 反向探测技术:扫描IP是不是开通了80,8080等代理效劳
    器经常开通的端口,显然一个普通的用户IP不太可能开通如上的端口。
  2. HTTP头部的X_Forwarded_For:开通了HTTP代理的IP能够 经过
    此法来辨认
    是不是代理IP;假定
    带有XFF信息,该IP是代理IP无疑。
  3. Keep-alive报文:假定 带有Proxy-Connection的Keep-alive报文,该IP毫无疑问是代理IP。
  4. 查看IP上端口:假定 一个IP有的端口大于10000,那么该IP大多也存在问题,普通的家庭IP开这么大的端口简直
    是不可能的。

以上代理IP检测的办法

简直

都是公开的,但是盲目

去扫描全网的IP,被拦截不说,效率也是一个很大的问题。

因而

,我们的除了应用
网络爬虫爬取代理IP外,还应用
如下办法

来加快代理IP的搜集
:经过
业务建模,搜集
歹意

IP(黑产运用
代理IP的可能性比较

大)然后再经过
协议扫描的方式来判别
这些IP是不是代理IP。每天腾讯都能发现千万级别的歹意

IP,其中大部分

还是代理IP。

标签:QQ,IP,端口,代理,腾讯,画像
From: https://blog.51cto.com/u_11908275/6393183

相关文章

  • JS垃圾回收——和其他语言一样,JavaScript 的 GC 策略也无法避免一个问题:GC 时,停止响应
    JavaScript内存管理&垃圾回收机制标记清除js中最常用的垃圾回收方式就是标记清除。当变量进入环境时,例如,在函数中声明一个变量,就将这个而变量标记为“进入环境”。从逻辑上讲,永远不能释放进入环境的变量所占用的内存,因为只要执行流进入相应的环境,就可能会用到它们。而当变量离......
  • python selenium框架解决ip代理框不能自动化登录,解决pyautogui开不了多线程问题
    有时候我们使用python自动化框架的时候,打开一个网页的时候,它会出现出线这一种登录框,我们f12检查不了,用开发者工具强制检查里面没有任何属性.那这时候我们就可以用到python第三方库:pyautoguiPyAutoGUI:是一个Python库,可用于自动化GUI(图形用户界面)程序的任务。它可以让Pytho......
  • vue3 ts elementplus行头加el-tooltip
    <!--vue3tselementplus行头加el-tooltip--><el-table-columnalign="left"><template#header><el-tooltipclass="box-item"effect="dark"con......
  • axi_crossbar IP使用说明
    总体简介图例是2X3的配置主要特性▲支持Master、Slave接口数量配置▲支持全连接、部分连接▲支持多threads、多issue效率匹配▲支持输入BURST最大数量匹配▲支持Master、Slave接口寄存,优化时序▲支持Region、User、Secure配置一些参数描述DATA_WIDTH:默认值为32,AXI数据宽度......
  • 主机操作系统的识别方法——TTL、namp -O IP、网站文件大小写 三种方法区分 推荐nmap
    (1)一、TTL是什么TTL(TimeToLive,生存时间)是IP协议包中的一个值,当我们使用Ping命令进行网络连通测试或者是测试网速的时候,本地计算机会向目的主机发送数据包,但是有的数据包会因为一些特殊的原因不能正常传送到目的主机,如果没有设置TTL值的话,数据包会一直在网络上面传送,浪费网络资源。......
  • HTTP代理IP错误代码403什么意思
    我们在使用HTTP代理的时候,经常会出现各种错误代码,其中错误代码403尤为突出。那么错误代码403出现的原因是什么呢?应该如何解决呢?让我们来学习一下吧。1.访问被拒绝HTTP代理服务器通常会限制对某些资源的访问权限,如果客户端试图访问受限资源,则代理服务器会返回403错误。......
  • HTTP代理IP错误代码400什么意思
    HTTP代理服务器是一种用于代理客户端请求的服务器,在转发用户请求时可能会出现各种错误。其中,400错误是常见的错误之一。当HTTP代理服务器收到一个不正确的请求时,它会返回一个400错误响应。本文将为您解释HTTP代理IP错误代码400的含义以及如何解决这个问题。1.IP地址无效......
  • TCP/IP 协议体系结构模型
    TCP/IP协议体系结构模型OSI模型通过一系列协议描述了理想的网络通信。TCP/IP并不直接对应于此模型。TCP/IP或者将几个OSI层组合为一个层,或者根本不使用某些层。下表显示了OracleSolaris:实现的TCP/IP层。该表列出了从最顶层(应用层)到最底层(物理网络层)的各层。表 1–2TC......
  • python dig trace 功能实现——通过Querying name server IP来判定是否为dns tunnel
    dnstunnel确认方法,查询子域名最终的解析地址:使用方法:pythondig_trace.py "<7cf1e56b67fc90f8caaae86e0787e907>.nsconcreteblock.info"anySelectedrootnameserver: 192.203.230.10['.','info.','nsconcreteblock.info.','<......
  • 在Eclipse中安装WebLogic12c的步骤
     1.  2.  3.  ......