首页 > 其他分享 >流量分析

流量分析

时间:2023-03-29 14:44:42浏览次数:38  
标签:分析 分类 流量 任务 应用 识别 数据包

原文地址:https://heatao.cn/2021/02/12/流量识别概述/#more

只是做一些随笔记录罢了,各位不喜勿喷。

任务定义

流量识别旨在识别流量的意图,类别。在这里,流量指的是在网络中传输的数据包。其源头是应用层的读写操作,经过传输层协议的变换(分片、协议状态机、加密等),流量序列产生一定变化。但是这种变化非常有限,因为流量的发生过程本质是确定性的,随机因素较小,因此对于特定环境中的特定应用(浏览器访问 google.com)各种流量特征体现出相当大的一致性和独特性,这就使“从流量特征识别应用”的监督学习问题成为可能。

根据流量意图的不同,流量在传输过程中会带有很多特征,一些工作利用单个数据包的特征对流量进行识别,一些工作则对整个网络数据包流进行处理,这会根据任务具体的目标不同而有所变化。

进行流量识别的第一步是明确识别的目标,对于不同的任务,由于数据的特点和流量的意图不同,所采用的方法也有所不同。下面我们从任务的目标角度,对常见的流量识别任务进行了划分。

任务分类

应用流量分类

应用流量分类是流量识别中最常见的任务,该任务通常的做法是,对特定领域或者对常用的应用通过流量进行区分。通过对应用流量进行区分,一定程度上可以对用户隐私造成威胁,例如了解用户的医疗状况,性取向或宗教信仰。该任务在一些场景也有特定作用,比如俄罗斯,印度等国的流量审查。同时,由于目前加密流量检测难度的增大,网络黑产利用爬虫,刷流量,撸羊毛,扰乱正常网络秩序,为了解决这一问题,急需要更有效的手段对应用流量进行识别。

网站指纹

网站指纹(website fingerprinting)的目标是根据流量对用户所访问的网页进行识别。最近有很多研究都表明,可以根据访问网站所产生的流量的数据包和大小检测特定的网站信息。

应用行为分类

流量行为分类旨在识别流量的意图,该任务很多时候与应用分类同时进行,后者识别同类型的应用,前者在此基础上识别出应用的行为和步骤。行为分析可以暴露用户的隐私,分析用户的偏好,也可以在流量有一个更为全面的了解,对热点资源进行分析。从安全的角度而言,行为分类还可以识别出具有异常行为的流量,是一个值得研究的问题。

混淆流量识别

很多根据统计特征进行流量识别的方法可以进流量进行很好的分类,暴露隐私,为了避免这一问题,可以采用流量混淆的方式对流量进行伪装,改变原本的特征[Wright2009]。流量混淆的方式包括且不限于:改变数据包大小,将数据包伪装成另外行为或应用的流量,伪装成不同的协议。

恶意流量识别

越来越多的恶意网络服务通过加密和隧道技术绕过防火墙和入侵检测系统,这些恶意流量通过加密。隐藏了通讯内容,导致恶意流量很难被实时监控到,对互联网安全造成了严重的影响,及时发现恶意流量是学术界和工业界面临的一项巨大的挑战。

标签:分析,分类,流量,任务,应用,识别,数据包
From: https://www.cnblogs.com/wxy-make/p/17268876.html

相关文章

  • 源码分析CHANGE REPLICATION SOURCE TO
    从MySQL8.0.23版本开始,CHANGEMASTERTO开始被替换为CHANGEREPLICATIONSOURCETO,下面使用MySQL8.0.32的代码分析语句的具体执行流程。从语句的入口函数mysql_execute_......
  • 零售数据分析之操作篇10:销售排名与TOP分析
    各位数据的朋友,大家好,我是老周道数据,和你一起,用常人思维+数据分析,通过数据讲故事。上期回顾与作业解答上一讲讲了如何通过历史聚合与其他聚合一起使用的场景,包括历史聚合+唯......
  • 行业分析| anyRTC智慧视频监控的应用
    智慧视频监控是安全防范系统的重要组成部分,不仅可以达到一般视频监控系统的远程控制监控、视频回看,满足治安管理、城市管理、交通管理、应急指挥等需求,还具备防盗报警系统......
  • R语言Kmeans聚类、PAM、DBSCAN、AGNES、FDP、PSO粒子群聚类分析iris数据结果可视化比
    全文链接:http://tecdat.cn/?p=32007原文出处:拓端数据部落公众号本文以iris数据和模拟数据为例,帮助客户了比较R语言Kmeans聚类算法、PAM聚类算法、DBSCAN聚类算法、AGNE......
  • R语言泰坦尼克号随机森林模型案例数据分析|附代码数据
    原文链接:http://tecdat.cn/?p=4281最近我们被客户要求撰写关于随机森林模型的研究报告,包括一些图形和统计输出。如果我们对所有这些模型的结果进行平均,我们有时可以从它......
  • oracle 离线分析其他库的归档日志
    oracle数据库是可以离线分析其他库的归档日志的,比如想分析生产库的归档日志,可以将其拿到测试库上来分析,以免影响生产库的性能。dictory模式:将数据库的数据字典抽取到操作......
  • 大数据 离线批计算 实时流量
     https://www.51doit.com/archives/1166.html  ......
  • 双因素方差分析流程
    双因素方差分析流程一、案例分析当前收集了39名志愿者减重效果的相关数据,他们的生活方式可分为3种,现在研究人员想要研究生活方式和性别对于减重的影响,想要知道不同的生......
  • 熵值法综合评价分析流程
    熵值法综合评价分析流程一、案例背景当前有一份数据,是各品牌车各个维度的得分情况,现在想要使用熵值法进行综合评价,得到各品牌车的综合得分,从而进行车型优劣对比,为消费者......
  • 问卷中多选题该怎么分析?
    一、案例与问卷本研究选取大学生作为研究对象,旨在通过理财认知、理财现状、理财偏好三个方面,对大学生理财产品了解情况、使用需求进行调查。本次问卷共分为四个部分:第一......