论文学习_Nebula: Self-Attention for Dynamic Malware Analysis

时间：2024-07-01 23:56:12浏览次数：29

标签：Malware Nebula 标记 Self 论文沙箱 LSTM 模型

论文名称	发表时间	发表期刊	期刊等级	研究单位
Nebula: Self-Attention for Dynamic Malware Analysis	2024年	IEEE TIFS	CCF A	热那亚大学

1. 引言

研究背景与现存问题：动态恶意软件分析是一项至关重要的任务，不仅对于检测而且对于了解整个互联网上广泛传播的威胁而言。收集样本后，分析人员会在隔离环境（沙箱或模拟器）内执行恶意软件，并列出程序执行的所有操作，例如网络和文件系统访问、注册表修改、API 调用和内核系统调用。然后，这些操作被汇总成文本报告，由专家手动分析，以提炼所分析样本的恶意背后的基本原理。这项任务既乏味又占用资源，因为它涉及领域专家参与流程和手动标记。

机器学习 (ML) 技术，特别是卷积神经网络 (CNN) 和长短期记忆 (LSTM) 模型，现已广泛用于简化这一过程。这些模型经过大量文本报告的训练，可以更快地对新输入进行分类并减少人为干预。 CNN 捕获报告中的局部模式，为神经架构提供有价值的特征，而 LSTM 模型则学习全局标记关系。然而，这些提出的方案受到三个主要缺点的阻碍：（i）卷积仅捕获局部信息，丢弃了动作之间的报告中包含的全局相关性，而 LSTM 模型在基于延长的令牌序列（如 API 链）对样本行为进行建模方面遇到了困难带参数的调用； (ii) 大多数提出的技术仅依赖于同质输入数据，如 API 调用，而不是利用代表恶意软件样本行为的更完整和异构信息； (iii) 源代码、数据和预训练模型通常不适用于大多数提出的技术，从而阻碍了可重复性。

研究内容：为了克服这些问题，论文提出了 Nebula，这是一种基于 Transformer 架构的 ML 模型，经过不同性质和格式的报告训练。与传统模型不同，Nebula 利用 Transformer 神经网络固有的自注意力机制，使 Nebula 能够识别报告中的局部和全局关系。

论文将 Nebula 设计为能够正确处理沙箱提供的所有输出，而不是仅仅关注报告的少数部分，从而使 Nebula 能够关联不同来源的 token。为了构建 Nebula，论文考虑了几种数据清理方法和特征提取器，并通过广泛的消融研究深入研究了它们的效果。通过这一分析，论文强调一些标准的 NLP 技术，例如通过字节对编码 (BPE) 的标记化，可以“按原样”应用，而有必要通过领域知识的视角来预处理数据，通过替换大多数独特的标记，例如特定标记 IP 地址、哈希值和互联网域。

实验结果：论文针对利用 CNN 和 LSTM 的不同最先进方法测试 Nebula，并在从不同沙箱环境获取的三个不同数据集上对它们在恶

标签：Malware,Nebula,标记,Self,论文,沙箱,LSTM,模型
From： https://blog.csdn.net/kitsch0x97/article/details/139950725

编码器的稀疏注意力块（ProbSparse Self-Attention Block）
编码器的稀疏注意力块（ProbSparseSelf-AttentionBlock）详细解释1.概述稀疏注意力块是Informer模型的核心组件之一，旨在高效处理长时间序列数据。它通过稀疏自注意力机制（ProbSparseSelf-Attention）显著降低计算复杂度，同时保持较高的性能。2.主要组件稀疏注意力块由以下......
def __init__(self,parameterlist)初始化方法和def __functionName__(self,parameterl
问题描述：def__init__(self,parameterlist)初始化方法和def__functionName__(self,parameterlist)实例方法，其中functionName是具体方法的名字，比如表示奔跑、或者狗叫的方法。对于上面这两种方法有什么区别？问题解答：在Python类中，__init__方法和其他实例方法（如__functionName_......
在面向对象的创建中，需要用到def init(self)方法。括号里的self是必选参数，必选参数存在
问题描述：在面向对象的创建中，需要用到definit(self)方法。括号里的self是必选参数，必选参数存在的意义是什么，self可以干什么用，请举例表达self的用处。问题解答：在面向对象编程中，__init__(self)方法是类的构造函数，用于初始化对象实例。括号里的self参数是必选参数，代表类实例......
MCT Self-Refine：创新集成蒙特卡洛树搜索（MCTS）提高复杂数学推理任务的性能，超GPT4，使用 L
......
SCI一区级 | Matlab实现GWO-CNN-LSTM-selfAttention多变量多步时间序列预测
GWO（GreyWolfOptimizer）是一种基于灰狼行为的优化算法，用于优化问题的求解。CNN（ConvolutionalNeuralNetwork）是卷积神经网络，主要用于图像处理和模式识别。LSTM（LongShort-TermMemory）是一种递归神经网络，用于处理和预测时序数据。self-attention（自注意力）是一种机制，用于在序列......
Anomaly Detection on Attributed Networks via Contrastive Self-Supervised Learnin
PaperAnomalyDetectiononAttributedNetworksviaContrastiveSelf-SupervisedLearnin代码实现异常注入inject_anomaly.pyinject_anomaly.py注入异常过程，处理原始数据集，并添加结构和属性扰动，注入结构属性异常。importnumpyasnpimportscipy.sparseasspim......
【YOLOv8改进】ACmix(Mixed Self-Attention and Convolution) (论文笔记+引入代码)
YOLO目标检测创新改进与实战案例专栏专栏目录：YOLO有效改进系列及项目实战目录包含卷积，主干注意力，检测头等创新机制以及各种目标检测分割项目实战案例专栏链接:YOLO基础解析+创新改进+实战案例摘要卷积和自注意力是两个强大的表示学习技术，通常被认为是彼此独立的两......
Sentiment Knowledge Enhanced Self-supervised Learning for Multimodal Sentiment A
文章目录SKESL：多模态情感分析中的情感知识增强型自监督学习文章信息研究目的研究内容研究方法1.SentimentWordMasking2.Textrepresentationlearning3.Non-verbalinformationinjection（multimodalfusion）4.SentimentIntensityPrediction5.LossFunction6.Fine-tuni......
C# NewtonJson Self referencing loop detected for property 'Parent' with type
privatevoidImage_MouseLeftButtonDown(objectsender,MouseButtonEventArgse){stringimgJson1=JsonConvert.SerializeObject(img1);System.IO.File.AppendAllText($"{DateTime.Now.ToString("yyyyMMddHHmmssffff")}_img.json",imgJso......
BGP中next-hop-self 小实验
next-hop-self在EBGP和IBGP边界使用，对ibgp下一跳邻居使用配置命令routerbgp1234neighbor2.2.2.2next-hop-self使用Next-hop-self原因EBGP的路由传进IBGP时，带的下一跳是EBGP的地址。在IBGP中传给下一跳的IBGP路由器时，携带的还是EBGP的地址。由于第二跳的IBGP没有EBGP......

论文学习_Nebula: Self-Attention for Dynamic Malware Analysis

1. 引言

相关文章

赞助商

阅读排行