首页 > 其他分享 >rust逆向初探

rust逆向初探

时间:2024-11-15 10:14:41浏览次数:3  
标签:逆向 加密 异或 flag base 内存 初探 断点 rust

rust 逆向葵花宝典

rust逆向技巧

rust逆向三板斧:

[!NOTE]

  1. 快速定位关键函数 (真正的main函数):观察输出、输入,字符串搜索,断点等方法。
  2. 定位关键 加密区 :根据输入的flag,打硬件断点,快速捕获程序中对flag访问的位置(加密区)。
  3. 定位错误输出(附近一定有比较功能的程序):定位到比较位置后 提取出正确加密后的结果

秘诀1:一个函数在**被调试运行(F8)**之后,如果既有输出,又要我们输入,那么我们当前所在的函数肯定不是真正的main函数。

秘诀2:所以存在flag(无论加密前后)的内存区域,都要首先打上硬件读断点

秘诀3:在c语言层面,对临时变量、局部变量等的修改,在汇编层面一定会反映到对内存空间的修改上。

rust语言的传参、返回值

  1. 前6个参数分别使用di,si,dx,cx,r8,r9,返回值使用ax寄存器:

image-20241015175505969

go语言的传参、返回值

  1. 前6个参数,ax,bx,cx,di,si,r8 返回值 ax:

例题1:

题目:ciscn2024 rust_baby

定位关键函数 — main函数

  1. 先运行观察输出的错误字符串:

    image-20241012121043893

  2. 但是在ida中搜索不到,所以只能调试来快速定位关键输入、输出函数:

    现在入口函数打上断点:

    image-20241012121358925

    这个函数位置出现了输出,在这里下断点,后面步入进入该函数继续调试定位:

    image-20241012121508735

    调用了外面传入给rcx参数这个地址处的函数,该函数也有输出,继续步入:

    image-20241012121745727

    直到进入rcx这个函数,才捕获到了输出 where is your flag?: 的函数,且这里任然可以继续往下调试 ,而没有停止来让我们输入,说明sub_7FF6BC37C570这个函数大概率就是单纯的输出函数:

    image-20241012121918858

  3. 后面在定位到输入的位置,肯定在这个输出函数的后面,如果不在说明当前函数不是真正的main,还需要继续步入:

    单步直到这里,就停止下来,需要我们输入:

    image-20241012122307772

  4. 根据上面定位输入、输出,可以基本确定rcx这个函数就是真正的main函数。

定位flag的加密区

  1. 输入flag后,在flag的内存区打上硬件读断点,后面程序访问flag内存区时就会停止:

    这里打断点,然后F9继续执行:

    image-20241012123238249

    后续ida触发硬件读断点,这里大概率就是flag的加密区

    image-20241012123349249

    image-20241012123402149

    image-20241012123434434

  2. 分析伪代码、或者直接分析汇编代码,理清加密逻辑即可。这里将flag 8个字符(不够就用’E’填充),一组进入encode加密,出来后再异或0x33,最后放入到encode2_flag中:

    image-20241012123705580

    image-20241012123732682

    image-20241012123816937

  3. encode函数加密分析,将加密再输入可以看到他不是一个对称加密,可以直接排除纯异或的加密方式(对称加密):

    image-20241012124117025

    根据函数加密前后的结果,来开始推断加密方式(输入的字符串要有特点,会更容易看出来):

    image-20241012124407683

    输入 bbbbbbbb encode加密后 aabbccdd ,可以看出只是对字符进行简单的前后移位处理,可以多测试几组数据来中和判断。

    image-20241012124604842

    符合前面推断 ==> key_1 = [1,1,0,0,-1,-1,-2,-2] ,对字符的ASCII码进行加减操作。

继续定位下一个加密区:
  1. 输入的flag加密后在内存中的位置已经改变,所以前面的硬件断点后续没用,再在新的flag位置打上断点:

    image-20241012124956863

    继续执行F9,ida再次触发硬件断点,定位到下一个flag加密区:

    image-20241012125105018

    这里对加密后的flag进行访问,可能也是一个加密区

    image-20241012125132339

  2. 继续分析伪代码、或者汇编:

    这里只是将前面加密后的flag(encode2_flag),16个一组一共7轮,与一个key的数组进行异或,所以需要提取出这个key数组。首先确定这个key数组是不是静态的(与flag的长度、内容都无关),如果时静态的就能直接从内存中提取出来。

    这里可以通过输入不同的flag(内容不同、长度不同),来比较程序的key数组是否相同:

    先根据输入不同的flag,来比较第一轮的key:

    image-20241012130446758

    image-20241012130519046

    可以看到即使输入不同的flag,第一轮加密的key数组都是相同的,所以直接调试来从内存中提取出key数组,一共有7轮。

  3. 如果时动态的可以数组(与flag的输入相关),则另外分析。

继续定位下一个加密区:
  1. 同样再给第二次加密后的flag内存区打上硬件断点

    image-20241012131024191

    然后继续F9运行,再次触发硬件断点,所以这里也可能是一个加密区

    image-20241012131341030

  2. 分析伪代码、汇编代码:

    这个do_while循环中,并没有加密的成分,只是对flag做一个复值操作,换到另外一片内存区域:

    最后将两次加密后的flag全家转移到了另外一篇内存区域,并没有加密操作,所以这里不是加密区 ,但是还要在这里下一个硬件断点,因为保不准后面可以使用这片区域的flag再进行加密操作。

    image-20241012131558560

  3. 上面断点后继续执行F9,这里又触发ida的额硬件断点:

    image-20241012131801949

  4. 继续分析这里的伪代码、或者汇编代码,可以发现是base64加密,加密的表如下:

    image-20241012132010867

  5. base64加密完成后,又换了一个内存区域来存储:

    image-20241012132209388

    继续打上硬件断点后运行 F9,但是这次触发硬件断点也没有加密操作 和 内存区转换的操作,应该是单纯的检查而已:

    image-20241012132319916

  6. 最后在 base64加密后的内存区域 下断点,其他的断点都删除掉:

    然后在这里又触发了硬件断点:

    image-20241012160207153

    仔细观察可以发现这是一个比较的区域,后面的 错误输出也紧挨比较区 ,这里比较,输入的flag加密后 和 正确的flag加密后的结果:

    image-20241012160408543

    image-20241012160441695

解密

  1. 最后根据分析的加密,和提取出来的数据,逆向出flag:

    res = "igdydo19TVE13ogW1AT5DgjPzHwPDQle1X7kS8TzHK8S5KCu9mnJ0uCnAQ4aV3CSYUl6QycpibWSLmqm2y/GqW6PNJBZ/C2RZuu+DfQFCxvLGHT5goG8BNl1ji2XB3x9GMg9T8Clatc="
    
    # 分组异或
    key = [0xDC, 0x5F, 0x20, 0x22, 0xC2, 0x79, 0x19, 0x56, 0x35, 0xDA, 
      0x8B, 0x47, 0xD3, 0x19, 0xFC, 0x55,0x14, 0xCD, 0xD2, 0x7B, 0x58, 0x59, 0x09, 0x42, 0xDE, 0x2C, 
      0xB4, 0x48, 0xD9, 0xF2, 0x1B, 0xA9,0x40, 0xE1, 0xA6, 0xFB, 0xFF, 0x38, 0xC1, 0xD5, 0xE2, 0xE8, 
      0x77, 0x78, 0x6F, 0x22, 0x04, 0xE6,0x16, 0x3E, 0x0C, 0x35, 0x52, 0x5C, 0xFD, 0xC1, 0xE5, 0x59, 
      0x1C, 0xD0, 0xAE, 0x5A, 0xB2, 0xDD,0x19, 0xF8, 0x42, 0xE6, 0x2C, 0x89, 0x59, 0xE5, 0x11, 0x9C, 
      0xC8, 0x7B, 0x81, 0x70, 0x7F, 0x6F,0xBC, 0x6F, 0x02, 0x8F, 0xF7, 0xF4, 0xC8, 0x70, 0xAE, 0x02, 
      0xF8, 0x5B, 0xE2, 0x72, 0x08, 0x09,0x6F, 0xBF, 0x4B, 0x39, 0xB5, 0xD0, 0x1E, 0xA3, 0x23, 0xAB, 
      0x9B, 0x43, 0xB1, 0x15, 0xD7, 0xBE]
    
    table = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"
    
    
    # base64解码后
    flag = [0x8a,0x07,0x72,0x76,0x8d,0x7d,0x4d,0x51,0x35,0xde,0x88,0x16,0xd4,0x04,0xf9,
    0x0e,0x08,0xcf,0xcc,0x7c,0x0f,0x0d,0x09,0x5e,0xd5,0x7e,0xe4,0x4b,0xc4,0xf3,0x1c,0xaf,
    0x12,0xe4,0xa0,0xae,0xf6,0x69,0xc9,0xd2,0xe0,0xa7,0x01,0x0e,0x1a,0x57,0x70,0x92,0x61,
    0x49,0x7a,0x43,0x27,0x29,0x89,0xb5,0x92,0x2e,0x6a,0xa6,0xdb,0x2f,0xc6,0xa9,0x6e,0x8f,
    0x34,0x90,0x59,0xfc,0x2d,0x91,0x66,0xeb,0xbe,0x0d,0xf4,0x05,0x0b,0x1b,0xcb,0x18,0x74,
    0xf9,0x82,0x81,0xbc,0x04,0xd9,0x75,0x8e,0x2d,0x97,0x07,0x7c,0x7d,0x18,0xc8,0x3d,0x4f,0xc0,0xa5,0x6a,0xd7]
    
    flag_1 = []
    
    # key异或
    for i in range(len(flag)):
        flag_1.append((flag[i] ^ key[i%len(key)]))
    print(flag_1)
    print()
    key_1 = [1,1,0,0,-1,-1,-2,-2]
    for i in range(len(flag)):
        print(chr((flag_1[i] ^ 0x33) + key_1[i%8]),end="")
    
    # flag{6e2480b3-4f02-4cf1-9bc0-123b75f9a922}
    

例题2:

题目: [羊城杯 2024]sedRust_happyVm | NSSCTF

  1. 根据输出的字符串快速定位到关键函数:

    image-20241013204747456

  2. 先给flag在内存打上硬件断点:

    image-20241013205152963

    F9块定位到访问flag的位置,开始会停在这里:

    image-20241013205451817

    分析汇编,多次尝试输入flag,以及根据下面对flag的检查,可以初步判断下面这部分程序的作用值检查flag是否合法,flag的头是否为 "DSACTF" 还有flag的长度是否为0x28

    image-20241013210611062

    image-20241013210708477

    输入 DASCTF{aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa} 即可绕过这部分检查,继续给flag多上几个断点:

    image-20241013211411015

    继续F9 运行断在这里:

    image-20241013211635001

    分析汇编、结合内存,可以看到这里将flag的{}中的内容取出 换到了另外一个内存空间,原来的flag空间被释放掉,给新的内粗上断点:

    image-20241013211757795

    F9后程序停在这里,:

    image-20241013211931212

    分析汇编、观察内存后不难发现这是一个base64编码(没有编码表),下面这段程序就是做类似的base64编码,3个字符一组 8 * 3 = 6 * 4 :

    image-20241013212040496

    在另外一个内存空间存放base64编码的结果,仍然在这里下断点:

    image-20241013212232187

    程序后续停在这里:

    image-20241013212400781

  3. 看这里的整体框架不难发现应该是又对base64编码后的flag(base_flag)开始了加密处理 (下面每一个小框框都是类似的处理流程),后续对vm虚拟机位置的部分开始分析:

    image-20241013212440485

    根据断点位置,观察他是如何拿出base_flag的数据,放在了哪里。分析汇编观察寄存器的变化,不难发现他将base_flag两个一组取出,随后移位、相加、与,最后将取出的base_flag数据 与 程序本身的常数 0x0B1000018结合在一起,传入了vmp函数 进行加密:

    image-20241013212615799

    仔细观察汇编、以及寄存器,不难发现vmp函数是没有任何返回值,那最后要如何判定flag是正确与否呢。

  4. 这里先快速定位到输出flag 正确的位置:

    image-20241013213011486

    可以看到上面只有唯一一个位置能跳转到这里,暂时找过去观察。可以看到这里在最后一次加密后将一个内存区域与 0 做比较,如果为0则跳转到上面位置 输出You Get FLAG!

    image-20241013213103977

    所以在vmp函数中,应该是存在比较工作,在比较后会根据flag的正确与否来设置 内存区域[rsp+0C88h+check]的值,

    而且在所以vmp函数处理完成后,只有这一个位置对改内存区域进行了比较。所以前面任意一次vmp函数,对base_flag数据处理的结果都会影响改内存区域(他是唯一判断flag正确的条件)。

  5. 先看一眼vmp函数,根本一眼看不到头,狗都不看:

    image-20241013213812549

    这里根据上面的内存区域来反推,定位到在vmp函数中 flag正确与否的判断位置

    先给内存下一个硬件断点:

    image-20241013214018447

    F9快速定位到修改该内存的空间:
    image-20241013214148732

    可以发现在这里唯一修改了 该内存空间,修改的 条件是a1[1048]为1

    image-20241013214249109

    在看一下哪里影响了 a1[1048] 的值,上面对a1的交叉引用可以看到只有这两个位置修改了a1[1048],一个加法操作,一个异或操作:

    image-20241013214435939

    所以这两个位置是判断 flag释放正确的关键,该处下断点 (别的位置是否有修改这该处内存区域的值,可以用硬件断点如何完全调试一遍vmp函数即可):

    image-20241013214702268

  6. 从新回去找进入vmp函数时 传入的base_flag数据,毕竟vmp函数可能要对base_flag进行加密:

    在进入vmp前,将base_flag 和 程序自带的立即数0xB1000018 一起放在了rdx寄存器中:

    image-20241013215109595

    步入vmp函数,观察第一次rdx寄存器被访问的位置(有可能base_flag数据会被转移、或者加密):

    这里可以看到将edx的数据置入了一片内存区域中:

    image-20241013215311618

    给该处打上硬件断点(注意第二、三个值才是base_flag中取出的,第一个0x18是程序的立即数),后续edx寄存器的值被修改,就只有该内存区域存在base_flag数据

    image-20241013220753108

    F9后断在这里(这里会在上面加法操作的位置停下,直接步过不用管,因为没对flag进行加密),将base_flag数据取出 给到 eax 和 ecx,然后置入内存空间:

    image-20241013220143568

    image-20241013220647346

    上面下断点,F9,这里将另外一个base_flag数据取出,置入内存中:

    image-20241013220813093

    继续F9,断在这里,虽然改掉了base_flag但这里并不是加密,或者判断flag是否正确:

    image-20241013221132246

    继续F9,断在这里:

    image-20241013221318939

    再F9,会断再之前那个加法位置,观察此时的寄存器和内存,都没有base_flag的参数,所以直接步过:

    image-20241014104308751

    继续F9,直到触发硬件断点(访问到了base_flag数据)。在这里访问到了这前置入内存的base_flag数据,并转移到了另外一个内存空间中,并将原来的数据清空:

    image-20241014104508129

    image-20241014104737096

    给转移的base_flag数据在内存上下断点,继续F9,再次断在加法操作位置,这里内存和寄存器上的值都不是base_flag数据,所以直接跳过:

    image-20241014104845454

    继续F9,这里将转移的base_flag数据取出,转移到另外一片内存中,继续下断点:

    image-20241014104934889

    image-20241014105028186

    F9,断在异或操作的位置,观察对应内存和寄存器上的值,此时寄存器eax在再次转移的内存上取出了base_flag数据,并与另外一个内存上的数据进行异或,所以这力可能是对base_flag的一次加密、或者比较

    image-20241014105128218

    image-20241014105347338

    此时的异或值为0,而base_flag数据为0x18,明显不想等,异或出来的结果肯定不为0,所以如果这个是比较操作的话,后续肯定会根据异或的结果(非0),来修改最终判定条件,观察异或完后的操作是否对最终判定条件 进行了修改,单步发现在异或结束后,直接退出了该函数,返回到了vmp,所以上面的异或操作是对flag的一次加密 ,加密结果放在了内存中。打上断点:

    image-20241014105755786

    F9,再次断在了异或操作上,继续用上次的方法来判定该次异或是否为比较操作,这次异或 ==> 取出了原先放入的base_flag数据,并与上次异或后的值再次异或:

    image-20241014105851938

    该次异或完成后断在了要修改判定条件的位置 ,说明上次异或操作时一个比较 ==> 第一次异或后加密的值 与 内存上的值比较,两者相等才符合条件:

    image-20241014110140860

    这里可以提取出第一次异或时内存上的数据,和第二次异或时al寄存器上的数据,两则异或来还原出第一个base_flag。

    两外,这位两个位置的断点,有时候ida会设置为Unresolved 也就是未解析的状态,这里的原因不清楚,即使在异或函数中从新打上断点,只有再运行一个汇编代码,该断点就又会变成Unresolved。这就只能再程序的断点处观察内存和寄存器的值了:

    image-20241014112033223

    第二个base_flag数据处理,继续F9:

    image-20241014113456862

    F9后再次断在异或位置,这里寄存器al上是base_flag数据,内存[rsi+418h]上是与之异或的值,异或加密完成后退出该异或函数:

    image-20241014113535217

    F9,再次停在异或位置,这次是内存上是上次异或的值 al寄存器上是与之比较的值 ,:

    image-20241014113654101

    异或完成后,判定结果是否为0,来修改最总的判定条件:

    image-20241014113933642

  7. 综上vmp对base_flag数据的处理 ==> 一次传入两个base_flag数据,分别安排值与之异或加密 、然后异或一个正确的值根据结果是否为0 来修改最终的判定条件,进而完成比较操作,两个异或的数组都能从内存、或者寄存器上提取出来。经过多次vmp函数将所以base_flag数据处理完成,最后查看最终的判定条件 == 0。

    要验证异或的值与flag是否有关,可以每次输入不同的flag,来比较每次的异或值是否相同。

  8. 最后提取出来的这两组异或值,相互异或还原base_flag,再对base_flag解码,还原出输入的flag:

    xor_key = [0,0x82,0x11,0x92,0xa8,0x39,0x82,0x28,0x9a,0x61,0x58,0x8B,0xa2,0x43,0x68,0x89,0x04,0x8F,0xB0,0x43,0x49,0x3A,0x18,0x39,0x72,0x0C,0xBA,0x76,0x98,0x13,0x8B,0x46,0x33,0x2B,0x25,0xA2,0x8B,0x27,0xB7,0x61,0x7C,0x3F,0x58,0x56]
    res =  [0x18,0xb1,0x09,0xA4,0xa6,0x2a,0x9e,0x1B,0x96,0x57,0x5d,0xAD,0xAE,0x75,0x65,0xAC,0x09,0x8C,0xA0,0x76,0x47,0x2C,0x10,0x01,0x7C,0x0F,0xBA,0x47,0x95,0x30,0x9B,0x74,0x3F,0x2D,0x2D,0x9A,0x87,0x31,0xBA,0x43,0x70,0x2C,0x4C,0x56]
    base = []
    for i in range(len(res)):
      base.append( xor_key[i] ^ res[i] )
    print(base)
    
    # 类似base解码 6bit ==> 8bit
    tmp = ""
    for i in range(len(base)):
      tmp += "{:0>6}".format(bin(base[i])[2:])
    print(len(tmp))
    
    for i in range(0,len(tmp),8):
      print(chr(int(tmp[i:i+8],2)),end="")
    # DASCTF{c669733af3ce4459b88016420b81cb15}
    

    image-20241014114701169

标签:逆向,加密,异或,flag,base,内存,初探,断点,rust
From: https://blog.csdn.net/yjh_fnu_ltn/article/details/143787659

相关文章

  • Rust 如何处理高并发场景?(Rust高并发、Rust并发问题)(Rust Arc、Rust Mutex、Rust RwLock
    Rust如何处理高并发场景Rust的设计原则注重内存安全与并发的平衡,在提供高性能的同时,确保程序的安全性。在并发编程中,Rust提供了多种工具和库,特别是通过所有权、线程安全的类型、异步编程模型和并发原语等方式,解决了高并发场景中的一些难题。1.所有权系统与并发的......
  • postgresql逆向工程
    packagestanfordcorenlp.wang.biao.diy;importcom.baomidou.mybatisplus.annotation.FieldFill;importcom.baomidou.mybatisplus.generator.FastAutoGenerator;importcom.baomidou.mybatisplus.generator.config.DataSourceConfig;importcom.baomidou.mybatisplus.g......
  • Rust和C++在游戏开发过程中会有怎样的区别,快来看看吧,有具体案例哦!!!
    Rust作为一种系统级编程语言,以其性能、安全性和并发处理能力著称,在游戏开发中找到了越来越多的应用场景。首先说一下Rust在游戏开发的场景应用有哪些以下是Rust在游戏开发中的几个主要应用方向:1.游戏引擎开发Amethyst:这是一个完全用Rust编写的游戏引擎,专注于易用性......
  • Rust ?(Rust错误传播运算符?)(用于简化错误处理,自动将错误从函数中返回)(可恢复错误Result<T
    文章目录Rust错误传播运算符:深入理解与应用1.错误处理的基础1.1`Result`枚举1.2`Option`枚举2.错误传播运算符(`?`)2.1基本语法2.2工作原理1.检查返回值2.提取`Ok`值2.3错误传播示例3.错误传播与自定义错误类型(没仔细看)3.1定义自定义错误类型3.2自定义......
  • Rust泛型系统类型推导原理(Rust类型推导、泛型类型推导、泛型推导)为什么在某些情况必须
    文章目录示例代码疑问:代码不是能知道我要打印的是`&[i32]`吗?为啥非得要我加了`:std::fmt::Debug`它才能编译通过?答1.**Rust泛型系统的类型推导**2.**为什么要加`T:std::fmt::Debug`**3.**编译器如何处理泛型和trait约束**4.**Rust为什么需要这种明确的约束**5......
  • rust学习九.1-集合之向量
    一、纲要 定义 1.new  Vec::new(); 2.采用宏 vec![1,2,3]; 操作 0.读取  索引语法或者get方法,注意索引从0开始.vec[0]或者vec.get(0)          vec[i]不会改变所有权,但如果发生越界,则会导致程序终止          get(i)返回......
  • C++ 逆向之常用字符集互转
    在过往的编程过程中,常常会因为碰到字符集问题而头痛,而每次在进行字符集转换的时候,各种搜索网上文档,想找字符集转换的示例程序,但是都不尽人意,本篇文章的目的就是彻底解决之前编程过程中对字符集认识以及字符集转换之间似懂非懂、云里雾里的状态,并在文章结尾附上ANSI、UNICODE和U......
  • rust学习八、包和模块
    总体上,也没有什么特别的地方,和其它语言比较起来。我们可以看懂熟悉的字眼:包括、模块、use、公共等等如果是英文,则需要知道crate、pub。本章节对应相关书籍的第七章节.一、一个rust可执行程序的大体结构就本章节而言,尚未接触到一个非常复杂的工程结构,据说有什么工作空间。不......
  • Rust 在 Android 的编程实践——技术驱动的车云一体化解决方案探索
    Greptime车云一体化解决方案颠覆了从前传统的车云协同模式,采用更加低成本、高效率的方案来满足当前的市场需求。其中GreptimeDBEdge作为核心组件,专为车机环境量身打造。本文旨在详尽探讨在Android平台利用Rust语言进行开发过程中所积累的经验和教训。交叉编译在车机场景......
  • Rust枚举之卧龙凤雏(Rust Option枚举、Rust Result枚举)(Rust Enum、Some(T)、Ok(T)、Err
    文章目录Rust枚举之卧龙凤雏枚举的基本概念枚举定义示例Result枚举:凤雏Result枚举的定义Result的使用场景示例1:文件读取示例2:链式操作与错误处理Option枚举:卧龙Option枚举的定义Option的使用场景示例1:从字符串解析数字示例2:链式操作总结Rust枚举之......