首页 > 其他分享 >10. 从零用Rust编写正反向代理, HTTP内网穿透支持修改头信息

10. 从零用Rust编写正反向代理, HTTP内网穿透支持修改头信息

时间:2023-12-04 10:02:15浏览次数:32  
标签:10 HTTP sender mut value map let 内网

wmproxy

wmproxy是由Rust编写,已实现http/https代理,socks5代理, 反向代理,静态文件服务器,内网穿透,配置热更新等, 后续将实现websocket代理等,同时会将实现过程分享出来, 感兴趣的可以一起造个轮子法

项目 ++wmproxy++

gite: https://gitee.com/tickbh/wmproxy

github: https://github.com/tickbh/wmproxy

修改header参数

但凡代理之类,基本上都有修改头参数的需求,就比如要获取客户端的真实IP,需要写入x-forward-for表示客户端的真实IP,要不然经过转发后的HTTP无法获取真实的客户端地址。

所以需要在转发的同时能进行处理头部信息的相关参数。故内网端不能仅做流量转发。而且客户端可能直接以纯HTTP2的协议请求内网的数据,所以同时需要支持HTTP/1.1及HTTP2,由于以上需求,我们把之前的简单的转发逻辑改成以服务端接收客户端请求的模式对数据进行重加工。

新流程如下

以下是数据从外网进入到内网服务器的加工流程

10. 从零用Rust编写正反向代理, HTTP内网穿透支持修改头信息_客户端


以下是内网服务器返回数据给外网客户端的流程

10. 从零用Rust编写正反向代理, HTTP内网穿透支持修改头信息_HTTP_02

转发中的注意事项

我们可以获取完整的Request再进行请求吗?

如果我们这么操作,当数据包非常的大的时候例如1G,我们此时在内存中将有完整的1G内存,那么此时只需有数个同一类的请求,将会耗尽我们的内存,所以我们必须不能这么处理。

超大文件下载的转发

超大文件必须将得到的数据及时的转发给客户端,此时在内存中的值才不至于太大,又能及时的传输给客户端,要不然可能大文件下载到中转服务器的时间内客户端得不到任何数据就会空耗掉这时间。

http/1.1中的chunked的处理

因为http/1.1的chunked协议,由RFC 2616定义,

分块编码(Transfer-Encoding: chunked)是超文本传输协议(HTTP)中的一种数据传输机制,允许HTTP由网页服务器发送给客户端的数据可以分成多个部分。分块传输编码只在HTTP协议1.1版本(HTTP/1.1)中提供,如果头部中有该选项,则代表数据包是chunked格式。 数据分解成一系列数据块,并以一个或多个块发送,这样服务器可以发送数据而不需要预先知道发送内容的总大小。

比如我们常看到的

for data in res.chunk() {
}

就是表示的是数据分段接收,对于大数据这个尤为重要。

此种报文的示例 这时,报文中的实体需要改为用一系列分块来传输。 每个分块包含十六进制的长度值和数据,长度值独占一行,长度不包括它结尾的 CRLF(\r\n),也不包括分块数据结尾的 CRLF。 最后一个分块长度值必须为 0,对应的分块数据没有内容,表示实体结束。 例:

HTTP/1.1 200 OK
Content-Type: text/plain
Transfer-Encoding: chunked

a\r\n
01234567890\r\n
1e\r\n
wmproxy is very good nat tool\r\n
0\r\n
\r\n

此种报文中我们必须进行解析,因为客户端可能是keep-alive选项,可以连续进行多发。所以收到的Request和Response都是连续的。必须知道何处结束才能继续解析下一个Request/Response。http2不需要,因为http2自带的data分包机制就有这些数据的处理

header数据的定义

  • header的修改分为两部分,一部分是对请求Request的重写,另一部分是对返回Response的重写。所以我们必须同时支持这两种,且将其区分出来。每条header信息我们将定定义一个可变长的数组,如第一个字符为proxy则表示对Request修改。
  • 关于修改的动作有
  1. 添加,如x-forward-for需要末尾添加,我们用操作符+,比如[proxy, +, x-forward-for, $client_ip]
  2. 删除,我们用操作符+,如[-, hidden]
  3. 设置,设置我们默认不做任何参数,直接以header_name开头,如[custom-key, custom-value]
  4. 默认值,有些值有了参数我们就不将其重写,如果没有我们则设为默认值,我们用操作符?,如[?, server, wmproxy]

所以我们client.yaml的配置新增至如下:

# 连接服务端地址
server: 127.0.0.1:8091
# 连接服务端是否加密
ts: true

# 内网映射配置的数组
mappings:
  #将localhost的域名转发到本地的127.0.0.1:8080
  - name: web
    mode: http
    local_addr: 127.0.0.1:8080
    domain: localhost
    headers:
      - [proxy, +, x-forward-for, $client_ip]
      - [-, hidden]
      - [custom-key, custom-value]
      - [?, server, wmproxy]

mappings的结构修改

pub struct MappingConfig {
    pub name: String,
    pub mode: String,
    pub local_addr: Option<SocketAddr>,
    #[serde(default = "default_domain")]
    pub domain: String,
    #[serde(default = "default_header")]
    pub headers: Vec<Vec<String>>,
}

我们把headers定义成一个动态的数组。根据不同的类型做不同的数据,因为长度有变化所以做不定长参数。 以下是代码解析

pub fn parse<T: Buf>(header: ProtFrameHeader, mut buf: T) -> ProxyResult<ProtMapping> {
    must_have!(buf, 2)?;
    let len = buf.get_u16() as usize;
    let mut mappings = vec![];
    
    for _ in 0..len {
        let name = read_short_string(&mut buf)?;
        let mode = read_short_string(&mut buf)?;
        let domain = read_short_string(&mut buf)?;
        let mut headers = vec![];
        must_have!(buf, 2)?;
        let len = buf.get_u16();
        for _ in 0 .. len {
            let mut header = vec![];
            must_have!(buf, 1)?;
            let sub_len = buf.get_u8();
            for _ in 0..sub_len {
                header.push(read_short_string(&mut buf)?);
            }
            headers.push(header);
        }
        mappings.push(MappingConfig::new(name, mode, domain, headers));
    }
    Ok(ProtMapping {
        sock_map: header.sock_map(),
        mappings,
    })
}

如此解析成一个完整的对应域名的结构,因为服务端用不到local_addr所以不做传输。

核心代码的实现

核心处理代码在trans/http.rs下,外部传入一个可读可写的stream,可能是TcpStream也可能是TlsStream<TcpStream>或者其它,同时把接收的SocketAddr传入,以方便后续获取$client_ip的头文件信息。

预处理

pub async fn process<T>(self, inbound: T, addr: SocketAddr) -> Result<(), ProxyError<T>>
where
    T: AsyncRead + AsyncWrite + Unpin + Debug,
{
    println!("new process {:?}", inbound);
    let build = Client::builder();
    let (virtual_sender, virtual_receiver) = channel::<ProtFrame>(10);
    let stream = VirtualStream::new(self.sock_map, self.sender.clone(), virtual_receiver);
    let mut client = Client::new(build.value().ok().unwrap(), stream);
    let (receiver, sender) = client.split().unwrap();
    let oper = HttpOper {
        receiver,
        sender,
        sender_work: self.sender_work.clone(),
        virtual_sender: Some(virtual_sender),
        sock_map: self.sock_map,
        mappings: self.mappings.clone(),
        http_map: None,
    };
    let mut server = Server::new(inbound, Some(addr), oper);
    tokio::spawn( async move {
        let _ = client.wait_operate().await;
    });
    let _ret = server.incoming(Self::operate).await;
    if _ret.is_err() {
        println!("ret = {:?}", _ret);
    }
    Ok(())
}

此时我们创建一个虚拟的Stream来做双边互传,但是此时我们还没有收到任何的Request请求,我们并不知道当前的Host,此时我们还未发送ProtCreate,等真正处理请求的时候做处理,HttpOper是处理每个操作时均会带的参数,我们可以根据自己需要带上该参数。

后续处理,其中我们读和写都用RecvStream,做到读多少数据转发多少数据,以保证数据处理的及时性

async fn inner_operate(
    mut req: Request<RecvStream>,
    data: Arc<Mutex<HttpOper>>,
) -> ProtResult<Option<Response<RecvStream>>> {
    println!("receiver req = {:?}", req.url());
    let mut value = data.lock().await;
    let sender = value.virtual_sender.take();
    // 传在该参数则为第一次, 第一次的时候发送Create创建绑定连接
    if sender.is_some() {
        let host_name = req.get_host().unwrap_or(String::new());
        // 取得相关的host数据,对内网的映射端做匹配,如果未匹配到返回错误,表示不支持
        {
            let mut config = None;
            let mut is_find = false;
            {
                let read = value.mappings.read().await;
                for v in &*read {
                    if v.domain == host_name {
                        is_find = true;
                        config = Some(v.clone());
                    }
                }
            }
            if !is_find {
                return Ok(Some(Response::builder().status(404).body("not found").ok().unwrap().into_type()));
            }
            value.http_map = config;
        }

        println!("do create prot {}, host = {:?}", value.sock_map, req.get_host());

        let create = ProtCreate::new(value.sock_map, Some(req.get_host().unwrap_or(String::new())));
        let _ = value.sender_work.send((create, sender.unwrap())).await;
    }

    if let Some(config) = &value.http_map {
        // 复写Request的头文件信息
        HeaderHelper::rewrite_request(&mut req, &config.headers);
    }

    // 将请求发送出去
    value.sender.send(req).await?;
    // 等待返回数据的到来
    let mut res = value.receiver.recv().await;
    if res.is_some() {
        if let Some(config) = &value.http_map {
            // 复写Response的头文件信息
            HeaderHelper::rewrite_response(res.as_mut().unwrap(), &config.headers);
        }
        return Ok(res);
    } else {
        return Ok(Some(Response::builder().status(503).body("cant trans").ok().unwrap().into_type()));
    }
}

以下是直接HTTP/1.1的请求示例

10. 从零用Rust编写正反向代理, HTTP内网穿透支持修改头信息_数据_03

以下是直接HTTP/1.1升级成HTTP2的请求示例

10. 从零用Rust编写正反向代理, HTTP内网穿透支持修改头信息_数据_04

以下是直接HTTP2的请求示例

10. 从零用Rust编写正反向代理, HTTP内网穿透支持修改头信息_数据_05

请求的返回结果均带上了添加的头部信息,测试正常,至此HTTP的内网穿透数据打通。

标签:10,HTTP,sender,mut,value,map,let,内网
From: https://blog.51cto.com/u_16321542/8673513

相关文章

  • 记Redux下载后,运行examples/todos时,报错Error: error:0308010C:digital envelope rout
    1、Redux下载下载地址gitclonehttps://github.com/reactjs/redux.git进入examples/todos,下载依赖:npminstall2、问题复现及解决执行命令npmrunstart此时终端报错:Error:error:0308010C:digitalenveloperoutines::unsupported解决方法:打开package.json,修改......
  • 20211105李宜时信息安全系统设计与实现学习笔记12
    20211105李宜时信息安全系统设计与实现学习笔记121.引言背景介绍:介绍MySQL数据库及其在业界的普及和应用,解释为何在Linux环境下学习MySQL是重要的。学习目标:明确学习MySQL的目标,比如理解数据库原理,掌握基本操作,或者成为数据库管理员。2.安装和配置安装步骤:详细描述在不......
  • 2023-2024-1 20231325 《计算机基础与程序设计》第10周学习总结
    ###目录*作业信息*教材学习内容总结1.《计算机科学概论》第12,13,14章2.《c语言程序设计》第9章*基于AI的学习*学习心得*学习进度条作业信息这个作业属于哪个课程2023-2024-1《计算机基础与程序设计》这个作业的要求在哪里1.学习《计算机科学概论》第12......
  • 2023-2024-1 学号:20231305 《计算机基础与程序设计》第10周学习总结
    2023-2024-1学号:20231305《计算机基础与程序设计》第10周学习总结作业信息这个作业属于哪个课程<班级的链接>(如2022-2023-1-计算机基础与程序设计)这个作业要求在哪里<作业要求的链接>(如2022-2023-1计算机基础与程序设计第一周作业)这个作业的目标<自学教材计......
  • 2023-2024-1 20231418 《计算机基础与程序设计》第10周学习总结
    2023-2024-120231418《计算机基础与程序设计》第10周学习总结作业信息这个作业属于哪个课程2023-2024-1-计算机基础与程序设计这个作业要求在哪里2022-2023-1计算机基础与程序设计第十周作业这个作业的目标计算机科学概论第12,13,14章《C语言程序设计》第9章作业......
  • 第10次-创建一个在线网站
    第10次-创建一个在线网站这个作业属于哪个课程https://edu.cnblogs.com/campus/uzz/cs3这个作业要求在哪里https://edu.cnblogs.com/campus/uzz/cs3/homework/13118这个作业的目标创建一个在线网站我的在线网站链接(公网):http://43.139.173.201/......
  • 初中英语优秀范文100篇-016An unforgettable Trip-一次难忘的旅行
    PDF格式公众号回复关键字:SHCZFW016记忆树1Lastyear,Iwenttomyfavoritecity,Beijing.翻译去年,我去了我最喜欢的城市,北京简化记忆城市句子结构这个句子可以分析为一个复合句,由主句和从句构成。主句是“Iwenttomyfavoritecity,Beijing”,主语是“I”......
  • Http 状态码 301 和 302 的应用场景
    301表示永久重定向,302表示临时重定向。如果浏览器收到的是301,则会缓存重定向的地址,之后不会再重新请求服务器,直接使用缓存的地址请求,这样可以减少请求次数。但如果浏览器收到的是302,则不会缓存重定向地址,浏览器将来会继续以原有地址请求。因此,301适合地址永久转移的场景,比如域......
  • [LeetCode Hot 100] LeetCode1. 两数之和
    题目描述思路:如果哈希表存在target-nums[i],则返回索引下标i和对应的key值(可以按任意顺序返回答案)如果哈希表中不存在target-nums[i],则存入nums[i]和对应的索引值方法一:哈希表classSolution{publicint[]twoSum(int[]nums,inttarget){//1.存放......
  • P1004 [NOIP2000 提高组] 方格取数 题解
    题意:思路:考虑四维$dp$:设$dp[i][j][k][l]$表示两条路径分别走到$(i,j)$和$(k,l)$时所能获取的最大和,显然会超时。考虑三维$dp$:设$dp[i][j][k]$表示两条路径走了$i$步分别走到第$j$行和第$k$行时所能获取的最大和,通过当前步数$i$以及当......