Scapy项目中TCPSession解析HTTP流的问题分析

2025-05-20 14:58:39作者：牧宁李

问题背景

在网络安全分析工作中，我们经常需要解析网络数据包中的HTTP流量。Scapy作为一款强大的Python网络数据包处理工具，提供了TCPSession功能来重组TCP流，并支持HTTP协议解析。但在实际使用中，用户可能会遇到TCPSession无法正确解析HTTP响应的问题。

问题现象

用户尝试使用Scapy解析一个包含SQL注入流量的pcap文件时，发现虽然Wireshark能够正确显示HTTP响应内容，但使用Scapy的TCPSession功能却无法获得完整的HTTP响应数据。具体表现为：

在Wireshark中通过"Follow HTTP Stream"可以查看完整的HTTP响应内容
使用Scapy的TCPSession解析后，只能获取到部分响应数据（如"data": []），而无法获取完整的JSON响应

技术分析

TCPSession工作原理

Scapy的TCPSession是一个流重组器，它能够：

根据TCP序列号和确认号重组数据包
处理TCP重传和乱序问题
将分散的TCP分段重组为完整的应用层数据

HTTP解析机制

Scapy对HTTP协议的解析分为两个层面：

TCP流重组：首先TCPSession会将TCP流重组为完整的数据
HTTP协议解析：然后根据端口绑定关系将重组后的数据解析为HTTP协议

问题根源

用户遇到的问题可能有以下几个原因：

端口绑定问题：Scapy默认只绑定80和8080端口为HTTP服务，如果HTTP服务运行在其他端口（如3000），需要手动绑定
解码顺序问题：直接访问Raw层数据可能绕过HTTP协议解析器
流重组不完整：TCPSession可能未能正确重组所有TCP分段

解决方案

针对这个问题，正确的处理方式应该是：

显式绑定HTTP端口：明确告诉Scapy哪个端口承载HTTP流量
使用HTTP层访问数据：而不是直接访问Raw层
完整检查HTTP响应：通过HTTPResponse对象获取状态码和内容

from scapy.all import *
from scapy.layers.http import *

# 绑定特定端口到HTTP协议
bind_bottom_up(TCP, HTTP, dport=3000)  # 目标端口
bind_bottom_up(TCP, HTTP, sport=3000)  # 源端口

# 使用TCPSession重组流
packets = sniff(offline="output.pcap", session=TCPSession)

for packet in packets:
    # 检查HTTP响应且状态码为200
    if HTTPResponse in packet and packet.Status_Code == b"200":
        # 获取响应内容
        traffic_data = packet[Raw].load.decode(errors="ignore")
        print(traffic_data)