引用格式:严彦胜,李京. 基于深度强化学习的以太坊 MEV 交易防护与交易排序优化[J].网络安全与数据治理,2025,44(7):20-26.
引言
随着区块链技术的广泛应用,尤其是以太坊在去中心化金融(DeFi)领域的快速发展,最大可提取价值(Maximal Extractable Value,MEV)交易问题逐渐成为影响网络公平性、安全性和效率的重要挑战[1]。MEV 由矿工或排序者通过操控交易顺序获得额外利润,表现形式包括前置攻击(FrontRunning)、三明治攻击(Sandwich Attack)等[2]。这些交易模式不仅对普通用户造成经济损失,还推高整体交易成本,加剧网络拥堵,破坏区块链生态的稳定性与公正性[3]。
MEV的产生主要源于区块链交易顺序的可操控性、交易信息的公开性、Gas竞价机制以及DeFi交易的复杂性。现有的交易排序方法主要包括先来先服务(FIFO)排序和Gas竞价排序。FIFO排序虽然具有较高的公平性,但缺乏Gas费用优化,无法有效防范MEV交易[4]。Gas竞价排序根据交易支付的Gas费用决定执行顺序,导致Gas竞价竞争加剧,使得MEV交易通过支付高额Gas费用获得优先执行权,从而进一步破坏交易公平性[5]。
与现有采用启发式排序策略或基于静态规则的排序机制相比,本文方法引入强化学习框架,具有更强的自适应能力,能够在不同交易负载和攻击场景下动态调整排序策略。同时,相较于现有基于强化学习的研究[6-8]主要聚焦于合约交互或交易分类问题,本文首次将深度Q网络(Deep QNetwork,DQN)应用于交易排序优化,并构建专门的状态-动作空间及奖励函数,直接面向 MEV 抑制目标进行学习。
本文的主要贡献如下:
(1)提出基于 DQN 的交易排序优化方法,动态调整交易执行顺序,以降低 MEV 交易的影响,提高交易公平性。
(2)优化 Gas 费用,通过强化学习减少 Gas 竞价排序带来的交易成本膨胀问题。
(3)构建完整的实验框架,在Geth (Go-Ethereum)本地私有链环境下复现真实交易处理流程,并结合 Flashbots MEV-Explore 数据集进行实验验证。
实验结果表明,所提出的 DQN 排序策略相比传统方法将 MEV 提取率降低至 13% 以下,平均 Gas 费用较基准策略降低约 33.1%,并显著提升低 Gas 交易的执行公平性,公平性指数达到 0.78,远高于传统策略。
本文详细内容请下载:
//www.51qz.net/resource/share/2000006610
作者信息:
严彦胜,李京
(中国科学技术大学计算机科学与技术学院,安徽合肥230026)

