Lighter遭遇首次重大宕机
专为低成本永续交易设计的以太坊Layer-2平台Lighter在上周遭遇首次重大服务中断,此时距其主网公开上线仅过去10天。在这次近年来最动荡的交易时段之一,该平台宕机近五小时,导致大量用户无法管理仓位。
系统不堪重负
10月10日美东时间22:30至11日03:00期间,Lighter系统遭遇团队所称的"前所未有的负载冲击"。故障根源在于其排序器内的数据库崩溃——这个核心引擎负责处理网络中的所有订单、存款、取款和撤销操作。
在故障发生前的数小时,加密货币市场经历了被交易员形容为"十年来最剧烈波动"的时段。Lighter平台交易量激增至正常水平的10倍,部分区块甚至出现100倍峰值。虽然服务器部署在靠近用户群的云基础设施上,硬件仍无法承受压力,最终导致数据库崩溃,全网瘫痪。
延误的升级计划
工程师团队早在10月1日主网上线前就意识到数据库是薄弱环节。尽管制定了升级方案,但为避免服务中断,升级被多次推迟。团队现在承认这是个决策失误。
当市场剧烈波动来临时,数据库已达性能极限。虽然勉强撑过了最混乱的交易时段,却在几小时后彻底崩溃。"我们执着于寻找完美升级时机,反而错过了极端波动前的窗口期。"事故报告如是写道。
团队指出,正常运营期间的升级仅需10-15分钟,但一旦系统失稳,恢复时间将难以预测。
通宵抢修
宕机发生后,工程师决定不在系统不稳定时贸然升级,转而全力修复现有数据库。经过周五整夜的抢修,平台于美东时间凌晨3点恢复运行,报价与风控系统同步上线。
在重启交易前,技术团队核查了所有异常订单与强平记录。整个宕机期间,客服团队始终通过社交平台保持沟通,协助无法操作仓位的用户。
所幸市场此时已趋于平静,潜在损失规模得以控制。
用户赔偿方案
Lighter承认此次事故源于内部失误,并公布赔偿计划。数据科学团队正在分析交易记录,以确认在宕机窗口期遭受损失或强平的用户。
初步统计显示:
• 2,008名用户损失超1,000美元
• 367名用户损失超10,000美元
• 38名用户损失超100,000美元
• 30名用户支付了1,000美元以上强平费
团队还将评估平台响应迟缓时段的用户损失。赔偿将以稳定币和平台积分形式发放,最早于下周一开始执行。另有小部分资金将用于补偿早前无关的LLP事件受影响用户,具体报告将另行发布。
基础设施升级
Lighter已确定于美东时间早7点执行拖延已久的基础设施升级,预计停机10-15分钟。团队表示已深刻认识到系统稳定性应优先于完美时机。
"这次教训让工程团队明白:追求完美反而会错失良机。"事故报告针对延误的数据库扩容如此总结。
Layer-2扩展之痛
此次事件暴露出高速增长的Layer-2平台在平衡性能、成本与可靠性时的脆弱性。Lighter采用定制零知识证明电路进行可验证的撮合与清算,自诩为永续交易的下一代解决方案。
但现实市场的压力瞬间击穿了扩容假设。对于以高速低成本为卖点的平台,这次宕机明确警示:可靠性绝不可事后考虑。
如今服务虽已恢复,事件留下深刻启示:真正的扩容不仅要能应对需求高峰,更要在压力来临前做好万全准备。