视觉-语言-动作 · X Square Robot WALL-WM:按事件边界切分的世界动作模型 WALL-WM 把 VLA 预训练围绕语义动作事件组织,而非定长动作块。事件模式在真机多样化操作上拿到 75.86 任务进度分,pi0.5 是 55.64。