SkillAdaptor:让 LLM 智能体自己改写技能库
SkillAdaptor 不动模型权重,只从失败轨迹里改写技能库,WebShop 分数 +2.3、PinchBench +1.5,提升真实但有限。
机构
支付宝背后的中国金融科技公司,研究团队深耕大规模机器学习、可信 AI 与基础模型,并参与合著了 LLaDA 扩散语言模型。
SkillAdaptor 不动模型权重,只从失败轨迹里改写技能库,WebShop 分数 +2.3、PinchBench +1.5,提升真实但有限。
扩散语言模型 · Renmin University of China
LLaDA 用掩码扩散取代下一个词预测,8B 模型在上下文学习上与 LLaMA3 8B 持平,GSM8K 拿 70.7,反向补诗任务还反超 GPT-4o。