首页| 资讯| 军事| 汽车| 游戏| 科技| 旅游| 经济| 娱乐| 投资| 文化| 守艺中华| 佛教| 红木| 城市| 韩流| 信息| 简读

当前位置：投资 > 资讯

江行智能DyGRO-VLA破解VLA模型“多任务困境”，点亮物理 AI 电力场景

2026-05-28 20:36:47 来源：财讯网

江行智能DyGRO-VLA破解VLA模型“多任务困境”，点亮物理 AI 电力场景

当机器人学会一个任务后，往往会忘记之前学会的另一个任务——这是多任务学习中长期困扰业界的“灾难性遗忘”难题。如今，江行智能给出了一种全新的解法。

近日，江行智能研究团队在具身智能领域取得重要突破。研究成果 DyGRO-VLA 被国际机器学习顶级会议 ICML 2026 收录。该工作针对视觉-语言-动作（VLA）模型在多任务场景下的性能退化问题，提出了一种创新的两阶段优化框架，在LIBERO多任务操作基准上取得了平均成功率97.1%的优异成绩。

一、一个根本性困境：VLA模型“学得越多，忘得越快”

VLA（Vision-Language-Action）模型被视为通用机器人的核心范式。它将视觉感知、语言理解与动作控制统一到一个端到端模型中，让机器人能够直接理解自然语言指令并自主执行复杂操作。

然而，一个长期困扰业界的难题是：当VLA模型从单一任务扩展到多任务时，性能会急剧下降。

传统强化学习（RL）优化器在单任务上表现优异，但在多任务场景下，不同任务的梯度会相互冲突，导致模型“顾此失彼”——学会了一个新任务，却忘记了之前掌握的能力。这种现象被称为灾难性遗忘。

江行智能研究团队的深入分析发现，这种失败模式的根源在于：RL优化器会扭曲预训练阶段学到的共享表征，使得不同任务的经验被孤立，跨任务知识共享能力大幅削弱。因此，如何在控制精度与跨任务泛化之间取得平衡，成为VLA模型走向规模化应用的关键挑战。

二、江行智能物理 AI 技术突破：DyGRO‑VLA 两阶段优化框架

针对上述挑战，江行智能提出了 DyGRO-VLA（Dynamic Grouped Residual Optimization）框架，采用“离线预训练 + 在线微调”的两阶段范式。

第一阶段：信息瓶颈表征学习

在离线预训练阶段，DyGRO-VLA基于信息瓶颈（Information Bottleneck）原理，从海量多模态数据中提取跨任务共享的潜在表征。这些表征只保留对动作预测最关键的信息（如物体空间位置、形态特征），而过滤掉背景、光照等干扰因素。

这一设计的精妙之处在于：通过最大化表征与动作之间的互信息、同时最小化表征与原始观测之间的互信息，模型学会了“抓大放小”——只记住对完成任务真正重要的东西，从而使得不同任务的知识可以被有效复用。

第二阶段：混合残差强化学习（MoRR）

在在线微调阶段，DyGRO-VLA冻结了预训练好的共享表征，并引入混合专家残差策略（Mixture-of-RL-Residuals, MoRR）。

具体而言，MoRR包含三个关键设计：

● 专家池：一组轻量级的残差策略网络，每个专家只专注于优化某一类任务；

● 动态路由网络：根据当前任务的语义特征，智能地选择并组合最合适的专家输出；

● 残差学习机制：每个专家只输出对基础策略的“微调修正”，而非从头学习，从而保留基础模型的通用能力。

这种设计的核心优势在于：既保留了基础模型的通用能力，又实现了对特定任务的精准优化，有效避免了多任务RL优化中的灾难性遗忘问题。

三、实证成果：LIBERO基准测试平均成功率97.1%

DyGRO-VLA在业界公认的LIBERO多任务操作基准测试中进行了全面评估。该基准包含130个任务，覆盖空间泛化、物体泛化、目标操作和长时程任务四大套件。

实验结果表明：

尤其值得关注的是，在最具挑战性的LIBERO-Long长时程任务套件中，DyGRO-VLA的成功率从85.2%跃升至95.0%，提升幅度高达9.8个百分点。这表明该框架在复杂、多步骤的工业级任务中具有显著优势。

在RoboTwin2双机械臂基准测试中，DyGRO-VLA在仿真环境取得79.2% 的最佳综合成功率，并在Sim2Real迁移测试中，在复杂双臂操作任务上全面超越现有基线方法。

四、工业价值落地：江行智能物理 AI 赋能电力场景与智能巡检

DyGRO-VLA所代表的跨任务强化学习框架，为江行智能构建一脑多体的工业智能中枢提供了关键算法基础。

在真实的工业场景中，一个AI系统往往需要同时应对巡检、操作、诊断等多种不同类型的任务。DyGRO-VLA验证了：未来的工业AI系统必须具备跨任务知识复用与高效扩展的能力，才能以可控成本实现规模化部署。

我们交付的不是一个只会做一件事的专用模型，而是一个能够持续学习、不断扩展的通用智能底座。

相关研究：

DyGRO-VLA: Cross-Task Scaling of Vision-Language-Action Models via Dynamic Grouped Residual Optimization. ICML 2026.

江行智能将持续深耕物理AI前沿技术，让AI更好地理解、适应并赋能我们所在的真实世界。

免责声明：市场有风险，选择需谨慎！此文仅供参考，不作买卖依据。

热图精选

三星Galaxy Z Fold8 Wide宽折叠手机机模上手曝光

Steam Deck OLED部分型号售价暴涨300美元关键组件短缺推高成本

索尼电视9系、8系、7系二代发布，可选True RGB真彩原色

告别文字发虚 LG Display量产4K 240Hz显示器OLED面板

小米公布超级电机V8s EVO技术细节不止28000rpm超高转速

LG或出售电视业务近60年电视制造历史将终结

消息称某厂2nm新机测试1亿方形前置摄像头，预计为OPPO旗下

苹果开发“防抢夺锁机”功能被抢走的iPhone将立即自动上锁

苹果Creator Studio订阅版应用升级液态玻璃风格图标

史上最贵苹果手机外观没无悬念了折叠屏iPhone Ultra第三方保护壳亮相

雷鸟发布GT系列AR眼镜：1899元起最大59° 视场角

存储牛市太疯狂！Valve宣布上市两年半的掌上电脑定价暴涨40%

江行智能DyGRO-VLA破解VLA模型“多任务困境”，点亮物理 AI 电力场景

为您推荐：

引领智能安防生态，王力安防荣获福布斯中国《设计领军品牌》大奖

2026年商务英语提升工具出炉！高效练口语的实用软件在这了

职场英语APP哪个好用主流软件可栗口语APP深度实测

厦门实证储能科技研究院启动助力打造“实证型储能”

2026年商务日语口语APP盘点，帮你快速提升职场口语沟通能力

商务日语口语快速提升，热门APP可栗口语实测短时间就能看到进步

2026年商务英语学习工具盘点：高效口语神器，助力职场晋升快人一步

一步到位买高端保鲜冰箱：美的熊墩墩“全食材原鲜”保鲜技术解析

2026高效氨糖软骨素：哪款起效更快？高活性提速养护优选SAFVG 氨糖软骨素

中泰低空经济首次正式会谈圆满举行，鹏城低空引领中国产业出海

热图精选