扩展验证比扩展策略学习更能有效实现视觉-语言-动作对齐

arXiv: 2602.12281v1

YOR:面向通用机器人的个人移动操作平台

arXiv: 2602.11150v1

扩散预训练的密集与上下文嵌入

arXiv: 2602.11151v1

盲点中的偏见:检测大型语言模型未提及的内容

arXiv: 2602.10117v1

鲁棒性是一种功能,而非数字:基于视觉驾驶中OOD鲁棒性的因子化综合研究

arXiv: 2602.09018v1

量子计算机物理应用高效模拟的混合方法

arXiv: 2602.09020v1

学习大型语言模型激活的生成元模型

arXiv: 2602.06964v1

带四费米子涡旋的电荷-$4e$超导体:通往通用拓扑量子计算的路径

arXiv: 2602.06963v1

PhysicsAgentABM:基于物理引导的生成式智能体建模

arXiv: 2602.06030v1

视觉语言模型能否通过交互学习直观物理?

arXiv: 2602.06033v1

CommCP:基于大语言模型与保形预测的高效多智能体协同通信

arXiv: 2602.06038v1

DyTopo:基于语义匹配的多智能体推理动态拓扑路由

arXiv: 2602.06039v1

伪可逆神经网络

arXiv: 2602.06042v1

共享LoRA子空间实现近乎严格的持续学习

arXiv: 2602.06043v1

蛋白质自回归建模:基于多尺度结构生成的方法

arXiv: 2602.04883v1

强化注意力学习

arXiv: 2602.04884v1

PLATE:面向几何感知持续学习的可塑性可调高效适配器

arXiv: 2602.03846v1

量子霍尔层级结构与任意子超导性的统一范畴描述

arXiv: 2602.03848v1

MEG-XL:通过长上下文预训练实现数据高效型脑到文本转换

arXiv: 2602.02494v1

无奖励对齐:应对冲突目标

arXiv: 2602.02495v1

共享自主范式中信念与策略学习的端到端优化

arXiv: 2601.23285v1

VideoGPA:面向三维一致性视频生成的几何先验蒸馏

arXiv: 2601.23286v1

DynaWeb:基于模型的网页智能体强化学习

arXiv: 2601.22149v1

最新成果:面向边缘计算的神经网络逻辑流转换

arXiv: 2601.22151v1