为双子座模型构建生产就绪的探针

arXiv: 2601.11516v1

解释是否适用于大型推理模型?

arXiv: 2601.11517v1

有界延迟、部分参与及噪声通信下的分布式感知机

arXiv: 2601.10705v1

见少行更稳:基于基础模型随机补丁选择的通用端到端自动驾驶

arXiv: 2601.10707v1

高精度无维度扩散采样方法

arXiv: 2601.10708v1

MatchTIR:基于二分匹配的工具集成推理细粒度监督

arXiv: 2601.10712v1

量子LDPC码的麦克斯韦擦除解码器

arXiv: 2601.10713v1

DInf-Grid:基于可微特征网格的神经微分方程求解器

arXiv: 2601.10715v1

面向Transformer语言模型的价值感知数值表示

arXiv: 2601.09706v1

Fast-ThinkAct:基于可言语化潜在规划的高效视觉-语言-行动推理

arXiv: 2601.09708v1

视频生成中的运动归因

arXiv: 2601.08828v1

Elo排名评审系统中LLM智能体评审员动态建模

arXiv: 2601.08829v1

随机微分方程的完全分解

arXiv: 2601.07834v1

AdaFuse:基于测试时缩放的自适应集成解码方法用于大型语言模型

arXiv: 2601.06022v1

浅层图卷积神经网络训练的流形极限

arXiv: 2601.06025v1

通过机器学习和人工智能衡量与促进和平

arXiv: 2601.05232v1

非厄米拓扑物理中本征值何时及为何缺失本征态

arXiv: 2601.05234v1

稳健推理作为对称性保护的拓扑相

arXiv: 2601.05240v1

RoboVIP:基于视觉身份提示增强的多视角视频生成提升机器人操作性能

arXiv: 2601.05241v1

GDPO:面向多奖励强化学习优化的组奖励解耦归一化策略优化

arXiv: 2601.05242v1

在线多重校准的最优下界

arXiv: 2601.05245v1

资源受限机器人平台中的自主智能体嵌入

arXiv: 2601.04191v1

从噪声与不完整数据中进行的自监督学习

arXiv: 2601.03244v1

大正则典型性

arXiv: 2601.03253v1