黑盒策略蒸馏大型语言模型
论文信息 标题: Black-Box On-Policy Distillation of Large Language Models 作者: Tianzhu Ye, Li Dong, Zewen Chi, et al. 发布日期: 2025-11-13 arXiv ID: 2511.10643v1 PDF链接: 下载PDF 黑盒策略蒸馏:让大语言模型学会“偷师”GPT-5 ...
论文信息 标题: Black-Box On-Policy Distillation of Large Language Models 作者: Tianzhu Ye, Li Dong, Zewen Chi, et al. 发布日期: 2025-11-13 arXiv ID: 2511.10643v1 PDF链接: 下载PDF 黑盒策略蒸馏:让大语言模型学会“偷师”GPT-5 ...
论文信息 标题: Ordinary lattice defects as probes of topology 作者: Aiden J. Mains, Jia-Xin Zhong, Yun Jing, et al. 发布日期: 2025-11-13 arXiv ID: 2511.10646v1 PDF链接: 下载PDF 普通晶格缺陷:探索拓扑物态的新窗口 论文背景与研究动机...
论文信息 标题: Right Place, Right Time: Market Simulation-based RL for Execution Optimisation 作者: Ollie Olby, Andreea Bacalum, Rory Baggott, et al. 发布日期: 2025-10-25 arXiv ID: 2510.22206v1 PDF链接: 下载P...
论文信息 标题: Routing Manifold Alignment Improves Generalization of Mixture-of-Experts LLMs 作者: Zhongyang Li, Ziyue Li, Tianyi Zhou 发布日期: 2025-11-10 arXiv ID: 2511.07419v1 PDF链接: 下载PDF 路由流形对齐:提升...
论文信息 标题: TimeSearch-R: Adaptive Temporal Search for Long-Form Video Understanding via Self-Verification Reinforcement Learning 作者: Junwen Pan, Qizhe Zhang, Rui Zhang, et al. 发布日期: 2025-11-07 ar...
论文信息 标题: Quantum Tensor Representation via Circuit Partitioning and Reintegration 作者: Ziqing Guo, Jan Balewski, Kewen Xiao, et al. 发布日期: 2025-11-07 arXiv ID: 2511.05492v1 PDF链接: 下载PDF 量子张量表...
论文信息 标题: Real-to-Sim Robot Policy Evaluation with Gaussian Splatting Simulation of Soft-Body Interactions 作者: Kaifeng Zhang, Shuo Sha, Hanxiao Jiang, et al. 发布日期: 2025-11-06 arXiv ID: 2511.0466...
论文信息 标题: Forgetting is Everywhere 作者: Ben Sanati, Thomas L. Lee, Trevor McInroe, et al. 发布日期: 2025-11-06 arXiv ID: 2511.04666v1 PDF链接: 下载PDF 《遗忘无处不在》:统一理解机器学习中的遗忘现象 论文背景与研究动机 在机器学习领域,一个长期...
论文信息 标题: Multi-Method Analysis of Mathematics Placement Assessments: Classical, Machine Learning, and Clustering Approaches 作者: Julian D. Allagan, Dasia A. Singleton, Shanae N. Perry, et al. 发布日...
论文信息 标题: Quantum Search With Generalized Wildcards 作者: Arjan Cornelissen, Nikhil S. Mande, Subhasree Patro, et al. 发布日期: 2025-11-06 arXiv ID: 2511.04669v1 PDF链接: 下载PDF 量子搜索与广义通配符:突破传统查询复杂度边...