论文专题
2026
1
2025
39
- 论文专题讲解:V-JEPA:视频潜变量预测表征
- 论文专题讲解:Towards Video World Models:视频世界模型五个门槛
- 论文专题讲解:Self Forcing:对齐自回归视频训练与推理
- 论文专题讲解:RingAttention:近无限上下文训练
- 论文专题讲解:PlaNet:像素规划的潜变量动力学
- 论文专题讲解:LWM:百万 token 视频语言世界模型
- 论文专题讲解:LingBot-World:视频基础模型到世界模拟器
- 论文专题讲解:JEPA:预测式表征学习路线
- 论文专题讲解:H-JEPA:层级 JEPA 与潜变量 EBM
- 论文专题讲解:Genie:无标注视频到可交互环境
- 论文专题讲解:DreamerV3:跨域通用世界模型
- 论文专题讲解:DreamerV2:离散世界模型玩 Atari
- 论文专题讲解:Dreamer:Latent Imagination 控制
- 论文专题讲解:Qwen3.5-Omni:Thinker-Talker 与全模态 Agent
- 论文专题讲解:Qwen3:Thinking 模式、36T 预训练与蒸馏
- 论文专题讲解:Nemotron 3 Super:Mamba-MoE 与异步多环境 RL
- 论文专题讲解:Kimi K2:MuonClip、万亿 MoE 与 Agent 数据
- 论文专题讲解:GPT-4o System Card:Omni 安全与多模态评测
- 论文专题讲解:Gemini 2.5:动态 Thinking 与长上下文 Agent
- 论文专题讲解:DeepSeek-V4:百万上下文与 FP4 后训练
- 论文专题讲解:DeepSeek-V3:671B MoE、MLA 与 FP8 训练
- 论文专题讲解:DeepSeek-R1:RL 激发推理能力
- 论文专题讲解:SLA / SLA2:DiT 稀疏线性 Attention
- 论文专题讲解:Muon:LLM 预训练优化器
- 论文专题讲解:MagiAttention:超长上下文分布式 Attention
- 论文专题讲解:Attn-QAT:4-bit Attention 量化感知训练
- 论文专题讲解:Video Prediction Policy:预测视觉表征训练机器人策略
- 论文专题讲解:SpatialVLA:3D 空间表征接入 VLA
- 论文专题讲解:π0.5:开放世界 VLA
- 论文专题讲解:GR-3:少样本长时程 VLA
- 论文专题讲解:GR-2:Web 视频知识迁移到机器人
- 论文专题讲解:DreamZero:WAM 零样本策略
- 论文专题讲解:Depth Anything 3:任意视角的 3D 几何底座
- 论文专题讲解:Wan2.1:开源视频生成系统路线
- 论文专题讲解:Phased DMD:分阶段少步蒸馏
- 论文专题讲解:DMD2:更稳的少步分布匹配蒸馏
- 论文专题讲解:DMD:一步扩散蒸馏
- 论文专题讲解:Diffusion Forcing:next-token 与全序列扩散
- 论文专题讲解:CausVid:流式自回归视频扩散
1