AI
2026
62
- 世界模型:WM / WAM / VAM:动作条件建模
- 世界模型:不确定性与风险敏感规划
- 世界模型:模拟器、反事实与合成 Rollout
- 世界模型:RSSM、Dreamer 与规划
- 世界模型:规划即推理与潜在动作
- 世界模型:生成式模拟与视频世界模型
- 世界模型:评测与失效模式
- 世界模型:高效训练技术路线图
- 世界模型:开发路线
- 世界模型:数据引擎与自我改进
- 世界模型:机器人与自动驾驶中的世界模型
- 世界模型:动作条件视频世界模型端到端训练案例
- VLM/VLA:世界模型高效训练接口
- VLM/VLA:视觉 Tokenizer、连接器与信息瓶颈
- VLM/VLA:视频表征、状态记忆与长时序压缩
- VLM/VLA:多模态评测与失败模式
- VLM/VLA:架构:视觉表征、连接器与记忆
- VLM/VLA:部署与安全
- VLM/VLA:数据与策略学习
- VLM/VLA:闭环恢复与失败分析
- VLM/VLA:评测与数据引擎
- VLM/VLA:动作表示与控制接口
- VLM/VLA:动作分块、层级策略与潜在技能
- 训练:稳定性与故障排查
- 训练:Scaling Law 与训练经济学
- 训练:Scaling、课程学习与数据配比
- 训练:预训练、微调与对齐
- 训练:偏好数据与对齐失效
- 训练:后训练数据引擎与 Judge 模型
- 训练:论文图解索引
- 训练:目标函数、优化器与 LR 日程
- 训练:MTP 与投机解码
- 训练:Megatron、DeepSpeed 与训练栈
- 训练:低比特训练与数值格式
- 训练:输入管线、Packing 与吞吐
- 训练:图片来源与授权
- 训练:评测与消融设计
- 训练:分布式训练与 Checkpoint
- 训练:数据系统与吞吐优化
- 训练:数据质量、去重与治理
- 训练:集群运维与实验治理
- 思考探索:世界模型现状:从视频模拟到工程闭环
- 思考探索:XR2 Gen 2:端侧 AI 与量化部署
- 思考探索:具身智能现状:VLA、数据工厂与真实闭环
- 路线图:研究与工程学习路径
- 路线图:快速对照表
- 路线图:常见技术决策与取舍
- 强化学习:verl 训练流程:从配置到 RL 更新
- 强化学习:世界模型中的强化学习
- 强化学习:Policy Gradient 到 PPO / GRPO
- 强化学习:MDP、价值函数与 Bellman
- 量化:服务栈与硬件选择
- 量化:运行时与部署框架
- 量化:多模态与 VLA 模型量化
- 量化:QLoRA 与量化训练
- 量化:QAT、Kernel 与 KV Cache
- 量化:PTQ、GPTQ、AWQ 与 SmoothQuant
- 量化:FP8 与混合精度推理
- 量化:评测与部署清单
- 量化:方法对照表
- 量化:激活离群值与校准策略
- 论文专题讲解:Embodied World Model Survey:具身世界模型综述
2025
113
- 论文专题讲解:V-JEPA:视频潜变量预测表征
- 论文专题讲解:Towards Video World Models:视频世界模型五个门槛
- 论文专题讲解:Self Forcing:对齐自回归视频训练与推理
- 论文专题讲解:RingAttention:近无限上下文训练
- 论文专题讲解:PlaNet:像素规划的潜变量动力学
- 论文专题讲解:LWM:百万 token 视频语言世界模型
- 论文专题讲解:LingBot-World:视频基础模型到世界模拟器
- 论文专题讲解:JEPA:预测式表征学习路线
- 论文专题讲解:H-JEPA:层级 JEPA 与潜变量 EBM
- 论文专题讲解:Genie:无标注视频到可交互环境
- 论文专题讲解:DreamerV3:跨域通用世界模型
- 论文专题讲解:DreamerV2:离散世界模型玩 Atari
- 论文专题讲解:Dreamer:Latent Imagination 控制
- 论文专题讲解:Qwen3.5-Omni:Thinker-Talker 与全模态 Agent
- 论文专题讲解:Qwen3:Thinking 模式、36T 预训练与蒸馏
- 论文专题讲解:Nemotron 3 Super:Mamba-MoE 与异步多环境 RL
- 论文专题讲解:Kimi K2:MuonClip、万亿 MoE 与 Agent 数据
- 论文专题讲解:GPT-4o System Card:Omni 安全与多模态评测
- 论文专题讲解:Gemini 2.5:动态 Thinking 与长上下文 Agent
- 论文专题讲解:DeepSeek-V4:百万上下文与 FP4 后训练
- 论文专题讲解:DeepSeek-V3:671B MoE、MLA 与 FP8 训练
- 论文专题讲解:DeepSeek-R1:RL 激发推理能力
- 论文专题讲解:SLA / SLA2:DiT 稀疏线性 Attention
- 论文专题讲解:Muon:LLM 预训练优化器
- 论文专题讲解:MagiAttention:超长上下文分布式 Attention
- 论文专题讲解:Attn-QAT:4-bit Attention 量化感知训练
- 论文专题讲解:Video Prediction Policy:预测视觉表征训练机器人策略
- 论文专题讲解:SpatialVLA:3D 空间表征接入 VLA
- 论文专题讲解:π0.5:开放世界 VLA
- 论文专题讲解:GR-3:少样本长时程 VLA
- 论文专题讲解:GR-2:Web 视频知识迁移到机器人
- 论文专题讲解:DreamZero:WAM 零样本策略
- 论文专题讲解:Depth Anything 3:任意视角的 3D 几何底座
- 论文专题讲解:Wan2.1:开源视频生成系统路线
- 论文专题讲解:Phased DMD:分阶段少步蒸馏
- 论文专题讲解:DMD2:更稳的少步分布匹配蒸馏
- 论文专题讲解:DMD:一步扩散蒸馏
- 论文专题讲解:Diffusion Forcing:next-token 与全序列扩散
- 论文专题讲解:CausVid:流式自回归视频扩散
- 算子与编译器:Workload 建模与 Shape Bucketing
- 算子与编译器:Triton 编程模型与自动调优
- 算子与编译器:Kernel 测试、回归与维护
- 算子与编译器:推理 Attention 与 KV Kernel
- 算子与编译器:Runtime Dispatch 与 Kernel 选择
- 算子与编译器:Roofline 建模与性能案例
- 算子与编译器:Reduction、Norm 与索引 Kernel
- 算子与编译器:PTX / SASS 与编译检查
- 算子与编译器:Profiling、调试与数值稳定
- 算子与编译器:性能反模式与失败案例
- 算子与编译器:MoE 路由与稀疏 Kernel
- 算子与编译器:低精度与量化 Kernel
- 算子与编译器:FlashAttention 与长上下文
- 算子与编译器:Kernel 成本模型与选型
- 算子与编译器:硬件感知排查清单
- 算子与编译器:GPU 互联与拓扑映射
- 算子与编译器:GEMM、Attention 与融合 Kernel
- 算子与编译器:FP8 训练与优化器 Kernel
- 算子与编译器:DeepGEMM 源码与接入
- 算子与编译器:DeepGEMM:FP8 GEMM 与 Mega-MoE
- 算子与编译器:CUTLASS / CuTe 与编译栈
- 算子与编译器:自定义算子与框架集成
- 算子与编译器:CUDA 编程模型与内存层次
- 算子与编译器:通信算子与计算重叠
- 算子与编译器:高级 Kernel 模式与形状特化
- 推理:服务系统
- 推理:运行时:vLLM、SGLang、TensorRT-LLM
- 推理:RAG、Agent 与长上下文系统
- 推理:容量规划与推理优化
- 推理:可观测性与在线评测
- 推理:MoE 路由与多模型服务
- 推理:GPU Kernel、Batching 与显存
- 推理:解耦 Prefill 与 KV 服务
- 推理:成本建模与 SLO 设计
- 推理:上下文压缩与 KV 内存管理
- 推理:缓存、路由与投机解码
- 基础知识:Transformer 输入与注意力
- 基础知识:张量、Shape 与计算图
- 基础知识:Prompt、CoT 与 RAG 入门
- 基础知识:概率与潜变量模型
- 基础知识:位置编码与 Mask:顺序和可见性
- 基础知识:优化与训练入门
- 基础知识:数值、显存与运行时
- 基础知识:Norm、残差与激活函数
- 基础知识:多模态推理入门
- 基础知识:Mamba 与混合 SSM 架构
- 基础知识:线性层到 GEMM
- 基础知识:数据划分与评测指标
- 基础知识:卷积与视觉特征
- 基础知识:自动微分与激活显存
- 具身智能:VLA、WAM 与世界模型地图
- 具身智能:VLA 数据、模型与评测路线
- 具身智能:具身任务谱系与评测
- 具身智能:Sim2Real 与具身数据引擎
- 具身智能:具身规划、控制与安全
- 具身智能:Isaac Sim 与 RoboTwin 仿真数据链
- 具身智能:人机协作与交互评测
- 具身智能:家庭机器人流程与失败排查
- 具身智能:具身部署模式与安全案例
- 具身智能:一个任务跑通具身闭环
- 具身智能:相机、深度与机器人视觉
- 具身智能:从零路线
- 具身智能:资产到轨迹:感知、抓取与数据管线
- 扩散模型:视频与多模态扩散
- 扩散模型:扩散训练与表示
- 扩散模型:Score Matching 到 SDE
- 扩散模型:扩散训练配方与排障
- 扩散模型:噪声日程与参数化
- 扩散模型:扩散采样与推理加速
- 扩散模型:条件控制与 Guidance
- 扩散模型:发展脉络
- 扩散模型:一步生成、蒸馏与整流
- 扩散模型:一致性模型与 Rectified Flow
- 扩散模型:扩散方法对照表
1