Category: AI | Charles's Castle

Charles's Castle

Charles's Castle

HOME
CATEGORIES
TAGS
ABOUT
- ME
- GITHUB
- BLOG
- STATISTICS

HOME
CATEGORIES
TAGS
ABOUT

ME

GITHUB

BLOG

STATISTICS
Archives
Photos
Essays
Friends

AI

2026 103

思考探索：世界模型驱动的机器人数据飞轮：能持续生产经验的系统，才是真正的基础设施
思考探索：自动驾驶世界模型：从渲染、仿真到规划闭环
论文专题讲解：Motus：把 latent action、世界模型和 VLA 合到一个生成框架
论文专题讲解：VGGT-Ω：几何重建怎样变成具身空间表征
论文专题讲解：Fast-WAM：WAM 一定要推理时想象未来吗
思考探索：世界模型 Infra：从模型谱系到物理 AI 工程栈
论文专题讲解：D4RT：动态场景的 4D 重建与跟踪
论文专题讲解：kai0：资源受限下的高可靠机器人操作
具身智能：机器人数据里的 `state` 和 `action`：不要被字段名骗了
思考探索：WAM 与 3D 视觉：世界模型从视频想象走向物理闭环
论文专题讲解：World Model for Robot Learning：机器人学习世界模型综述
知识问答：具身智能与 VLA QA
知识问答：世界模型 QA
知识问答：多模态与生成模型 QA
知识问答：训练与对齐 QA
知识问答：RAG、Agent 与评估 QA
知识问答：算子与性能 QA
知识问答：推理服务与量化 QA
知识问答：基础与 Transformer QA
参考与规范：知识博客化写作框架
论文专题讲解：vLLM / PagedAttention：为什么 KV cache 需要分页管理
论文专题讲解：Lance：统一多模态模型，为什么对世界模型有启发
论文专题讲解：Emu3.5：原生多模态模型如何变成世界学习器
论文专题讲解：Beyond Language Modeling：多模态预训练怎样长出世界模型能力
论文专题讲解：BAGEL：交错多模态预训练中的世界建模涌现
论文专题讲解：GPU Utilization：为什么 100％不等于训练跑满
论文专题讲解：论文专题写作与验收规范
论文专题讲解：InCoder-32B：工业代码基础模型与执行验证训练
论文专题讲解：MapAnything：统一前向 Metric 3D 重建骨干
论文专题讲解：Score SDE：把扩散模型写成连续时间生成过程
论文专题讲解：VO-DP：RGB-only 扩散策略怎样借用语义和几何特征
论文专题讲解：AnyFlow：任意步视频扩散蒸馏
思考探索：读懂 Fast-FoundationStereo：从双目几何到高效推理
基础知识：模型压缩、剪枝与 NAS：先问省的是哪张账
具身智能：双目匹配与 Cost Volume：把深度先变成对应点问题
基础知识：预训练目标与表示学习：模型到底被要求学什么
基础知识：生成与解码：模型给出概率后，系统怎样选 token
基础知识：泛化、正则化与分布偏移：训练 loss 下降为什么不等于模型可用
基础知识：数据与数据集基础：模型真正吃下去的不是“文件夹”
基础知识：模型蒸馏入门
参考与规范：图片资产治理台账
参考与规范：图片与公式质量标准
基础知识：读懂公式的最小数学：接口、概率、loss 和梯度
训练：模型训练从零入门：把数据、目标和更新压力对齐
量化：最小数学：格子、误差和输出保持
世界模型：从零理解世界模型：预测行动后的可用未来
VLM/VLA：最小数学：理解、行动与预测后果
参考与规范：证据判断原则
世界模型：Rollout 服务、量化与 Kernel：省成本不能省掉动作因果
世界模型：VLA 到世界模型：一条机器人闭环链路怎么搭
参考与规范：全站效率技术覆盖矩阵
参考与规范：全站证据与复现状态标准
参考与规范：Claim Ledger：世界模型高效训练证据账
世界模型：高效训练完整实验报告样例
世界模型：高效训练效率技术覆盖矩阵
世界模型：Masked / JEPA 与潜变量预测：先学状态，再接动作
世界模型：WM / WAM / VAM：动作到底怎样进入世界模型
世界模型：不确定性与风险敏感规划
世界模型：模拟器、反事实与合成 Rollout
世界模型：RSSM、Dreamer 与规划：世界模型怎样变成控制信号
世界模型：规划即推理与潜在动作
世界模型：生成式模拟与视频世界模型：从好看视频到可交互未来
世界模型：评测：不要让好看的未来骗过决策系统
世界模型：高效训练路线图
世界模型：开发路线：先把数据、动作和评测接成闭环
世界模型：数据引擎与自我改进
世界模型：机器人与自动驾驶中的世界模型
世界模型：动作条件视频世界模型端到端训练案例
VLM/VLA：世界模型高效训练接口
VLM/VLA：视觉 Tokenizer 与连接器：视觉证据怎样被压成可用 token
VLM/VLA：视频表征、状态记忆与长时序压缩
VLM/VLA：多模态评测与失败模式
VLM/VLA：架构：视觉证据怎样进入语言模型
VLM/VLA：部署与安全
VLM/VLA：数据与策略学习：从示范轨迹到闭环策略
VLM/VLA：闭环恢复与失败分析
VLM/VLA：评测与数据引擎
VLM/VLA：动作表示与控制接口：模型输出怎样变成机器人动作
VLM/VLA：动作分块、层级策略与潜在技能
训练：W&B：训练实验追踪与证据链治理
训练：稳定性与故障排查
训练：Scaling Law 与训练经济学
训练：Scaling、课程学习与数据配比
训练：预训练、微调与对齐：把能力、行为和偏好分开看
训练：偏好数据与对齐失效
训练：后训练数据引擎与 Judge 模型
训练：目标函数、优化器与 LR 日程：训练压力怎样变成参数轨迹
训练：MTP 与投机解码
训练：Megatron、DeepSpeed 与 FSDP：训练栈选型先拆账
训练：低比特训练与数值格式：误差会被写回参数
训练：输入管线、Packing 与吞吐
训练：图片来源与授权
训练：评测与消融设计
训练：分布式训练与 Checkpoint：让长跑能快、能省、能恢复
训练：数据系统与吞吐优化
训练：数据质量、去重与治理
训练：集群运维与实验治理
思考探索：世界模型现状：从视频模拟到工程闭环
思考探索：XR2 Gen 2：端侧 AI 与量化部署
思考探索：具身智能现状：VLA、数据工厂与真实闭环
路线图：研究与工程学习路径
路线图：快速对照表
路线图：常见技术决策与取舍

2025 143

强化学习：verl 训练流程：一次 RL 更新到底发生了什么
强化学习：世界模型中的强化学习
强化学习：Policy Gradient、PPO 与 GRPO
强化学习：MDP、价值函数与 Bellman
量化：服务栈与硬件选择
量化：运行时与部署框架
量化：多模态与 VLA 模型量化
量化：QLoRA：低显存微调，不是把模型“训练成 4bit”
量化：QAT、Kernel 与 KV Cache
量化：PTQ、GPTQ、AWQ 与 SmoothQuant：先找瓶颈，再分误差预算
量化：FP8 与混合精度推理：它不是一个 dtype 开关
量化：评测与部署清单
量化：方法对照表
量化：激活离群值：为什么量化常常败在 activation 上
论文专题讲解：Embodied World Model Survey：具身世界模型综述
论文专题讲解：V-JEPA：视频潜变量预测表征
论文专题讲解：Towards Video World Models：视频世界模型五个门槛
论文专题讲解：Self Forcing：对齐自回归视频训练与推理
论文专题讲解：RingAttention：近无限上下文训练
论文专题讲解：PlaNet：像素规划的潜变量动力学
论文专题讲解：LWM：百万 token 视频语言世界模型
论文专题讲解：LingBot-World：视频基础模型到世界模拟器
论文专题讲解：JEPA：预测式表征学习路线
论文专题讲解：H-JEPA：层级 JEPA 与潜变量 EBM
论文专题讲解：Genie：没有动作标签，怎样学出可交互环境
论文专题讲解：DreamerV3：世界模型怎样在 latent 里训练策略
论文专题讲解：DreamerV2：离散世界模型玩 Atari
论文专题讲解：Dreamer：在 latent imagination 里训练 actor-critic
论文专题讲解：Qwen3.5-Omni：Thinker-Talker 与全模态 Agent
论文专题讲解：Qwen3：Thinking 模式、36T 预训练与蒸馏
论文专题讲解：Nemotron 3 Super：Mamba-MoE 与异步多环境 RL
论文专题讲解：Kimi K2：MuonClip、万亿 MoE 与 Agent 数据
论文专题讲解：GPT-4o System Card：Omni 安全与多模态评测
论文专题讲解：Gemini 2.5：动态 Thinking 与长上下文 Agent
论文专题讲解：DeepSeek-V4：百万上下文与 FP4 后训练
论文专题讲解：DeepSeek-V3：671B MoE、MLA 与 FP8 训练
论文专题讲解：DeepSeek-R1：RL 激发推理能力
论文专题讲解：Low-bit LLM Survey：低比特大模型从格式到推理系统
论文专题讲解：KVSlimmer：非对称 KV 合并的数学与工程
论文专题讲解：Fast-FoundationStereo：实时 Zero-Shot 双目匹配
论文专题讲解：EAGLE：为什么 draft 不一定要是一个小模型
论文专题讲解：EAGLE-3：为什么 draft model 要在训练时“见过自己犯错”
论文专题讲解：EAGLE-2：用动态 Draft Tree 加速投机解码
论文专题讲解：ZeRO：数据并行真正浪费的是训练状态副本
论文专题讲解：SLA / SLA2：DiT 稀疏线性 Attention
论文专题讲解：Muon：LLM 预训练优化器
论文专题讲解：Megatron-LM：Tensor Model Parallel 的大模型训练栈
论文专题讲解：MagiAttention：超长上下文分布式 Attention
论文专题讲解：Attn-QAT：4-bit Attention 量化感知训练
论文专题讲解：Video Prediction Policy：预测视觉表征训练机器人策略
论文专题讲解：VGGT：一次前向推理怎样恢复相机、深度、点云与轨迹
论文专题讲解：SpatialVLA：3D 空间表征接入 VLA
论文专题讲解：RT-2：把 web-scale VLM 变成会输出动作的 VLA
论文专题讲解：π0.5：开放世界 VLA
论文专题讲解：GR-3：少样本长时程 VLA
论文专题讲解：GR-2：Web 视频知识怎样迁移到机器人操作
论文专题讲解：DreamZero：世界动作模型为什么可以做零样本策略
论文专题讲解：Depth Anything：无标注图像怎样变成单目深度基础模型
论文专题讲解：Depth Anything V2：单目深度的数据配方
论文专题讲解：Depth Anything 3：任意视角的 3D 几何底座
论文专题讲解：Wan2.1：开源视频生成系统路线
论文专题讲解：Phased DMD：分阶段少步蒸馏
论文专题讲解：DPM-Solver++：为 Guidance 场景设计的扩散 ODE 求解器
论文专题讲解：DMD2：更稳的少步分布匹配蒸馏
论文专题讲解：DMD：一步扩散蒸馏
论文专题讲解：Diffusion Forcing：next-token 与全序列扩散
论文专题讲解：CausVid：流式自回归视频扩散
算子与编译器：Workload 建模与 Shape Bucketing
算子与编译器：Triton 编程模型与自动调优：先画 tile，再谈速度
算子与编译器：Kernel 测试、回归与维护
算子与编译器：推理 Attention 与 KV Kernel
算子与编译器：Runtime Dispatch 与 Kernel 选择
算子与编译器：Roofline 建模与性能案例
算子与编译器：Reduction、Norm、Layout 与 Indexing：小算子为什么能拖慢大模型
算子与编译器：PTX / SASS 与编译检查
算子与编译器：Profiling、调试与数值稳定
算子与编译器：性能反模式与失败案例
算子与编译器：MoE 路由与稀疏 Kernel
算子与编译器：低精度与量化 Kernel
算子与编译器：FlashAttention 与长上下文：先分清三张账
算子与编译器：Kernel 成本模型与选型
算子与编译器：硬件感知排查清单
算子与编译器：GPU 互联与拓扑映射
算子与编译器：GEMM、Attention 与融合 Kernel
算子与编译器：FP8 训练与优化器 Kernel
算子与编译器：DeepGEMM 源码与接入
算子与编译器：DeepGEMM：FP8 GEMM 与 Mega-MoE
算子与编译器：CUTLASS / CuTe 与编译栈
算子与编译器：自定义算子与框架集成
算子与编译器：CUDA 编程模型与内存层次：先画数据怎么走
算子与编译器：通信算子与计算重叠
算子与编译器：高级 Kernel 模式与形状特化
推理：服务系统：快模型为什么上线后仍然慢
推理：运行时：按请求生命周期选择 vLLM、SGLang 与 TensorRT-LLM
推理：RAG、Agent 与长上下文系统
推理：容量规划与推理优化
推理：可观测性与在线评测
推理：MoE 路由与多模型服务
推理：GPU Kernel、Batching 与显存
推理：解耦 Prefill 与 KV 服务
推理：成本建模与 SLO 设计
推理：上下文压缩与 KV 内存管理
推理：KV、缓存与投机解码：把贵模型用在值得的位置
基础知识：Transformer、Tokenization 与注意力
基础知识：张量、Shape 与计算图：为什么很多模型问题先是接口问题
基础知识：Prompt、CoT 与 RAG：把模型输入做成可验证的信息流
基础知识：概率与潜变量模型：生成模型到底在学什么
基础知识：位置编码与 Mask：顺序、可见性和长上下文边界
基础知识：优化与训练：loss 怎样变成一次可靠更新
基础知识：数值、显存与运行时：模型为什么数学可行但系统跑不动
基础知识：归一化、残差与激活：深层网络为什么能稳住
基础知识：多模态推理：先看见证据，再组织推理
基础知识：MoE 与大模型架构：总参数、激活参数和路由成本
基础知识：Mamba 与混合 SSM 架构
基础知识：线性层、MLP 与 GEMM：模型里的矩阵乘为什么这么重要
基础知识：数据划分与评测指标：一个分数为什么不够
基础知识：卷积与视觉特征：局部窗口如何变成多尺度表示
基础知识：自动微分与激活显存：训练为什么要保存中间值
具身智能：VLA、WAM 与世界模型系统图：谁负责什么
具身智能：VLA 数据、模型与评测：机器人数据到底该怎么读
具身智能：具身任务谱系与评测
具身智能：Sim2Real 与具身数据引擎：真实失败怎样变成下一轮能力
具身智能：Rerun：具身智能的多模态时序数据层
具身智能：具身规划、控制与安全：高层动作为什么还要过安全层
具身智能：Isaac Sim 与 RoboTwin 仿真数据链
具身智能：人机协作与交互评测
具身智能：家庭机器人流程与失败排查
具身智能：具身部署模式与安全案例
具身智能：一个任务跑通具身闭环：从看见到失败回流
具身智能：相机、深度与机器人视觉：图像怎样接回 3D 世界
具身智能：从零路线：先把闭环跑起来
具身智能：资产到轨迹：机器人数据生产线怎么跑通
扩散模型：视频与多模态扩散：视频不是把图片多画几帧
扩散模型：扩散训练：从加噪到去噪方向场
扩散模型：Score Matching 到 SDE：扩散模型到底在学哪一个方向
扩散模型：扩散训练配方与排障
扩散模型：噪声日程与参数化
扩散模型：扩散采样与推理加速
扩散模型：条件控制与 Guidance
扩散模型：发展脉络
扩散模型：一步生成、蒸馏与整流：把多步纠错压成少数大跳
扩散模型：一致性模型与 Rectified Flow：终点映射和速度场不是一回事
扩散模型：扩散方法怎么选：先判断你在改哪一层成本

1

© 2022 - 2026 Charles

558 posts in total 2222.4k words in total

VISITOR COUNT TOTAL PAGE VIEWS

POWERED BY Hexo THEME Redefine v2.9.0

Blog up for days hrs Min Sec

EXIF