2026
91
- 知识问答:具身智能与 VLA QA
- 知识问答:世界模型 QA
- 知识问答:多模态与生成模型 QA
- 知识问答:训练与对齐 QA
- 知识问答:RAG、Agent 与评估 QA
- 知识问答:算子与性能 QA
- 知识问答:推理服务与量化 QA
- 知识问答:基础与 Transformer QA
- 参考与规范:知识博客化写作框架
- 论文专题讲解:vLLM / PagedAttention:为什么 KV cache 需要分页管理
- 论文专题讲解:Lance:统一多模态模型,为什么对世界模型有启发
- 论文专题讲解:Emu3.5:原生多模态模型如何变成世界学习器
- 论文专题讲解:Beyond Language Modeling:多模态预训练怎样长出世界模型能力
- 论文专题讲解:BAGEL:交错多模态预训练中的世界建模涌现
- 论文专题讲解:GPU Utilization:为什么 100% 不等于训练跑满
- 论文专题讲解:论文专题写作与验收规范
- 论文专题讲解:InCoder-32B:工业代码基础模型与执行验证训练
- 论文专题讲解:MapAnything:统一前向 Metric 3D 重建骨干
- 论文专题讲解:Score SDE:把扩散模型写成连续时间生成过程
- 论文专题讲解:VO-DP:RGB-only 扩散策略怎样借用语义和几何特征
- 论文专题讲解:AnyFlow:任意步视频扩散蒸馏
- 思考探索:读懂 Fast-FoundationStereo:从双目几何到高效推理
- 基础知识:模型压缩、剪枝与 NAS:先问省的是哪张账
- 具身智能:双目匹配与 Cost Volume:把深度先变成对应点问题
- 基础知识:预训练目标与表示学习:模型到底被要求学什么
- 基础知识:生成与解码:模型给出概率后,系统怎样选 token
- 基础知识:泛化、正则化与分布偏移:训练 loss 下降为什么不等于模型可用
- 基础知识:数据与数据集基础:模型真正吃下去的不是“文件夹”
- 基础知识:模型蒸馏入门
- 参考与规范:图片资产治理台账
- 参考与规范:图片与公式质量标准
- 基础知识:读懂公式的最小数学:接口、概率、loss 和梯度
- 训练:模型训练从零入门:把数据、目标和更新压力对齐
- 量化:最小数学:格子、误差和输出保持
- 世界模型:从零理解世界模型:预测行动后的可用未来
- VLM/VLA:最小数学:理解、行动与预测后果
- 参考与规范:证据判断原则
- 世界模型:Rollout 服务、量化与 Kernel:省成本不能省掉动作因果
- 世界模型:VLA 到世界模型:一条机器人闭环链路怎么搭
- 参考与规范:全站效率技术覆盖矩阵
- 参考与规范:全站证据与复现状态标准
- 参考与规范:Claim Ledger:世界模型高效训练证据账
- 世界模型:高效训练完整实验报告样例
- 世界模型:高效训练效率技术覆盖矩阵
- 世界模型:Masked / JEPA 与潜变量预测:先学状态,再接动作
- 世界模型:WM / WAM / VAM:动作到底怎样进入世界模型
- 世界模型:不确定性与风险敏感规划
- 世界模型:模拟器、反事实与合成 Rollout
- 世界模型:RSSM、Dreamer 与规划:世界模型怎样变成控制信号
- 世界模型:规划即推理与潜在动作
- 世界模型:生成式模拟与视频世界模型:从好看视频到可交互未来
- 世界模型:评测:不要让好看的未来骗过决策系统
- 世界模型:高效训练路线图
- 世界模型:开发路线:先把数据、动作和评测接成闭环
- 世界模型:数据引擎与自我改进
- 世界模型:机器人与自动驾驶中的世界模型
- 世界模型:动作条件视频世界模型端到端训练案例
- VLM/VLA:世界模型高效训练接口
- VLM/VLA:视觉 Tokenizer 与连接器:视觉证据怎样被压成可用 token
- VLM/VLA:视频表征、状态记忆与长时序压缩
- VLM/VLA:多模态评测与失败模式
- VLM/VLA:架构:视觉证据怎样进入语言模型
- VLM/VLA:部署与安全
- VLM/VLA:数据与策略学习:从示范轨迹到闭环策略
- VLM/VLA:闭环恢复与失败分析
- VLM/VLA:评测与数据引擎
- VLM/VLA:动作表示与控制接口:模型输出怎样变成机器人动作
- VLM/VLA:动作分块、层级策略与潜在技能
- 训练:W&B:训练实验追踪与证据链治理
- 训练:稳定性与故障排查
- 训练:Scaling Law 与训练经济学
- 训练:Scaling、课程学习与数据配比
- 训练:预训练、微调与对齐:把能力、行为和偏好分开看
- 训练:偏好数据与对齐失效
- 训练:后训练数据引擎与 Judge 模型
- 训练:目标函数、优化器与 LR 日程:训练压力怎样变成参数轨迹
- 训练:MTP 与投机解码
- 训练:Megatron、DeepSpeed 与 FSDP:训练栈选型先拆账
- 训练:低比特训练与数值格式:误差会被写回参数
- 训练:输入管线、Packing 与吞吐
- 训练:图片来源与授权
- 训练:评测与消融设计
- 训练:分布式训练与 Checkpoint:让长跑能快、能省、能恢复
- 训练:数据系统与吞吐优化
- 训练:数据质量、去重与治理
- 训练:集群运维与实验治理
- 思考探索:世界模型现状:从视频模拟到工程闭环
- 思考探索:XR2 Gen 2:端侧 AI 与量化部署
- 思考探索:具身智能现状:VLA、数据工厂与真实闭环
- 路线图:研究与工程学习路径
- 路线图:快速对照表
2025
144
- 路线图:常见技术决策与取舍
- 强化学习:verl 训练流程:一次 RL 更新到底发生了什么
- 强化学习:世界模型中的强化学习
- 强化学习:Policy Gradient、PPO 与 GRPO
- 强化学习:MDP、价值函数与 Bellman
- 量化:服务栈与硬件选择
- 量化:运行时与部署框架
- 量化:多模态与 VLA 模型量化
- 量化:QLoRA:低显存微调,不是把模型“训练成 4bit”
- 量化:QAT、Kernel 与 KV Cache
- 量化:PTQ、GPTQ、AWQ 与 SmoothQuant:先找瓶颈,再分误差预算
- 量化:FP8 与混合精度推理:它不是一个 dtype 开关
- 量化:评测与部署清单
- 量化:方法对照表
- 量化:激活离群值:为什么量化常常败在 activation 上
- 论文专题讲解:Embodied World Model Survey:具身世界模型综述
- 论文专题讲解:V-JEPA:视频潜变量预测表征
- 论文专题讲解:Towards Video World Models:视频世界模型五个门槛
- 论文专题讲解:Self Forcing:对齐自回归视频训练与推理
- 论文专题讲解:RingAttention:近无限上下文训练
- 论文专题讲解:PlaNet:像素规划的潜变量动力学
- 论文专题讲解:LWM:百万 token 视频语言世界模型
- 论文专题讲解:LingBot-World:视频基础模型到世界模拟器
- 论文专题讲解:JEPA:预测式表征学习路线
- 论文专题讲解:H-JEPA:层级 JEPA 与潜变量 EBM
- 论文专题讲解:Genie:没有动作标签,怎样学出可交互环境
- 论文专题讲解:DreamerV3:世界模型怎样在 latent 里训练策略
- 论文专题讲解:DreamerV2:离散世界模型玩 Atari
- 论文专题讲解:Dreamer:在 latent imagination 里训练 actor-critic
- 论文专题讲解:Qwen3.5-Omni:Thinker-Talker 与全模态 Agent
- 论文专题讲解:Qwen3:Thinking 模式、36T 预训练与蒸馏
- 论文专题讲解:Nemotron 3 Super:Mamba-MoE 与异步多环境 RL
- 论文专题讲解:Kimi K2:MuonClip、万亿 MoE 与 Agent 数据
- 论文专题讲解:GPT-4o System Card:Omni 安全与多模态评测
- 论文专题讲解:Gemini 2.5:动态 Thinking 与长上下文 Agent
- 论文专题讲解:DeepSeek-V4:百万上下文与 FP4 后训练
- 论文专题讲解:DeepSeek-V3:671B MoE、MLA 与 FP8 训练
- 论文专题讲解:DeepSeek-R1:RL 激发推理能力
- 论文专题讲解:Low-bit LLM Survey:低比特大模型从格式到推理系统
- 论文专题讲解:KVSlimmer:非对称 KV 合并的数学与工程
- 论文专题讲解:Fast-FoundationStereo:实时 Zero-Shot 双目匹配
- 论文专题讲解:EAGLE:为什么 draft 不一定要是一个小模型
- 论文专题讲解:EAGLE-3:为什么 draft model 要在训练时“见过自己犯错”
- 论文专题讲解:EAGLE-2:用动态 Draft Tree 加速投机解码
- 论文专题讲解:ZeRO:数据并行真正浪费的是训练状态副本
- 论文专题讲解:SLA / SLA2:DiT 稀疏线性 Attention
- 论文专题讲解:Muon:LLM 预训练优化器
- 论文专题讲解:Megatron-LM:Tensor Model Parallel 的大模型训练栈
- 论文专题讲解:MagiAttention:超长上下文分布式 Attention
- 论文专题讲解:Attn-QAT:4-bit Attention 量化感知训练
- 论文专题讲解:Video Prediction Policy:预测视觉表征训练机器人策略
- 论文专题讲解:VGGT:一次前向推理怎样恢复相机、深度、点云与轨迹
- 论文专题讲解:SpatialVLA:3D 空间表征接入 VLA
- 论文专题讲解:RT-2:把 web-scale VLM 变成会输出动作的 VLA
- 论文专题讲解:π0.5:开放世界 VLA
- 论文专题讲解:GR-3:少样本长时程 VLA
- 论文专题讲解:GR-2:Web 视频知识怎样迁移到机器人操作
- 论文专题讲解:DreamZero:世界动作模型为什么可以做零样本策略
- 论文专题讲解:Depth Anything:无标注图像怎样变成单目深度基础模型
- 论文专题讲解:Depth Anything V2:单目深度的数据配方
- 论文专题讲解:Depth Anything 3:任意视角的 3D 几何底座
- 论文专题讲解:Wan2.1:开源视频生成系统路线
- 论文专题讲解:Phased DMD:分阶段少步蒸馏
- 论文专题讲解:DPM-Solver++:为 Guidance 场景设计的扩散 ODE 求解器
- 论文专题讲解:DMD2:更稳的少步分布匹配蒸馏
- 论文专题讲解:DMD:一步扩散蒸馏
- 论文专题讲解:Diffusion Forcing:next-token 与全序列扩散
- 论文专题讲解:CausVid:流式自回归视频扩散
- 算子与编译器:Workload 建模与 Shape Bucketing
- 算子与编译器:Triton 编程模型与自动调优:先画 tile,再谈速度
- 算子与编译器:Kernel 测试、回归与维护
- 算子与编译器:推理 Attention 与 KV Kernel
- 算子与编译器:Runtime Dispatch 与 Kernel 选择
- 算子与编译器:Roofline 建模与性能案例
- 算子与编译器:Reduction、Norm、Layout 与 Indexing:小算子为什么能拖慢大模型
- 算子与编译器:PTX / SASS 与编译检查
- 算子与编译器:Profiling、调试与数值稳定
- 算子与编译器:性能反模式与失败案例
- 算子与编译器:MoE 路由与稀疏 Kernel
- 算子与编译器:低精度与量化 Kernel
- 算子与编译器:FlashAttention 与长上下文:先分清三张账
- 算子与编译器:Kernel 成本模型与选型
- 算子与编译器:硬件感知排查清单
- 算子与编译器:GPU 互联与拓扑映射
- 算子与编译器:GEMM、Attention 与融合 Kernel
- 算子与编译器:FP8 训练与优化器 Kernel
- 算子与编译器:DeepGEMM 源码与接入
- 算子与编译器:DeepGEMM:FP8 GEMM 与 Mega-MoE
- 算子与编译器:CUTLASS / CuTe 与编译栈
- 算子与编译器:自定义算子与框架集成
- 算子与编译器:CUDA 编程模型与内存层次:先画数据怎么走
- 算子与编译器:通信算子与计算重叠
- 算子与编译器:高级 Kernel 模式与形状特化
- 推理:服务系统:快模型为什么上线后仍然慢
- 推理:运行时:按请求生命周期选择 vLLM、SGLang 与 TensorRT-LLM
- 推理:RAG、Agent 与长上下文系统
- 推理:容量规划与推理优化
- 推理:可观测性与在线评测
- 推理:MoE 路由与多模型服务
- 推理:GPU Kernel、Batching 与显存
- 推理:解耦 Prefill 与 KV 服务
- 推理:成本建模与 SLO 设计
- 推理:上下文压缩与 KV 内存管理
- 推理:KV、缓存与投机解码:把贵模型用在值得的位置
- 基础知识:Transformer、Tokenization 与注意力
- 基础知识:张量、Shape 与计算图:为什么很多模型问题先是接口问题
- 基础知识:Prompt、CoT 与 RAG:把模型输入做成可验证的信息流
- 基础知识:概率与潜变量模型:生成模型到底在学什么
- 基础知识:位置编码与 Mask:顺序、可见性和长上下文边界
- 基础知识:优化与训练:loss 怎样变成一次可靠更新
- 基础知识:数值、显存与运行时:模型为什么数学可行但系统跑不动
- 基础知识:归一化、残差与激活:深层网络为什么能稳住
- 基础知识:多模态推理:先看见证据,再组织推理
- 基础知识:MoE 与大模型架构:总参数、激活参数和路由成本
- 基础知识:Mamba 与混合 SSM 架构
- 基础知识:线性层、MLP 与 GEMM:模型里的矩阵乘为什么这么重要
- 基础知识:数据划分与评测指标:一个分数为什么不够
- 基础知识:卷积与视觉特征:局部窗口如何变成多尺度表示
- 基础知识:自动微分与激活显存:训练为什么要保存中间值
- 具身智能:VLA、WAM 与世界模型系统图:谁负责什么
- 具身智能:VLA 数据、模型与评测:机器人数据到底该怎么读
- 具身智能:具身任务谱系与评测
- 具身智能:Sim2Real 与具身数据引擎:真实失败怎样变成下一轮能力
- 具身智能:Rerun:具身智能的多模态时序数据层
- 具身智能:具身规划、控制与安全:高层动作为什么还要过安全层
- 具身智能:Isaac Sim 与 RoboTwin 仿真数据链
- 具身智能:人机协作与交互评测
- 具身智能:家庭机器人流程与失败排查
- 具身智能:具身部署模式与安全案例
- 具身智能:一个任务跑通具身闭环:从看见到失败回流
- 具身智能:相机、深度与机器人视觉:图像怎样接回 3D 世界
- 具身智能:从零路线:先把闭环跑起来
- 具身智能:资产到轨迹:机器人数据生产线怎么跑通
- 扩散模型:视频与多模态扩散:视频不是把图片多画几帧
- 扩散模型:扩散训练:从加噪到去噪方向场
- 扩散模型:Score Matching 到 SDE:扩散模型到底在学哪一个方向
- 扩散模型:扩散训练配方与排障
- 扩散模型:噪声日程与参数化
- 扩散模型:扩散采样与推理加速
- 扩散模型:条件控制与 Guidance
- 扩散模型:发展脉络
- 扩散模型:一步生成、蒸馏与整流:把多步纠错压成少数大跳
- 扩散模型:一致性模型与 Rectified Flow:终点映射和速度场不是一回事
- 扩散模型:扩散方法怎么选:先判断你在改哪一层成本
2024
35
- other-recommend-note algorithm-and-datastruct-note compiler-design-note computer-organization-and-architecture-note computer-networks-note operating-system-note discrete-mathematics-note probability-statistics-note higher-mathematics-note linear-algebra-note
- ML-paper-RAG
- ML-paper-SmoothQuant ML-paper-QQQ
- ML-paper-AWQ ML-paper-GPTQ
- ML-paper-QLora
- ML-paper-PD-quant ML-paper-SlimSAM
- ML-paper-SAM
- ML-paper-PTQ4SAM
- CUDA-note-summary
- computer-network-lab-note
- x86-construction
- deep-learning-model-brief
- CUDA-interview-note
- front-end-interview-preparation
- computer-network-note-8 computer-network-note-7 computer-network-note-6 computer-network-note-5 computer-network-note-4 computer-network-note-3 computer-network-note-2
- computer-network-note-1
- database-theory-summary
2023
230
- database-design-theory database-archievement-theory
- algorithm-buaa-note
- parallel_programming_theory
- optimisation theory
- SwiftUI-IOS-design-doc
- SwiftUI-basis
- ER-graph-tips
- ChatGPT-Plus-Accounts-Access
- SysY-compiler-design-doc
- MPI-note-2 MPI-note-1
- decision-tree
- logistic-model multiobjective-programming data-envelopment-analysis
- mermaid-note queuing-theory monte-carlo-simulation markov-prediction correlation-analysis principal-component-analysis fuzzy-comprehensive-evaluation regression-analysis-algorithm grey-prediction-model clustering-analysis
- TOPSIS-model analytical-hierarchy-process interpolation-and-fitting nonlinear-program integer-program linear-program
- anaconda-command-note
- vue2-note-4 vue3-note-1 JavaScript-note-10 JavaScript-note-9 JavaScript-note-8 css-note-3 css-note-2
- html-note-4 html-note-3 html-note-2 Latex_package_recommendation
- Red-black-tree
- Base-ring-tree String-Matching-Algorithm
- algorithm-basis-note
- Ajax-note-5 Ajax-note-4 Ajax-note-3
- Ajax-note-2
- Ajax-note-1
- CUDA_note_5 CUDA_note_cuFFT CUDA_note_4
- CUDA_note_3 CUDA_note_2
- Node-note-5 Node-note-4 Node-note-3
- Node-note-2 Node-note-1
- database-theory-9 database-theory-8 database-theory-7 database-theory-6 database-theory-5 database-theory-4 database-theory-3
- database-theory-2 compiler-theory-5 compiler-theory-4
- compiler-theory-3 database-theory-1
- compiler-theory-2 compiler-theory-1
- CUDA_note_1 Swift-note-26 Swift-note-25 Swift-note-24 Swift-note-23 Swift-note-22 Swift-note-21 Swift-note-20 Swift-note-19 Swift-note-18 Swift-note-17 Swift-note-16 Swift-note-15 Swift-note-14 Swift-note-13 Swift-note-12 Swift-note-11 Swift-note-10 Swift-note-9 Swift-note-8 Swift-note-7 Swift-note-6 Swift-note-5 Swift-note-4 Swift-note-3 Swift-note-2 Swift-note-1
- MySQL_note_3
- MySQL_note_2
- algorithm-extra-note
- MySQL_note_1
- yaml-note
- Review of Military Theory
- UML_note OO_summary_4.UML
- lab6-challenge-report
- OO_hw13_test
- lab6_report
- photoshop-note
- OO_summary_3.JML
- Vue2-note-3 Vue2-note-2 Vue2-note-1
- GXemul-note
- lab5-report
- OO_hw9_test
- JML-note
- lab4_report
- Turtle-soup-game-for-is-or-not
- OO_summary_2.Elevator_dispatch
- OS-quick-abbreviation
- lab3_report
- OO_multithreading_tips OO_hw5_test
- tensorflow-model-summary
- TinyML_for_frb lab_discussion_1
- lab2_report
- Tensorflow2.1-note tf.keras.layers.Dense()-introduction
- OO_summary_1.Expression
- lab1_report
- lab0_report
- CO_P4
- OO_hw1_test
- Bash-note-4 Bash-note-3 Bash-note-2 Bash-note-1
- Makefile-note
- Segment-tree-2 Diameter_of_tree
- windows-command-basis git-note linux-note-4 linux-note-3 linux-note-2 linux-note-1
- linux-note-efficient linux-software-install linux-note-summary
- matlab-note-10 matlab-note-9 matlab-note-8 matlab-note-7 matlab-note-6 matlab-note-5 matlab-note-4 matlab-note-3 matlab-note-2 matlab-note-1 matlab-note-origin
- Geatpy_basis Matplotlib_basis Scipy_basis Numpy_basis linux_basic_command JavaScript_note_7 JavaScript_note_6 JavaScript_note_5 JavaScript_note_4 JavaScript_note_3 JavaScript_note_2 JavaScript_note_1 Latex_note_5
- Latex_note_4 Latex_note_3 Latex_note_2 Latex_note_1
- Latex_download OS_theory_6 OO_pre_9 OO_pre_8 OO_pre_7 OO_pre_6 OO_pre_5 OO_pre_4 OO_pre_3 OO_pre_2 OO_pre_1
- Turtle-soup-game
- matlab-note-summary tensorflow-function-basis bfptr-algorithm
- game-theory-algorithm dynamic-programming-advance dynamic-programming-basis Longest Common Subsequence Cut-point-algorithm Shrink-point-algorithm
- Inverse pair
- Longest Increasing Subsequence Euler function high-precision-algorithm
- extended euclidean algorithm minimum spanning tree
- Barycenter of tree Least Common Ancestors algorithm
- Sparse Table Binary Indexed Tree Discretization-algorithm double-pointers-queue
- Monotone-queue prefix_sum_algorithm judge-prime-algorithm Cpp_note_4
- shortest-path-algorithm
- Topological-sorting prune-algorithm
- Adjacency list
- algorithm introduction Trie tree
- disjoint set
2022
47
- TinyML-note OS_theory_5 OS_theory_4
- OS_theory_3 OS_theory_2 OS_theory_1
- Hexo 博客搭建指南与避坑记录 Java_note_3 Java_note_2 Java_note_1 datastruct_7 datastruct_6 datastruct_5 datastruct_4 datastruct_3 datastruct_2 css-note-1 html-note-1 Segment-tree-1
- IDEA Shortcut key markdown-note regular expression git_command_basis datastruct_1 Cpp_note_3 Cpp_note_2 Cpp_note_1 Cpp_part8 Cpp_part7 Cpp_part6 Cpp_part5 Cpp_part4 Cpp_part3 Cpp_part2 Cpp_part1
- CO-Verilog CO-Mips
- P8 Design documents P7 Design documents P6 Design documents P5 Design documents P4 Design documents P3 Design documents CO_P5 CO_P7 p7 test data CO_Pre