整理 Hexo、GitHub Pages 与 Redefine 主题搭建过程中的配置步骤、评论系统和常见问题。
-
Sticky
-
论文专题讲解:论文专题写作与验收规范
这页只维护论文专题的写作标准。专题入口页负责导航;这里负责回答“怎样才算一篇 deep dive 写扎实了”。 推荐结构 每篇专题讲解尽量保持固定结构,方便不同主题之间横向比较。 模块 需要回答的问题 — --- 论文信息 标题、链接、代码、关键词和适合读者 论文位置 它在方向谱系里解决哪一段问题 核心问题 旧方法
-
论文专题讲解:InCoder-32B:工业代码基础模型与执行验证训练
这页先按“论文证据节点”读:先问它解决哪一个瓶颈,再看核心图表、实验 setting 和不能外推的边界。背景概念先回 论文专题讲解 和 技术报告与证据台账。 前置 :最好先知道普通 code LLM 的预训练、FIM、SFT、工具执行验证和长上下文训练分别解决什么问题。 主线关系 :读完后把结论回填到「技术报告与证据台
-
论文专题讲解:MapAnything:统一前向 Metric 3D 重建骨干
这页先按“论文证据节点”读:先问它解决哪一个瓶颈,再看核心图表、实验 setting 和不能外推的边界。背景概念先回 论文专题讲解 和 具身智能。 前置 :建议先读 相机、深度与机器人视觉 和 VGGT,知道 camera pose、depth、point map、ray、metric scale 分别是什么。 主线关
-
论文专题讲解:Score SDE:把扩散模型写成连续时间生成过程
这页先按“论文证据节点”读:先问它解决哪一个瓶颈,再看核心图表、实验 setting 和不能外推的边界。背景概念先回 论文专题讲解 和 扩散模型。 前置 :知道 score 是 $ nabla x log p x $,知道 DDPM 是逐步加噪和逐步去噪即可。 主线关系 :这篇是扩散模型理论主线里的关键枢纽。后面的 D
-
论文专题讲解:VO-DP:纯视觉语义-几何自适应扩散策略
这页先按“论文证据节点”读:先问它解决哪一个瓶颈,再看核心图表、实验 setting 和不能外推的边界。背景概念先回 论文专题讲解 和 具身智能。 主线关系 :VO-DP 接在 VGGT、Depth Anything 3 和 Diffusion Policy 之后看最顺。它不是把 VLA 做大,而是问一个很工程的问题:
-
论文专题讲解:AnyFlow:任意步视频扩散蒸馏
这页先按“论文证据节点”读:先问它解决哪一个瓶颈,再看核心图表、实验 setting 和不能外推的边界。背景概念先回 论文专题讲解 和 扩散模型。 前置 :建议先知道 probability-flow ODE、Flow Matching、DMD / DMD2 和 causal video diffusion 的基本含义
-
思考探索:读懂 Fast-FoundationStereo:从双目几何到高效推理
为什么一篇 stereo matching 论文会放进“高效推理”专题?因为这里的推理不是 LLM 的逐 token decode,而是机器人、AR、自动驾驶和工业视觉里的实时稠密深度感知。模型每慢几十毫秒,系统看到的世界就会滞后一截;模型每错一块边界,后面的避障、抓取或空间理解就可能跟着错。 Fast-Foundat
-
基础知识:模型压缩、剪枝与 NAS 入门
模型压缩解决的是一个朴素但很硬的问题:强模型太慢、太大、太贵,能不能把它变成更适合部署的形态,同时尽量保住质量。 这页先回答“模型压缩、剪枝与 NAS”在「基础知识」里的位置:它把 teacher/student、参数量、MACs、latency 和部署 runtime 接起来。 前置 :先知道张量 shape、fea
-
具身智能:双目匹配与 Cost Volume 入门
双目匹配(stereo matching)解决的是一个很具体的问题:给定同一时刻、已经校正的左右两张图,估计每个像素在左右图中的水平位移,也就是 disparity,再把 disparity 转成深度。 这页先回答“双目匹配与 cost volume”在「具身智能」里的位置:它把相机几何里的 baseline / di