整理 Hexo、GitHub Pages 与 Redefine 主题搭建过程中的配置步骤、评论系统和常见问题。
-
Sticky
-
论文专题讲解:vLLM / PagedAttention:为什么 KV cache 需要分页管理
Checked date: 2026-06-03 Repro status: 论文级理解;本站未复现实验,只引用原论文图、vLLM 官方博客和公开论文结果。 vLLM 的核心贡献不是“写了一个更快的推理库”,而是抓住了 LLM serving 里最容易被低估的瓶颈: decode 阶段的 KV cache 既大、又动态
-
论文专题讲解:Lance:统一多模态模型,为什么对世界模型有启发
Lance 不是 Dreamer 那类 model-based RL 世界模型,也不是 LingBot-World 那类动作条件交互模拟器。它值得放进世界模型专题,是因为它回答了另一个底层问题: 如果一个模型既要理解图像/视频,又要生成和编辑图像/视频,语义 token、视觉 latent、干净条件和带噪目标应该怎样放
-
论文专题讲解:Emu3.5:原生多模态模型如何变成世界学习器
Checked Date Repro Status 本页证据口径 — --- — 2026-06-02 Author code / model release reported 以 arXiv HTML、官方仓库与论文图表为主;world exploration、long-horizon generation、
-
论文专题讲解:Beyond Language Modeling:多模态预训练怎样长出世界模型能力
这篇论文的价值不是发布一个最强模型,而是做控制实验:如果从零训练统一多模态模型,视觉表示、数据混合、动作条件、MoE 和 scaling 分别影响什么。 它最值得放进世界模型专题,是因为它把一个常被含糊带过的问题拆开了:世界建模能力到底来自大量 action-conditioned data,还是也能从一般视频和图文预
-
论文专题讲解:BAGEL:交错多模态预训练中的世界建模涌现
Checked Date Repro Status 本页证据口径 — --- — 2026-06-02 Author code / checkpoints reported 以 arXiv HTML、项目页与论文图表为主;future frame prediction、3D manipulation、world
-
论文专题讲解:GPU Utilization:为什么 100% 不等于训练跑满
这篇文章最值得带回训练系统里的结论是: GPU utilization 更像“GPU 没闲着”的指标,不是“GPU 算力被有效使用”的指标。 Trainy 的案例里,团队已经把 nvidia-smi 里常见的 GPU utilization 推到 100%,功耗也不低,但训练 workload 的 MFU 只有约 20
-
论文专题讲解:论文专题写作与验收规范
这页只维护论文专题的写作标准。专题入口页负责导航;这里负责回答“怎样才算一篇 deep dive 写扎实了”。 推荐结构 每篇专题讲解尽量保持固定结构,方便不同主题之间横向比较。 模块 需要回答的问题 — --- 论文信息 标题、链接、代码、关键词和适合读者 论文位置 它在方向谱系里解决哪一段问题 核心问题 旧方法
-
论文专题讲解:InCoder-32B:工业代码基础模型与执行验证训练
InCoder-32B 这篇报告的核心不是“又一个 32B code model”,而是把 code LLM 的战场从常规 Python/JavaScript 题目,推到更贴近工程现场的工业代码:芯片设计、GPU kernel 优化、嵌入式系统、编译器/低层代码优化和 3D/CAD 建模。 这类任务和普通代码补全的差异
-
论文专题讲解:MapAnything:统一前向 Metric 3D 重建骨干
MapAnything 的核心价值,是把原本分散在 SfM、MVS、相机标定、深度估计、定位和补全里的几何问题,压到一个统一的前向模型里: 输入可以只有图像,也可以额外带 intrinsics、poses、depth 或 partial reconstruction;输出则是一套可合成 metric 3D recons