论文专题讲解:论文专题写作与验收规范

论文专题讲解:论文专题写作与验收规范

Charles Lv8

这页只维护论文专题的写作标准。专题入口页负责导航;这里负责回答“怎样才算一篇 deep dive 写扎实了”。

推荐结构

每篇专题讲解尽量保持固定结构,方便不同主题之间横向比较。

模块 需要回答的问题
论文信息 标题、链接、代码、关键词和适合读者
论文位置 它在方向谱系里解决哪一段问题
核心问题 旧方法为什么不够,论文要突破什么瓶颈
方法结构 数据、模型、训练目标、推理路径如何组织
实验结论 哪些结果真正支撑了论文主张
消融诊断 哪个模块、数据、scale 或系统条件被拿掉后结果怎样变
局限风险 哪些结论不能过度外推
项目启发 如果落到工程系统里,哪些设计最值得借鉴
本站判断 成熟度、可复用机制和下一步证据

专题页不追求逐字复述论文,而是优先解释“为什么这样设计”。数据构造、训练阶段、推理约束和评测口径这类会改变工程判断的部分,应写得比普通摘要更具体。

硬约束

新增或重写论文页时必须满足三条底线。

  1. 关键 claim 必须能接回原论文图表、实验 setting 或官方材料,不能只写摘要复述。
  2. 复杂图必须有“这张图怎么读”;结果表要在正文里说明 benchmark 条件、硬件/数据/closed-loop 口径和不能外推项。
  3. 项目启发只能吸收证据能支撑的部分;demo、benchmark、system throughput、closed-loop 和本站推断不能混写。

最终页面不要保留“二轮补强:方法和实验抓手”这类临时补丁块。相关内容应融入方法、实验、诊断或局限段落。

方法和实验深度

为了避免专题页写成摘要库,方法部分和实验部分单独按下面标准验收。

部分 必须讲清 合格形态 不合格形态
方法接口 输入是什么、输出是什么、哪些模块改变信息流 用一段文字或小流程图把 data -> model -> loss -> inference 串起来 只列模块名
公式/目标 变量、参数、条件、优化对象分别是什么 至少解释关键 loss、采样公式或动作/状态接口里的每个槽位 只贴公式名或把公式当装饰
训练/推理链路 哪些阶段训练,哪些阶段冻结,部署时走哪条路径 写出 pretrain / finetune / rollout / verification 的顺序和成本点 只写“经过训练后效果更好”
实验 setting 数据、硬件、任务、指标、baseline、是否 closed-loop 每个主结果附近交代口径,复杂表格配 读数边界 只说“在多个 benchmark 上表现最好”
主结果 最突出的数字或趋势支撑了哪个 claim 图表后立刻说明“这能证明什么、不能证明什么” 堆表但不解释
消融/诊断 哪个模块被拿掉,结果怎样变,说明什么 至少保留一个关键 ablation、scaling、acceptance、failure 或 qualitative diagnostic 完全跳过消融

一个读完合格专题页的读者,应该能复述原论文约 90% 的重要信息:问题是什么、核心机制为什么这样设计、训练和推理怎么跑、实验在什么条件下成立、最强证据和最大短板在哪里。页面可以有趣,但有趣必须服务脉络,不能用轻快语气掩盖证据空缺。

本站判断收口

每篇 deep dive 末尾用一个 !!! info "本站判断" 收束即可,不要同时保留 ## 本站判断 heading。这个收口不重复摘要,只回答三件事。

收口问题 最小写法 不要写成
成熟度 经典已验证 / 工程常用 / 前沿待复现 / 官方展示 / 本站推断 “很有潜力”
可复用机制 明确对应数据、训练、推理、显存、验证或部署哪项成本 “效果很好”
下一步证据 需要补 ablation、closed-loop、system trace、质量回归或独立复现 “值得关注”

图表读法

论文图要回答:模块做什么、支撑哪条 claim、不能证明什么。图表不是装饰,而是 claim 的证据节点。

V-JEPA training procedure 原论文图

图源:V-JEPA: Latent Video Prediction for Visual Representation Learning,Figure 3。原论文图意:context encoder 只处理 masked video 中未遮挡 token;predictor 接收 context output 和 mask tokens,预测 target encoder 对完整视频产生的 masked token representations。

图解:先分清两条 encoder 路径

左侧蓝色 token 是可见上下文,经 context encoder 得到 N×dN\times d 表示;predictor 把 context output 和红色 mask tokens 拼接,预测被遮挡位置的 representation。右侧 target encoder 看完整视频,但 loss 只作用在 masked target representations 上,并通过 stop-gradient 阻止 teacher 分支被 predictor 反向更新。这张图支撑的是 latent prediction,不是像素重建,也不能单独证明闭环规划能力。

DeepSeek-V3 architecture 原论文图

图源:DeepSeek-V3 Technical Report,Figure 2。原论文图意:展示 MLA、DeepSeekMoE、shared/routed experts 与 Multi-Token Prediction 在整体架构中的位置。

图解:架构图要按成本链路读

先看 token 在主干里的路径,再看哪些模块改变显存、通信和训练目标。MLA 影响 KV cache 与长上下文成本,MoE 决定每个 token 激活哪些专家,MTP 是额外训练信号而不是推理时必须多吐 token。读技术报告时不要把“结构存在”直接等同于“端到端更快”,还要回到吞吐、负载均衡、FP8、并行策略和 serving 约束。

EAGLE-3 inference pipeline 原论文图{ .atlas-figure-page width=“560” }

图源:EAGLE-3,Figure 5。原论文图意:展示 EAGLE-3 在推理时用 draft model 生成候选 token tree,再由 target LLM 验证和接受部分 token 的 speculative decoding 流程。

图解:推理 pipeline 要抓住草稿和验证

这类图的核心不是“多了一个小模型”,而是把昂贵 target LLM 的逐 token 解码改成“先草拟一批候选,再一次验证一段”。draft model 决定候选质量和树形展开,target model 决定哪些 token 能被接受。它支撑的是吞吐/延迟优化 claim,不能证明模型回答质量提升;如果 acceptance rate 下降,额外 draft 成本可能抵消收益。

复现和证据口径

前沿论文和技术报告必须区分五类证据:论文自述、官方代码/模型、官方 demo、第三方复现、本站推断。闭源技术报告尤其不能把内部 benchmark 当成可复现实验。

状态 可写成 不要写成
Paper Only 报告披露了方法和评测,但缺权重/完整配方 可复现 recipe
Author Code / Official Repo 官方代码或模型可用,仍需检查是否覆盖论文主结果 独立复现
Official Demo 能说明功能形态或产品边界 benchmark 证据
Independent Reproduced 有第三方复现实验或可运行复现记录 只因为 repo 能跑就标独立复现
Site Inference 本站根据证据做的工程判断 作者结论

选题和维护

不是所有论文都适合写成专题。更适合进入这个模块的论文,通常满足至少一个条件:代表方向转折点;数据、训练、推理和评测强耦合;能为项目提供可复用模板;局限同样有启发价值;能连接站内多个主题。

新增专题页时遵守三个维护约定:标题使用“论文或系统名 + 一句话定位”;保留原论文链接和代码链接;结尾必须写局限、风险或不可外推结论。

专题页不要重复主题总览页已经讲清的基础概念。需要背景时链接回对应主题页,这样能保持“单篇论文拆解”的定位,也能减少同一概念在多个页面里不一致。

深度标杆页

标杆页 对齐标准
MagiAttention 要能把长序列训练、mask、并行和系统收益讲成一条线
LingBot-World:世界模拟器 要明确世界模型训练配方、数据路径、rollout 与效率贡献
DreamerV3:跨域通用世界模型 要把 latent dynamics、imagined rollout 和样本效率讲清楚
π0.5:开放世界 VLA 要解释 VLA 数据混合、动作专家和开放世界泛化
CausVid:流式自回归视频扩散 要说明视频扩散如何被 causalize,并接到实时世界模型推理
  • Title: 论文专题讲解:论文专题写作与验收规范
  • Author: Charles
  • Created at : 2026-05-24 09:00:00
  • Updated at : 2026-05-24 09:00:00
  • Link: https://charles2530.github.io/2026/05/24/ai-files-paper-deep-dives-writing-standard/
  • License: This work is licensed under CC BY-NC-SA 4.0.
Comments