图片与公式质量标准

图片与公式质量标准

Charles Lv8

这页记录全站维护论文图和数学公式时的最低标准。目标不是把页面做得更花,而是让读者不用猜:图从哪里来、该怎么看、公式里每个位置是什么意思。

逐页审核口径

每一页都同时服务两类读者:初学者需要知道“这页在解决什么问题、前置是什么、公式怎么读”;工程师需要知道“这套方法怎样落到系统、指标、成本、边界和验收门禁”。补内容时优先补在读者卡住的位置,而不是在页首堆多个互相指向的提示框。

位置 初学者需要 工程师需要 审核动作
页面开头 主题定位、前置知识、不要误读什么 影响哪些设计决策或评测判断 保留一个定位块即可,相关入口放正文或表格
公式附近 符号逐项解释、变量/参数/条件分清 公式对应的接口、loss、latency、memory 或风险项 解释必须贴近公式,不放到很远的统一附录
图片附近 图里先看哪条箭头、坐标轴或模块 这张图能支持什么 claim,不能支持什么 复杂图要有图源和读图说明
难点段落 用直觉例子降低门槛 写清失败模式、profile 入口或上线门禁 只在真正容易误解处加解释,不连续堆框

全站持续扫描使用 make quality-hints。如果需要证明本轮确实扫到每一页,使用 python scripts/content_quality_report.py --include-hints --list-pages 输出逐页清单。

图片质量标准

论文图优先使用官方来源:论文 PDF、arXiv、OpenReview、官方项目页、官方仓库或作者发布材料。找不到官方源时不要用第三方截图临时顶替,先标记为待追溯。

检查项 合格标准 需要修复的表现
裁剪边界 只保留图本体和必要图内文字 截到论文正文、页脚、Figure caption,或裁掉坐标轴、图例、子图标签
清晰度 页面显示宽度不超过原图宽度,复杂图尽量保留高清原图 浏览器上采样导致糊字,或图内主文字明显小于正文
显示宽度 流程图/多面板图通常 860–920,小曲线 620–760,竖图用 .atlas-figure-tall / .atlas-figure-page 大图被压得字太小,或低清小图被放大
图源说明 图片附近有 <small>图源:...</small> 只贴图不标论文、Figure/Table 编号或官方来源
复杂图解释 结构图、系统图、多面板实验图、表格截图要有正文读法或图注里的“本站读法” 只说“原论文图意”,没有解释模块、横纵轴、颜色、箭头和 claim

裁剪优先级

裁剪时宁可多保留一点图内留白,也不要切掉坐标轴、子图编号、图例或模块标题。但论文页脚里的正文、Figure caption、页码、参考文献编号和下一张图的顶部都不应进入站内图片。站内会单独用 <small> 说明图源和图意,所以原论文 caption 不需要保留在截图内部。

如果一张图由多个子图构成,优先保留完整多面板关系;只有在页面内无法读清时,才把原图拆成子图,并在正文说明“这是从同一张官方 Figure 拆出的局部”。拆图后仍然要保留原始 Figure 编号,避免读者无法回到论文核对。

显示宽度优先级

图片显示宽度服务“读得清”,不是越大越好。浏览器把 700px 原图放到 920px 会让线条和文字变糊;把 2000px 的复杂系统图压到 500px 又会让图内文字小于正文。一般规则是:流程图、多面板实验图和系统架构图优先 860–920;曲线图、局部算法图和截图局部优先 620–760;竖版算法页、表格页和长流程图用 .atlas-figure-page.atlas-figure-tall,并依赖 lightbox 放大查看。

图源写法

图源说明要尽量可回查。推荐写法是:

1
<small>图源:[Paper Title](https://arxiv.org/abs/xxxx.xxxxx),Figure 3。原论文图意:一句话概括作者用这张图展示什么。</small>

如果图片来自官方项目页或官方仓库,不要硬写“原论文 Figure”。应写清“项目页截图”“官方仓库 README 图”或“技术报告 Figure”。如果图片是本站基于论文数字重绘的表格或示意图,也要写“基于某论文 Table/Figure 重绘”,不要伪装成原图。

未引用资产处理

make image-quality 报出的 unreferenced-asset 是治理队列,不是删除指令。默认保留历史资产,尤其是有明确论文、官方项目或 Wikimedia 来源的图片;本轮新增且确认被替换的重复文件,才可以进入人工删除候选。

未引用资产需要先进入 图片资产治理台账:记录文件路径、来源或潜在用途、建议动作。可复用候选不应为了降低数量而硬塞回页面;只有它能支撑正文判断、并且能补齐图源和图解时,才重新引用。

复杂图解释怎么写

复杂图解释不需要做成提示框,也不需要复述论文图注。它可以写进图注后的正文段落,优先回答四件事:

  1. 输入输出:图左边/上游进来的是什么,右边/下游产出的是什么。
  2. 关键模块:每个框、箭头、颜色、mask、分支在方法里承担什么角色。
  3. 支撑 claim:这张图能支持作者哪条主张,例如更省显存、更快推理、更稳训练或更高成功率。
  4. 不能证明什么:图不能外推到哪些结论,例如不能从架构图直接推出真实闭环成功率。

公式解释标准

公式不能只给名字,必须解释槽位。尤其是概率分布、损失函数和采样公式,读者需要知道每个位置分别代表变量、参数还是约束。

写法 必须说明
N(x;μ,Σ)\mathcal{N}(x;\mu,\Sigma) 第 1 个位置 xx 是被取值/采样/评分的变量;第 2 个位置 μ\mu 是均值;第 3 个位置 Σ\Sigma 是协方差
zN(0,I)z\sim\mathcal{N}(0,I) 左边 zz 已经说明变量;括号里的 00 是均值,II 是单位协方差
L(θ)=...\mathcal{L}(\theta)=... θ\theta 是被优化参数;每一项分别惩罚什么,权重或期望在哪个数据分布上取
pθ(yx)p_\theta(y\mid x) xx 是条件输入,yy 是被预测变量,θ\theta 是模型参数

一个合格的公式说明至少要做到:读者遮住公式名,也能从文字里还原“谁是变量、谁是参数、优化或采样发生在哪个对象上”。

审计命令

全站图片审计使用:

1
make image-quality

这个命令会检查本地图片是否存在、是否被浏览器上采样、是否可能截到多余文字、复杂图附近是否缺少解释,以及资产目录里是否有未引用图片。它还会输出 Asset governance 摘要,单独汇总远程图、本地化远程图和未引用资产分组;并在 /private/tmp/charles-ai-notes-image-quality/ 生成临时 contact sheet,方便人工快速扫一遍疑似问题。contact sheet 不是最终判断,只是把风险集中展示;真正修改前仍要打开原图确认。

内容质量和公式附近说明继续使用:

1
2
make quality
make quality-hints

其中 make quality-hints 会额外提示可能缺少上下文解释的 display formula 或公式密集行;这是人工复核队列,不是硬失败。补公式时优先让读者在公式前后看到“这行式子在说什么”和关键符号含义。

新增或替换论文图后,至少跑 make image-qualitymake build。如果改了公式或图解说明,也要顺手检查相邻段落:是否解释了变量槽位、是否说明了图能支持的 claim,以及是否写清不能外推的结论。

  • Title: 图片与公式质量标准
  • Author: Charles
  • Created at : 2026-04-27 09:00:00
  • Updated at : 2026-04-27 09:00:00
  • Link: https://charles2530.github.io/2026/04/27/ai-files-references-image-and-formula-quality-standard/
  • License: This work is licensed under CC BY-NC-SA 4.0.
Comments