图片与公式质量标准
这页记录全站维护论文图和数学公式时的最低标准。目标不是把页面做得更花,而是让读者不用猜:图从哪里来、该怎么看、公式里每个位置是什么意思。
逐页审核口径
每一页都同时服务两类读者:初学者需要知道“这页在解决什么问题、前置是什么、公式怎么读”;工程师需要知道“这套方法怎样落到系统、指标、成本、边界和验收门禁”。补内容时优先补在读者卡住的位置,而不是在页首堆多个互相指向的提示框。
| 位置 | 初学者需要 | 工程师需要 | 审核动作 |
|---|---|---|---|
| 页面开头 | 主题定位、前置知识、不要误读什么 | 影响哪些设计决策或评测判断 | 保留一个定位块即可,相关入口放正文或表格 |
| 公式附近 | 符号逐项解释、变量/参数/条件分清 | 公式对应的接口、loss、latency、memory 或风险项 | 解释必须贴近公式,不放到很远的统一附录 |
| 图片附近 | 图里先看哪条箭头、坐标轴或模块 | 这张图能支持什么 claim,不能支持什么 | 复杂图要有图源和读图说明 |
| 难点段落 | 用直觉例子降低门槛 | 写清失败模式、profile 入口或上线门禁 | 只在真正容易误解处加解释,不连续堆框 |
全站持续扫描使用 make quality-hints。如果需要证明本轮确实扫到每一页,使用 python scripts/content_quality_report.py --include-hints --list-pages 输出逐页清单。
图片质量标准
论文图优先使用官方来源:论文 PDF、arXiv、OpenReview、官方项目页、官方仓库或作者发布材料。找不到官方源时不要用第三方截图临时顶替,先标记为待追溯。
| 检查项 | 合格标准 | 需要修复的表现 |
|---|---|---|
| 裁剪边界 | 只保留图本体和必要图内文字 | 截到论文正文、页脚、Figure caption,或裁掉坐标轴、图例、子图标签 |
| 清晰度 | 页面显示宽度不超过原图宽度,复杂图尽量保留高清原图 | 浏览器上采样导致糊字,或图内主文字明显小于正文 |
| 显示宽度 | 流程图/多面板图通常 860–920,小曲线 620–760,竖图用 .atlas-figure-tall / .atlas-figure-page |
大图被压得字太小,或低清小图被放大 |
| 图源说明 | 图片附近有 <small>图源:...</small> |
只贴图不标论文、Figure/Table 编号或官方来源 |
| 复杂图解释 | 结构图、系统图、多面板实验图、表格截图要有正文读法或图注里的“本站读法” | 只说“原论文图意”,没有解释模块、横纵轴、颜色、箭头和 claim |
裁剪优先级
裁剪时宁可多保留一点图内留白,也不要切掉坐标轴、子图编号、图例或模块标题。但论文页脚里的正文、Figure caption、页码、参考文献编号和下一张图的顶部都不应进入站内图片。站内会单独用 <small> 说明图源和图意,所以原论文 caption 不需要保留在截图内部。
如果一张图由多个子图构成,优先保留完整多面板关系;只有在页面内无法读清时,才把原图拆成子图,并在正文说明“这是从同一张官方 Figure 拆出的局部”。拆图后仍然要保留原始 Figure 编号,避免读者无法回到论文核对。
显示宽度优先级
图片显示宽度服务“读得清”,不是越大越好。浏览器把 700px 原图放到 920px 会让线条和文字变糊;把 2000px 的复杂系统图压到 500px 又会让图内文字小于正文。一般规则是:流程图、多面板实验图和系统架构图优先 860–920;曲线图、局部算法图和截图局部优先 620–760;竖版算法页、表格页和长流程图用 .atlas-figure-page 或 .atlas-figure-tall,并依赖 lightbox 放大查看。
图源写法
图源说明要尽量可回查。推荐写法是:
1 | <small>图源:[Paper Title](https://arxiv.org/abs/xxxx.xxxxx),Figure 3。原论文图意:一句话概括作者用这张图展示什么。</small> |
如果图片来自官方项目页或官方仓库,不要硬写“原论文 Figure”。应写清“项目页截图”“官方仓库 README 图”或“技术报告 Figure”。如果图片是本站基于论文数字重绘的表格或示意图,也要写“基于某论文 Table/Figure 重绘”,不要伪装成原图。
未引用资产处理
make image-quality 报出的 unreferenced-asset 是治理队列,不是删除指令。默认保留历史资产,尤其是有明确论文、官方项目或 Wikimedia 来源的图片;本轮新增且确认被替换的重复文件,才可以进入人工删除候选。
未引用资产需要先进入 图片资产治理台账:记录文件路径、来源或潜在用途、建议动作。可复用候选不应为了降低数量而硬塞回页面;只有它能支撑正文判断、并且能补齐图源和图解时,才重新引用。
复杂图解释怎么写
复杂图解释不需要做成提示框,也不需要复述论文图注。它可以写进图注后的正文段落,优先回答四件事:
- 输入输出:图左边/上游进来的是什么,右边/下游产出的是什么。
- 关键模块:每个框、箭头、颜色、mask、分支在方法里承担什么角色。
- 支撑 claim:这张图能支持作者哪条主张,例如更省显存、更快推理、更稳训练或更高成功率。
- 不能证明什么:图不能外推到哪些结论,例如不能从架构图直接推出真实闭环成功率。
公式解释标准
公式不能只给名字,必须解释槽位。尤其是概率分布、损失函数和采样公式,读者需要知道每个位置分别代表变量、参数还是约束。
| 写法 | 必须说明 |
|---|---|
| 第 1 个位置 是被取值/采样/评分的变量;第 2 个位置 是均值;第 3 个位置 是协方差 | |
| 左边 已经说明变量;括号里的 是均值, 是单位协方差 | |
| 是被优化参数;每一项分别惩罚什么,权重或期望在哪个数据分布上取 | |
| 是条件输入, 是被预测变量, 是模型参数 |
一个合格的公式说明至少要做到:读者遮住公式名,也能从文字里还原“谁是变量、谁是参数、优化或采样发生在哪个对象上”。
审计命令
全站图片审计使用:
1 | make image-quality |
这个命令会检查本地图片是否存在、是否被浏览器上采样、是否可能截到多余文字、复杂图附近是否缺少解释,以及资产目录里是否有未引用图片。它还会输出 Asset governance 摘要,单独汇总远程图、本地化远程图和未引用资产分组;并在 /private/tmp/charles-ai-notes-image-quality/ 生成临时 contact sheet,方便人工快速扫一遍疑似问题。contact sheet 不是最终判断,只是把风险集中展示;真正修改前仍要打开原图确认。
内容质量和公式附近说明继续使用:
1 | make quality |
其中 make quality-hints 会额外提示可能缺少上下文解释的 display formula 或公式密集行;这是人工复核队列,不是硬失败。补公式时优先让读者在公式前后看到“这行式子在说什么”和关键符号含义。
新增或替换论文图后,至少跑 make image-quality 和 make build。如果改了公式或图解说明,也要顺手检查相邻段落:是否解释了变量槽位、是否说明了图能支持的 claim,以及是否写清不能外推的结论。
- Title: 图片与公式质量标准
- Author: Charles
- Created at : 2026-04-27 09:00:00
- Updated at : 2026-04-27 09:00:00
- Link: https://charles2530.github.io/2026/04/27/ai-files-references-image-and-formula-quality-standard/
- License: This work is licensed under CC BY-NC-SA 4.0.