Charles's Castle

This is Charles's Castle

Archives Photos Essays Friends

Charles

Lv8

Categories

558

Posts

论文专题讲解：DreamerV2：离散世界模型玩 Atari

论文题名： Mastering Atari with Discrete World Models。作者： Danijar Hafner、Timothy Lillicrap、Mohammad Norouzi、Jimmy Ba。机构：未在公开元数据中稳定解析；以 arXiv/PDF 或官方页 affiliation
2025-11-16
AI

>

论文专题讲解
AI

| 世界模型

| 论文专题
Read more论文专题讲解：DreamerV2：离散世界模型玩 Atari
论文专题讲解：Dreamer：在 latent imagination 里训练 actor-critic

论文题名： Dream to Control: Learning Behaviors by Latent Imagination。作者： Danijar Hafner、Timothy Lillicrap、Jimmy Ba、Mohammad Norouzi。机构：未在公开元数据中稳定解析；以 arXiv/PDF 或
2025-11-15
AI

>

论文专题讲解
AI

| 世界模型

| 论文专题
Read more论文专题讲解：Dreamer：在 latent imagination 里训练 actor-critic
论文专题讲解：Qwen3.5-Omni：Thinker-Talker 与全模态 Agent

论文题名： Qwen3.5-Omni Technical Report。作者： Qwen Team。机构：未在公开元数据中稳定解析；以 arXiv/PDF 或官方页 affiliation block 为准。时间 / 主题： 2026-04；技术报告。 arXiv / 官方报告： arXiv：2604.1580
2025-11-13
AI

>

论文专题讲解
AI

| 推理

| 多模态
Read more论文专题讲解：Qwen3.5-Omni：Thinker-Talker 与全模态 Agent
论文专题讲解：Qwen3：Thinking 模式、36T 预训练与蒸馏

论文题名： Qwen3 Technical Report。作者： An Yang、Anfeng Li、Baosong Yang、Beichen Zhang、Binyuan Hui、Bo Zheng、Bowen Yu、Chang Gao、Chengen Huang、Chenxu Lv 等（共 60 人）。机构：未在
2025-11-11
AI

>

论文专题讲解
AI

| 论文专题

| 技术报告
Read more论文专题讲解：Qwen3：Thinking 模式、36T 预训练与蒸馏
论文专题讲解：Nemotron 3 Super：Mamba-MoE 与异步多环境 RL

论文题名： Nemotron 3 Super: Open, Efficient Mixture-of-Experts Hybrid Mamba-Transformer Model for Agentic Reasoning。作者： NVIDIA。机构： NVIDIA。时间 / 主题： 2026-04；技术报告。
2025-11-09
AI

>

论文专题讲解
AI

| 论文专题

| 强化学习
Read more论文专题讲解：Nemotron 3 Super：Mamba-MoE 与异步多环境 RL
论文专题讲解：Kimi K2：MuonClip、万亿 MoE 与 Agent 数据

论文题名： Kimi K2: Open Agentic Intelligence。作者： Kimi Team、Yifan Bai、Yiping Bao、Y. Charles、Cheng Chen、Guanduo Chen、Haiting Chen、Huarong Chen、Jiahao Chen、Ningxin Ch
2025-11-08
AI

>

论文专题讲解
AI

| 推理

| 数据与评测
Read more论文专题讲解：Kimi K2：MuonClip、万亿 MoE 与 Agent 数据
论文专题讲解：GPT-4o System Card：Omni 安全与多模态评测

论文题名： GPT-4o System Card。作者： OpenAI。机构： OpenAI。时间 / 主题： 2024-08；技术报告。 arXiv / 官方报告： arXiv：未找到专门条目；官方材料：openai.com/index/gpt-4o-system-card/。 GitHub / 项目： Git
2025-11-06
AI

>

论文专题讲解
AI

| 多模态

| 数据与评测
Read more论文专题讲解：GPT-4o System Card：Omni 安全与多模态评测
论文专题讲解：Gemini 2.5：动态 Thinking 与长上下文 Agent

论文题名： Gemini 2.5: Pushing the Frontier with Advanced Reasoning, Multimodality, Long Context, and Next Generation Agentic Capabilities。作者： Gemini Team。机构： Goog
2025-11-04
AI

>

论文专题讲解
AI

| 推理

| 论文专题
Read more论文专题讲解：Gemini 2.5：动态 Thinking 与长上下文 Agent
论文专题讲解：DeepSeek-V4：百万上下文与 FP4 后训练

论文题名： DeepSeek-V4: Towards Highly Efficient Million-Token Context Intelligence。作者： DeepSeek-AI。机构： DeepSeek-AI。时间 / 主题： 2026-05；技术报告。 arXiv / 官方报告： arXiv：未找到
2025-11-03
AI

>

论文专题讲解
AI

| 量化

| 论文专题
Read more论文专题讲解：DeepSeek-V4：百万上下文与 FP4 后训练
论文专题讲解：DeepSeek-V3：671B MoE、MLA 与 FP8 训练

论文题名： DeepSeek-V3 Technical Report。作者： DeepSeek-AI、Aixin Liu、Bei Feng、Bing Xue、Bingxuan Wang、Bochao Wu、Chengda Lu、Chenggang Zhao、Chengqi Deng、Chenyu Zhang 等（共
2025-11-01
AI

>

论文专题讲解
AI

| 量化

| 论文专题
Read more论文专题讲解：DeepSeek-V3：671B MoE、MLA 与 FP8 训练

1…12 131415 16…56