Charles's Castle

This is Charles's Castle

Archives Photos Essays Friends

Charles

Lv8

Categories

558

Posts

论文专题讲解：Megatron-LM：Tensor Model Parallel 的大模型训练栈

论文题名： Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism。作者： Mohammad Shoeybi、Mostofa Patwary、Raul Puri、Patrick LeGresley、Ja
2025-10-13
AI

>

论文专题讲解
AI

| 基础知识

| 论文专题
Read more论文专题讲解：Megatron-LM：Tensor Model Parallel 的大模型训练栈
论文专题讲解：MagiAttention：超长上下文分布式 Attention

论文题名： MagiAttention: A Distributed Attention Towards Linear Scalability for Ultra-Long Context, Heterogeneous Mask Training。作者： SandAI。机构： SandAI。时间 / 主题： 20
2025-10-11
AI

>

论文专题讲解
AI

| 基础知识

| 论文专题
Read more论文专题讲解：MagiAttention：超长上下文分布式 Attention
论文专题讲解：Attn-QAT：4-bit Attention 量化感知训练

论文题名： Attn-QAT: 4-Bit Attention With Quantization-Aware Training。作者： Peiyuan Zhang、Matthew Noto、Wenxuan Tan、Chengquan Jiang、Will Lin、Wei Zhou、Hao Zhang。机构：未在
2025-10-10
AI

>

论文专题讲解
AI

| 基础知识

| 论文专题
Read more论文专题讲解：Attn-QAT：4-bit Attention 量化感知训练
论文专题讲解：Video Prediction Policy：预测视觉表征训练机器人策略

论文题名： Video Prediction Policy: A Generalist Robot Policy with Predictive Visual Representations。作者： Yucheng Hu、Yanjiang Guo、Pengchao Wang、Xiaoyu Chen、Yen-Jen W
2025-10-08
AI

>

论文专题讲解
AI

| 具身智能

| 论文专题
Read more论文专题讲解：Video Prediction Policy：预测视觉表征训练机器人策略
论文专题讲解：VGGT：一次前向推理怎样恢复相机、深度、点云与轨迹

论文题名： VGGT: Visual Geometry Grounded Transformer。作者： Jianyuan Wang、Minghao Chen、Nikita Karaev、Andrea Vedaldi、Christian Rupprecht、David Novotny。机构： Visual Geom
2025-10-06
AI

>

论文专题讲解
AI

| 具身智能

| 论文专题
Read more论文专题讲解：VGGT：一次前向推理怎样恢复相机、深度、点云与轨迹
论文专题讲解：SpatialVLA：3D 空间表征接入 VLA

论文题名： SpatialVLA: Exploring Spatial Representations for Visual-Language-Action Model。作者： Delin Qu、Haoming Song、Qizhi Chen、Yuanqi Yao、Xinyi Ye、Yan Ding、Zhigang
2025-10-04
AI

>

论文专题讲解
AI

| 具身智能

| 论文专题
Read more论文专题讲解：SpatialVLA：3D 空间表征接入 VLA
论文专题讲解：RT-2：把 web-scale VLM 变成会输出动作的 VLA

论文题名： RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control。作者： Anthony Brohan、Noah Brown、Justice Carbajal、Yevgen Chebotar、Xi Chen、Krzy
2025-10-03
AI

>

论文专题讲解
AI

| 多模态

| 具身智能
Read more论文专题讲解：RT-2：把 web-scale VLM 变成会输出动作的 VLA
论文专题讲解：π0.5：开放世界 VLA

论文题名： $ pi 0.5 $: a Vision-Language-Action Model with Open-World Generalization。作者： Physical Intelligence、Kevin Black、Noah Brown、James Darpinian、Karan Dhabalia
2025-10-01
AI

>

论文专题讲解
AI

| 具身智能

| 论文专题
Read more论文专题讲解：π0.5：开放世界 VLA
论文专题讲解：GR-3：少样本长时程 VLA

论文题名： GR-3 Technical Report。作者： Chilam Cheang、Sijin Chen、Zhongren Cui、Yingdong Hu、Liqun Huang、Tao Kong、Hang Li、Yifeng Li、Yuxiao Liu、Xiao Ma 等（共 21 人）。机构： Byte
2025-09-29
AI

>

论文专题讲解
AI

| 具身智能

| 论文专题
Read more论文专题讲解：GR-3：少样本长时程 VLA
论文专题讲解：GR-2：Web 视频知识怎样迁移到机器人操作

论文题名： GR-2: A Generative Video-Language-Action Model with Web-Scale Knowledge for Robot Manipulation。作者： Chi-Lam Cheang、Guangzeng Chen、Ya Jing、Tao Kong、Hang Li
2025-09-27
AI

>

论文专题讲解
AI

| 具身智能

| 论文专题
Read more论文专题讲解：GR-2：Web 视频知识怎样迁移到机器人操作

1…14 151617 18…56