Charles's Castle
Charles's Castle
HOME
CATEGORIES
TAGS
ABOUT
ME
GITHUB
BLOG
STATISTICS
HOME
CATEGORIES
TAGS
ABOUT
ME
GITHUB
BLOG
STATISTICS
Archives
Photos
Essays
Friends
45
Tags
93
Categories
487
Posts
多模态
2026
12
VLM/VLA:世界模型高效训练接口
VLM/VLA:视觉 Tokenizer、连接器与信息瓶颈
VLM/VLA:视频表征、状态记忆与长时序压缩
VLM/VLA:多模态评测与失败模式
VLM/VLA:架构:视觉表征、连接器与记忆
VLM/VLA:部署与安全
VLM/VLA:数据与策略学习
VLM/VLA:闭环恢复与失败分析
VLM/VLA:评测与数据引擎
VLM/VLA:动作表示与控制接口
VLM/VLA:动作分块、层级策略与潜在技能
量化:多模态与 VLA 模型量化
2025
4
论文专题讲解:Qwen3.5-Omni:Thinker-Talker 与全模态 Agent
论文专题讲解:GPT-4o System Card:Omni 安全与多模态评测
基础知识:多模态推理入门
扩散模型:视频与多模态扩散
1
EXIF
EXIF