工作经历
字节跳动(ByteDance)   Seed
2023.12 - 2025.12
  大模型训练研究员&&多模态训练框架负责人
上海
作为 Seed 团队最早期成员之一,聚焦于大语言模型与多模态基础模型的 AI Infra 和大规模训练系统,覆盖 pre-train 到 post-train 全链路。
从 Seed 第一代模型开始,参与万卡集群训练。
带领团队建设字节多模态训练系统 VeOmni,并深度参与 Seed 1.5 到 Seed 2.0 核心模型系列,以及 UI-TARS 系列 GUI Agent 模型的研发。
- VeOmni:主导 PyTorch Native 多模态训练系统研发,支持 pre-training / post-training,并服务于 Seed 核心模型与 UI-TARS 等项目。
- 核心模型研发:参与 Seed 1.5 到 Seed 2.0 核心模型系列研发,覆盖推理模型与多模态模型等主要方向。
- UI-TARS 系列:参与 UI-TARS 原生 GUI Agent 模型家族背后的研究与系统基础设施建设。
- 开源系统:参与 veScale 与 verl,支持分布式 LLM 训练与 RL post-training。
字节跳动(ByteDance)  AML
2023.6 - 2023.12
参与 LLM post-training 与 Agent 研究,相关工作直接产出了 Process Reward Model、SFT 数据选择和数据分析 Agent 三个方向的论文成果。
- Process Reward Modeling:构建 step-level reward model 的数据处理、训练和评测全流程,产出论文 Let's Reward Step by Step: Step-Level Reward Model as the Navigators for Reasoning。
- SFT Data Selection:共同提出 DavIR,通过模型中心的数据选择方法,用 6% 的 Alpaca 数据超过全量训练效果,后发表于 ACL 2025。
- Agent for Data Analysis:构建 InfiAgent-DABench,包括 benchmark、agent infra 与评测流水线,后发表于 ICML 2024。
潞晨科技(HPC-AI Technology)
2022.7 - 2023.5
作为早期员工参与公司从 Seed 到 A 轮的发展,负责大模型系统与开源产品研发。
- ColossalAI 核心开发者,参与异构显存管理、流水线并行和分布式 checkpoint 等能力建设。
- 主导 ColossalChat 开发,负责指令数据处理、分布式训练与 Coati 7B/13B 对齐训练。
- 主导 ColoDiffusion,构建面向大 batch 训练的高效 Diffusion 训练方案。
- 推动 ColossalAI 从 0 增长到 20k+ GitHub stars,并参与相关开源社区建设。
- 技术栈: Python, C++, CUDA, PyTorch, Ray, ColossalAI, PyTorch Lightning, TensorRT, DeepSpeed, Hugging Face
商汤科技(SenseTime)   研究院   模型训练
2021.12 - 2022.6
参与商汤早期 Megatron 大模型训练框架的开发。
华为2012实验室(Huawei 2012 Lab)  分布式并行实验室
2021.7 - 2021.12
参与 MindSpore 与 MindSpore Lite 端侧 GPU 推理与运行时基础设施开发。