马千里

(+86)17855801919 Fazzie17855801919 fazzie@qq.com
370+ followers fazzie-key.cool QianliMa Google Scholar fazzie

教育背景


新加坡国立大学 硕士
2022.8 - 2024.1
浙江大学 本科
2018.9 - 2022.7

工作经历


字节跳动(ByteDance)   Seed
2023.12 - 2025.12
  大模型训练研究员&&多模态训练框架负责人
上海

作为 Seed 团队最早期成员之一,聚焦于大语言模型与多模态基础模型的 AI Infra 和大规模训练系统,覆盖 pre-train 到 post-train 全链路。 从 Seed 第一代模型开始,参与万卡集群训练。 带领团队建设字节多模态训练系统 VeOmni,并深度参与 Seed 1.5Seed 2.0 核心模型系列,以及 UI-TARS 系列 GUI Agent 模型的研发。

 项目亮点
字节跳动(ByteDance)  AML
2023.6 - 2023.12
 大模型算法实习生
上海

参与 LLM post-training 与 Agent 研究,相关工作直接产出了 Process Reward Model、SFT 数据选择和数据分析 Agent 三个方向的论文成果。

潞晨科技(HPC-AI Technology)
2022.7 - 2023.5
 机器学习系统工程师
新加坡

作为早期员工参与公司从 Seed 到 A 轮的发展,负责大模型系统与开源产品研发。

商汤科技(SenseTime)   研究院   模型训练
2021.12 - 2022.6
 见习算法研究员
杭州

参与商汤早期 Megatron 大模型训练框架的开发。

华为2012实验室(Huawei 2012 Lab)  分布式并行实验室
2021.7 - 2021.12
 算法工程实习生
杭州

参与 MindSporeMindSpore Lite 端侧 GPU 推理与运行时基础设施开发。

文章


比赛和项目经历


PokemonGAI
  • Pokemon GAI是一个基于生成式AI的AI native应用, 使用了最新的AI native 框架比如Langchain, Huggingface Space, FastAPI

知识储备和专业技能


  • 编程语言:熟悉C、C++,Python;了解go,java,javascript,html等语言
  • AI全栈
    • 熟悉深度神经网络的常用技术和算法原理, 熟悉Stable Diffusion, InstructGPT, Alphafold, LLama等前沿大模型
    • 熟悉指令微调, RLHF, Prompt Learning, Task Planning等前沿大语言模型技术
    • 精通Pytorch、Mindspore, Pytorch-lightning等深度学习框架
    • 精通ColossalAI,DeepSpeed,Ray, Megatron-LM等大模型分布式训练框架进行显存优化,张量并行,分布式训练,异构计算
    • 精通端侧AI推理框架Mindsporelite及其源码; 了解MNN,TensorRT,OpenVino等推理框架
    • 熟悉使用OpenCL,Cuda进行GPU编程,算子融合;了解AI编译
  • 其他工具:Linux,Git,Vim,Shell,Cmake,Docker
  • 外语水平:雅思6.5,六级573