原阿里千问后训练核心郁博文离职后火速加盟字节Seed多模态布局再添强援-行业-智快网

原阿里千问后训练核心郁博文离职后火速加盟字节Seed多模态布局再添强援

发布时间：2026-03-12 09:49 来源：天脉网作者：朱天宇

近日，科技行业传来一则重磅人事变动消息：原阿里巴巴通义实验室Qwen（千问）大模型后训练负责人郁博文，已正式加入字节跳动，担任Seed团队视觉模型与多模态交互团队后训练负责人。这一变动引发了业界对大模型技术发展路径的广泛关注。

郁博文在学术领域有着深厚的积累。他本科就读于中南大学，之后在中国科学院信息工程研究所攻读研究生，并于2022年获得中国科学院大学博士学位。读研期间，他专注于自然语言处理与信息抽取领域的研究，在ACL、EMNLP等国际顶级学术会议上发表过多篇论文。他创新性地提出将信息抽取任务转化为图结构问题，有效解决了实体重叠、嵌套等复杂场景下的识别难题，凭借这些突出成果，他荣获了中国科学院院长奖。

2022年博士毕业后，郁博文以阿里集团最高级别校招项目“阿里星”的身份加入阿里巴巴达摩院，担任算法专家（P7）。入职初期，他就深度参与了通义千问大模型的早期训练与研发工作，凭借出色的能力迅速成长为千问团队的核心骨干，并最终担任后训练负责人。

在后训练岗位上，郁博文成绩斐然。他主导了Qwen系列Chat模型的研发，运用监督微调（SFT）、强化学习（RLHF）、直接偏好优化（DPO）等技术，成功将通用大模型转化为符合人类价值观和使用习惯的对话模型。针对不同规模的模型，他设计了“四阶段进化论”和“知识蒸馏”策略，使得Qwen模型在长文本生成、复杂推理及多模态理解等任务上表现出色。在LMSYS Chatbot Arena等全球权威评测中，Qwen系列多次进入前十名。

然而，2026年3月，阿里通义实验室启动了组织架构调整，计划将原本垂直整合的Qwen团队拆分为预训练、后训练、文本、多模态等多个平行模块。这一调整使得郁博文的管理范围大幅缩小，而且与他坚持的“预训练与后训练必须深度耦合”的技术理念产生了冲突。阿里高层对千问团队施加的商业化考核压力，也进一步加剧了团队内部的分歧。

2026年3月3日，郁博文提交了辞职申请，并于次日正式离职。他的工作由前Google DeepMind高级资深研究员周浩接任。

字节Seed团队近年来在大模型和多模态领域持续投入资源、积极布局。郁博文的加入，无疑将为该团队在视觉与多模态交互方面的后训练能力带来显著提升，进一步推动字节在AI领域的发展。业界普遍认为，这一人事变动可能会引发大模型技术领域的新一轮竞争与合作格局的变化。

更多>同类内容

原阿里千问后训练核心郁博文离职后火速加盟 字节Seed多模态布局再添强援

原阿里千问后训练核心郁博文离职后火速加盟字节Seed多模态布局再添强援