GPT-4o mini震撼发布：中国团队清北同济三杰，引领AI技术新突破

OpenAI再次出击！他们最新推出了GPT-4o mini，被誉为“最经济适用”的小型模型。这不仅仅是一次模型升级，更像是智能革命的开端。GPT-4o mini在MMLU上的得分为82%，在LMSYS排行榜上的聊天偏好优于GPT-4，定价为每百万输入代币15美分，每百万输出代币60美分，比之前的Frontier模型便宜一个数量级，比GPT-3.5 Turbo便宜60%以上，两年内模型成本已降低99%。

目前，GPT-4o mini在API中支持文本和视觉，未来将支持文本、图像、视频和音频的输入和输出。它具有128K个token的上下文窗口，每个请求最多支持16K个输出token，并且拥有截至2023年10月的知识。

根据OpenAI官网信息，9位负责人中有三人来自国内：Shengjia Zhao，2022年加入，专注于ChatGPT训练和对齐，博士毕业于斯坦福大学，清华大学本科；Hongyu Ren，去年加入，负责语言模型训练，是GPT-4o的核心开发者，北大本科，斯坦福博士，曾在Apple、Google、NVIDIA和Microsoft实习；Haitang Hu，去年9月加入，曾在Google工作7年多，参与TensorFlow研发，同济大学本科，约翰·霍普金斯大学硕士。

在关键基准测试中，GPT-4o mini表现优异：推理任务得分82.0%，优于Gemini Flash（77.9%）和Claude Haiku（73.8%）；数学和编码能力方面，数学推理得分87.0%，编码性能得分87.2%，均超越Gemini Flash和Claude Haiku；多模态推理评估得分59.4%，超过Gemini Flash（56.1%）和Claude Haiku（50.2%）。

实际上，华人，尤其是清华系，早已成为全球人工智能领域的中坚力量。OpenAI内的华人群体力量不容忽视。根据领英（LinkedIn）数据显示，OpenAI的1677名关联会员中，有23人毕业于清华大学，占比第九，超过了剑桥大学和耶鲁大学。在产品团队中，15人的Sora团队有4人来自中国；15人的Dall-E团队中有9位华人；ChatGPT团队至少有61名华人，占比约四分之一。

在大模型行业，人员流动性非常大，“潜力股”备受青睐。Sora的15人团队中，所有成员都有高新科技行业的任职经历。ChatGPT的83人团队中，81%来自外部公司（即“跳槽”而来）。整个OpenAI的“跳槽率”也非常高，反映了行业的高流动性。值得注意的是，美国大模型行业的人才更青睐具有创新潜力的公司，而非资金雄厚的大公司。

可以看见OpenAI的招聘主要是AI技术类，这也表明技术人才是稀缺的。同时也可以看到OpenAI也加入了小模型的竞争，OpenAI需要找到盈利方式，因为在处理器和基础设施上的花费巨大。OpenAI的API产品负责人Olivier Godement在接受采访时解释，未能更早推出“小而精”模型是因为优先级问题，公司专注于创建更大更好的模型，如GPT-4，投入了大量人力和资源。随着开发人员对较小模型的需求增加，OpenAI决定现在是开发GPT-4o Mini的时机。

THE END

AI资讯