GPT-4o mini震撼发布:中国团队清北同济三杰,引领AI技术新突破

OpenAI再次出击!他们最新推出了GPT-4o mini,被誉为“最经济适用”的小型模型。这不仅仅是一次模型升级,更像是智能革命的开端。GPT-4o mini在MMLU上的得分为82%,在LMSYS排行榜上的聊天偏好优于GPT-4,定价为每百万输入代币15美分,每百万输出代币60美分,比之前的Frontier模型便宜一个数量级,比GPT-3.5 Turbo便宜60%以上,两年内模型成本已降低99%。

IMG_256

目前,GPT-4o mini在API中支持文本和视觉,未来将支持文本、图像、视频和音频的输入和输出。它具有128K个token的上下文窗口,每个请求最多支持16K个输出token,并且拥有截至2023年10月的知识。

根据OpenAI官网信息,9位负责人中有三人来自国内:Shengjia Zhao,2022年加入,专注于ChatGPT训练和对齐,博士毕业于斯坦福大学,清华大学本科;Hongyu Ren,去年加入,负责语言模型训练,是GPT-4o的核心开发者,北大本科,斯坦福博士,曾在Apple、Google、NVIDIA和Microsoft实习;Haitang Hu,去年9月加入,曾在Google工作7年多,参与TensorFlow研发,同济大学本科,约翰·霍普金斯大学硕士。

IMG_257
在关键基准测试中,GPT-4o mini表现优异:推理任务得分82.0%,优于Gemini Flash(77.9%)和Claude Haiku(73.8%);数学和编码能力方面,数学推理得分87.0%,编码性能得分87.2%,均超越Gemini Flash和Claude Haiku;多模态推理评估得分59.4%,超过Gemini Flash(56.1%)和Claude Haiku(50.2%)。
IMG_258
实际上,华人,尤其是清华系,早已成为全球人工智能领域的中坚力量。OpenAI内的华人群体力量不容忽视。根据领英(LinkedIn)数据显示,OpenAI的1677名关联会员中,有23人毕业于清华大学,占比第九,超过了剑桥大学和耶鲁大学。在产品团队中,15人的Sora团队有4人来自中国;15人的Dall-E团队中有9位华人;ChatGPT团队至少有61名华人,占比约四分之一。
IMG_259

在大模型行业,人员流动性非常大,“潜力股”备受青睐。Sora的15人团队中,所有成员都有高新科技行业的任职经历。ChatGPT的83人团队中,81%来自外部公司(即“跳槽”而来)。整个OpenAI的“跳槽率”也非常高,反映了行业的高流动性。值得注意的是,美国大模型行业的人才更青睐具有创新潜力的公司,而非资金雄厚的大公司。

IMG_260
可以看见OpenAI的招聘主要是AI技术类,这也表明技术人才是稀缺的。同时也可以看到OpenAI也加入了小模型的竞争,OpenAI需要找到盈利方式,因为在处理器和基础设施上的花费巨大。OpenAI的API产品负责人Olivier Godement在接受采访时解释,未能更早推出“小而精”模型是因为优先级问题,公司专注于创建更大更好的模型,如GPT-4,投入了大量人力和资源。随着开发人员对较小模型的需求增加,OpenAI决定现在是开发GPT-4o Mini的时机。

© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容