本文来自微信公众号“量子位”(ID:QbitAI),作者:白交 衡宇。
GPT-4o亮相没两天,背后Omni团队就被扒了个底朝天:
领衔者,是DALL·E2/3研究团队成员、ScalingLaw共同提出者。
更深层次的,团队组成和Sora有着类似的规律:不怕启用新人,并且狠狠重任新人。
这里的“新人”,可能是本科or硕博刚毕业的应届生,也可能是刚加入OpenAI的新成员。
恰如其时的,思维链作者、从谷歌跳槽OpenAI的Jason Wei跳出来,分享了公司内部派活儿的原则:
派给你的活,绝不与你的职级挂钩。
换句话说,即使是初级工程师,只要有想法,就可能被OpenAI委任承担大项目。
而且任命前的评判纯粹根据员工执行表现来,而不是考虑过去这人有过啥优秀业绩。
Jason Wei说,他在OpenAI见过几位毕业不久的工程师,在内部揽了一个重要的大活,他那时候心想,“哇,要是谷歌,这不得让L8/L9的员工来搞?”
好一个任人唯贤!
网友看后感慨万千,感慨OpenAI这样独角兽中的超级独角兽,就是需要这股子劲。
给这样的团队2-3年,你会看到他们带来的惊艳表现。
具体情况,咱们来扒一扒就清楚了——做出伟大产品的年轻团队们
本次吃瓜活动,就从最近万众瞩目的GPT-4o背后团队(以下简称Omni团队)下手吧。
Omni团队负责人,印度小哥Prafulla Dhariwal(下面我们叫他PD哥)。
你可能不咋熟悉他的名字,但一说他的前作你大概率都认识:DALL·E2、DALL·E3、一致性模型,还共同提出了Scaling Law。
谷歌学术显示,这哥的论文引用次数超过了72500次,还在不断上升中。
想当初,PD哥是以本科毕业生的身份加入OpenAI的,虽然这个本科是MIT(手动狗头)。
他在MIT主攻计算机科学、数学、物理学,并在MIT大脑、思维和机器中心担任本科生研究员。
据PD哥自我介绍,本科毕业前,他就已经在成立不到1年的OpenAI实习了,然后2017年毕业后正式转正。
我们整理发现,入职前半年,他就参与了Openai baselines的团队项目。
然后次年成为了Glow的共同作者,接下来更是共同提出Scaling Law,参与研究DALL-E2、DALL-E3、一致性模型等等等等。
过去的18个月里,他领衔了GPT-4o的工作。
项目面世后奥特曼狂赞他,说如果没有PD哥的远见,以及长期以来才智、信念和决心,就没有GPT-4o。
OpenAI总裁Greg Brockman也说,多亏PD哥“建立全能大模型”的信念,团队才最终搞定了GPT-4o。
夸得太卖力,一下就把PD哥推到了聚光灯下。
△GPT-4o项目负责人Prafulla Dhariwal
PD哥自己在推特表示,GPT-4o是他们团队推出的第一个模型,也是OpenAI首个原生多模态大模型。
经由PD哥在推特对团队在线点名致谢,我们发现Omni团队里有6位(疑似)华人面孔。
Yu Zhang:加入OpenAI8个月;此前在Google DeepMind工作6年。他本科毕业于上海交通大学计算机专业。
Huiwen Chang:加入OpenAI1年;此前在Google呆过5年。她的学士学位是在清华大学姚班取得的。
Li Jing:加入OpenAI2年,曾是Dall-E3、Sora团队成员。本次负责保障GPT-4o的图像生成、3D生成的能力。本科时,Jing在北大获得物理学学士学位。
Jiahui Yu:加入OpenAI3年8个月,现带领OpenAI感知团队;入职前参与过Google的Gemini、PaLM2项目。Yu本科时就读于中国科技大学少年班,学习计算机。
Casey Chu:加入OpenAI已有4年,参与过GPT-4、DALL・E2的研究。
Mark Chen:加入OpenAI5年8个月,现任前沿研究主管,曾参与过DALL・E、GPT-4等项目。
当然,Omni团队背后还有大批共同参与者的努力。但就从上述几个人的资料来看,里面既有老手,也有OpenAI新来的员工,并不会因为司龄低,就不给派重要的活。
为了佐证这一点,我们又往前再扒了扒,看看之前的项目是否如此。
看看今年春节发布的Sora。
Sora由两位博士应届生带队研究,这可称为佐证Jason Wei分享的OpenAI用人秘籍的典范材料。
两位负责人,Tim Brooks和William (Bill) Peebles都是2023年刚刚博士毕业,团队里甚至还有00后成员。
其中,Tim是DALL-E3作者之一,而William (Bill) Peebles则和谢赛宁合作,搞出了Sora的技术基础之一DiT。
看看2020年发布的Jukebox。
这是一个在原始音频域中通过唱歌产生音乐的模型,参与人员就有我们刚入职没两年的PD哥。
当初没掀起什么水花,但着实为现在的GPT-4o培养了音频人才,成为了OpenAI奔赴「Her愿景」的基石之一。
看看2018年发布的GPT-1。
一切故事都开始都源于万神之源《Attention is All You Need》论文的出现。论文发表当天,OpenAI刚刚离职的前首席科学家Ilya Sutskever,就意识到“它给了我们想要的一切”。
然后建议同事Alec Radford开始动手研究——彼时距离Alec加入OpenAI才不到2年,也是个本科生。
结果就是,Radford开发了GPT的原型,然后OpenAI调动更多人从机器人、DOTA游戏等项目转型,参与进来开发了GPT-1、GPT-2……
OpenAI沿着这位本科生主导的佳作,开创了今日盛世。 OpenAI原来是这样
不只是成员履历,其实从OpenAI的组织架构上,就能感知到他们这种任人唯贤的扁平化管理方法。
最明显的是,OpenAI的研究员,大家都叫Member of Technical Staff,没有啥称呼上的差异。
怪不得有网友调侃,OpenAI说初级工程师也能抗大活,但可能你们就没有初级工程师啊……
Greg曾透露,他们曾认真考虑用哪种职位名称,因为不想简单将他们归为研究人员和工程师。
“Member of Technical Staff”这一说法继承自施乐帕克研究中心Alan Kay的建议。
而且整个OpenAI的部门划分也没有很精细,只有数据科学、研究、安全等几个大部门。
但其实不管GPT-4、DALL·E、Sora还是最新的GPT-4o,全部都是项目制的。
整个团队从各个部门抽人组建,搭伙干活。
讲道理,在OpenAI,项目归属感可能比部门归属感更强。
除了OpenAI,现在很多科技公司和领导人,包括像马斯克xAI在内也都在按这套方法在搞。
现在,随着Omni团队的揭秘,关于OpenAI组织架构和评判标准再次被讨论。
有网友对这种方式表示赞赏,“也是为什么我确信创始团队是应届毕业生的新出路”。
当前的市场环境下,这是满足这种雄心壮志的最佳途径,在传统稳定领域想要获得指导和成长变得十分艰难。
就像Jason Wei所说,据他观察,一般大公司会对项目有一个隐隐的期望,所以会按职级划分工作内容,项目一般都是自上而下分配的。
重要项目通常派给此前工作表现突出的“值得信赖的”L7或L8,这能保证团队有组织、高可靠性地完成工作。
但是对于一个等待大展拳脚的初级工程师来说,想要他遵守一些无关痛痒的条条框框?
不可能,绝对不可能。指望我把活干好不就完事儿了!
虽然这也是许多公司在初创期的通用做法,但事情因OpenAI这次发布Gpt-4o再次曝光后,更多网友开始触景生情,破防了!
顺便再蛐蛐一下自家公司的成长体系:
别说了,羡慕。 网友自曝其他大厂不这样
一位曾在微软工作的“独立黑客”自述了此前一段伤心经历。
他本来负责一个十分具有挑战性的功能,已经做了所有前期工作,也得到设计部门的认可。但随后就被要求交给一个高级工程师。因为这个工作不符合“职级要求”。
微软的管理者都精于算计(象棋高手),他们晋升的人选都是事先决定好的,合适的项目会分配给那个人,以证明晋升的合理性。
来自谷歌的现员工和前员工们也表示,谷歌在这方面确实做的很糟糕,就是在Gemini时代也没有改善。
初级企业的层级结构扁平化,可以有更大的创新空间。
因此也有人在警示OpenAI“在这方面需要加强很多工作”,有前车之鉴在此。
这样的警示并非没有依据。
事实上如今OpenAI飞速发展,人才规模迅速扩展,已经开始出现一丝丝不好的“苗头”。
ChatGPT发布会之后,OpenAI一度成为全球AI人才向往的圣地。包括像斯坦福、MIT等顶尖学术机构,微软、谷歌等顶级大厂的人才涌入。
但这当中,有不少研究类人才来了没过多久又走了,留不住。
典型如OpenAI创始成员、前特斯拉AI总监Andrej Karpathy,2023年ChatGPT发布后二进宫;又在一年之后再次离开,如今正在秘密开发一个项目。
还有又回到谷歌担任DeepMind研究科学家的Shane Gu,仅仅只在OpenAI待了7个月,其中带领团队进入了日本市场。在此之前他曾在谷歌待了四年。
2022年5月Shane Gu参与的研究发现,只要加上一句“让我们一步一步地思考”就能让GPT-3做数学题的准确率暴涨61%,引发学术界轰动。
还有其中DeepMind老员工Jack Rae,曾就压缩即智能在Stanford MLSys Seminar发表演讲。
此前在OpenAI工作一年多时间,今年7月份从OpenAI跳回到谷歌,他可能是唯一一位对GPT-4和Gemini都有贡献的人类了。
现在OpenAI掀起新一波离职潮,且大部分都是技术团队的人才,甚至随着灵魂人物、首席科学家Ilya官宣离职而加剧,超级对齐团队负责人也紧随其后辞职。
而另一面,关于产品、营销方面的人员加入。最新消息,他们还挖来了谷歌搜索广告业务的21年老将。
再加上,如今频繁的产品级更新、搜索引擎的布局以及同苹果Siri的合作……更多商业化操作不一而足,OpenAI和奥特曼的野心由此可见。
在这样的情况之下,OpenAI是否还能持续保持领先?
一起来评论区讨论讨论呗~