来源:智能涌现
访谈:周鑫雨 邓咏仪
文:周鑫雨
编辑:苏建勋?杨轩
时间来到ChatGPT引发中国AI热潮的第十个月。
每位熟知国内AI格局的投资人和猎头,脑海中已经有了一幅人才版图,如果你有机会和他们喝上一杯,畅快地聊聊天,大概会有这样的对话:
“头条的张前川去哪里了?”
“他被挖去了MiniMax。”
张前川,今日头条前用户产品负责人,2023年初离职后宣称将成立一家AI应用公司。不过,离职不久,张前川就加入了大模型创业公司MiniMax。据36氪获悉,MiniMax开出了相当可观的报酬。
“Seven 离职后创业了吗?”
“没有,她去了深言科技当产品负责人。”
Seven(王京津),2022年离职的抖音前产品负责人,近期入职了估值超1.5亿美金的AI创业公司深言科技。36氪了解到,在Seven正式加入前,深言邀请她做了半年顾问。
“还有什么值得关注的大牛吗?”
“有,Louis,相比前两位,他才是行业真正看重的人。”
Louis,阳陆育,前Musical.ly联合创始人,TikTok海外市场的奠基人。2022年中离开字节跳动后,一度去向成谜。今年6月,Louis携一家名叫“远光灯数字科技”的公司,躬身入局AIGC游戏赛道。
一名投资人对36氪评价:“只要Louis创业,我就要找他聊。如果他做AI,那更要聊。”
AI创业火热,但技术型创业,产品要研发、落地要试错,诸多不确定性里,人才,成了定价和交易的砝码,也是现阶段的大模型之争里,最重要的因素。
抢人的战火迅速点燃赛道。年初王慧文高调入局,王小川紧随其后,发AI“英雄帖”的创业大佬不下十人。
据多名高校出身的AI大牛回忆,以“二王”为代表的创业者,几乎把市面上所有AI人才聊了一遍。今年4月接受36氪专访时,听到光北京有20多家大模型企业,正忙于招团队的王小川问道:“你们能在文章里放上我们(百川智能)的招聘邮箱吗?”
泛科技领域里,AI属于成熟风口,人才不像室温超导那样扎堆在实验室,而是均匀分布在高校、机构、巨头。那些经验老道的投资人和猎头,早已在这十个月内,将AI人才们的title、过往履历和最新动向熟稔于心。
比如,想要挖到技术高管,免不了去一趟诞生ChatGPT的AI腹地:硅谷。
猎头Mia去硅谷前,在行李箱装了两罐精包装的西湖龙井和四瓶老干妈。抵达后,她要去Mountain View(山景城)的一家酒吧,用祖国的特产、再配上国内企业的offer和近千万元的年薪,请几名算法科学家回去。
在汇聚Google、微软等科技巨头的Mountain View,除了猎头,遇见寻觅AI人才的创投圈大佬,也不是一件难事。
有人在街头看到过穿着深色T恤的百度副总裁景鲲(他是百度“小度”系列智能产品的缔造者);在斯坦福大学的草坪和被誉为“西海岸华尔街”的沙丘路,走过源码资本合伙人黄云刚和真格基金管理合伙人戴雨森。
更近一点的5月初,王小川出现在硅谷一场AI技术party上。对着在场数十名华人工程师,王小川把自己“AI重塑搜索”的创业理想讲了一遍,试图和人才拉近关系——在36氪的专访中,他曾提及:“国内的大公司、高校里有一些不错的领军人物,一些更明星级的人才,确实在美国。”
帮国内创始人们与硅谷AI人才牵线,也成了一个商机。一名在硅谷的猎头记得,光3月份,Mountain View几乎每晚都有华人中介举办的party,报名参加光会费就达上万人民币,还要有门槛:成功创过业,或者投出过好项目。
企业们砸血本招人的同时,还得防止员工被挖角。
一家创业公司为了留住人才,给近十名核心员工涨了30%的薪水,几乎所有工程师在公司内部都用“花名”。
大公司也在警惕。百度宣布大语言模型“文心一言”立项当晚,参与成员被HR拉了个会,重新签了一遍竞业协议。
共识快速形成:人才储备最多的企业,离“中国的OpenAI”最近。
千万年薪,难挖硅谷人才
以如今AI人才的紧俏程度,Mia觉得千万级的年薪并不夸张。
在2023年第一季度,超过17万中国AI企业如雨后春笋般冒了出来。圈内人爱用一句话形容AI赛道的创业热:“光北京就有20多家声称能做大模型的企业。”
但相对的,是写在中国工信部报告中的30万AI人才缺口。再严苛一些,国内有过完整大模型工程经验的人能有多少?AI行业资深人才顾问海浪告诉36氪:“不超过100个人。”
若想要挖到能直接带上百人的团队跑工程的P9、P10,国内就只剩下大厂的几个CTO和首席科学家。“企业想要招技术高管,只能看硅谷。”海浪解释。
可惜的是,无论是茶叶、老干妈,还是一千万的高薪,都很难打动硅谷的人才。
一名研究员在Mia尚未给出薪酬条件时,就开门见山地拒绝:“老婆孩子都在这里,回国之后孩子的教育问题,也很难解决。”
再过一年多,微软必应团队的算法工程师Joshua就能如愿拿到美国绿卡。在他的人生蓝图里,再积攒两年工作经验,他就从华盛顿搬到硅谷创业。
他不愿离开硅谷——即便从今年2月起,求职软件上几乎每天都有99+的未读消息和通知红点。除了薪酬,Joshua还看到有公司开出隐形福利:前半年不背OKR。
被求职信息轰炸近一个月后,Joshua关闭了几个求职软件的弹窗。
抢人大战中,有成熟落地场景的企业,赢面会大一些。在Mia看来,落地场景就是企业的简历,更能吸引人才。
而落地方案尚未成熟的公司,要么有个像王慧文和王小川一样,“人能来事,又能搞钱”的创始人,要么靠“画饼”吸引人才。
但国内科研环境与硅谷的现实差距,让大模型创业者画的理想之“饼”,不那么有说服力。
在硅谷期间,Mia去了英特尔总部。在那里,每位算法工程师能调用的GPU就有四五百块。“但在国内,四五百张GPU往往是一个项目组能够申请到的算力上限。”Mia说。
类似的,谷歌AI实验室对人才的大方一度让蓝振忠觉得惊讶。在那里,他能够自由调用相当于几千张A100的TPU。就算在比较冷门的研究组,部门团建仍然开得起高级餐厅最贵的酒。
回国成立AI公司“西湖心辰”后,蓝振忠第一次感受到了算力资源的稀缺和昂贵:“公司和学校的科研经费只能买很少一部分,剩余的都得租公有云服务。”为了拉融资买算力,他每天需要和投资机构和客户开五六个电话会。
回国的硅谷创业者为资源焦虑,而去硅谷的创业者也屡屡碰壁。一位知名创业者曾在公开场合被问及近期的硅谷之行收获时,坦言自己去硅谷不是为了挖人,而是为了交流技术经验。
但一名与该创业者在硅谷交流过的人士告诉36氪:“别信他。因为挖人很难,大多数人过去,只能先建立个联系。”
Meta一开源,猎头白干半年
年初,AI技术大牛还是圈内最热的招徕对象。像ChatGPT一样参数千亿的大语言模型,仍然是个“舶来品”。对多数企业而言,想要做“中国OpenAI”,就必须大力招人搞技术。
然而不久后,意外发生了。
扇动翅膀的,是押注AI大模型已久的Meta(前Facebook)。2023年3月8日,被称为“最强开源模型”的大语言模型Llama遭到泄露,任何人都可以下载使用;7月,Llama的研发商Meta主动成为“搅局者”,开源了性能更强的Llama 2,几乎所有公司都能直接免费商用Llama 2。
Llama的开源,迅速降低了大模型训练的门槛。AI从业者们发现,根本没必要花这么多钱招技术人才从0训练模型。理论上,公司只要有足够多和高质数据,对Llama进行微调,就能用较低的成本训练出一个效果不错的模型。
很快,不少公司的大模型如雨后春笋般冒了出来,更甚者基于Llama微调后,就冠以“自研”之名。圈内广为流传的一句戏言是:如果Llama不“惨遭开源”,国内就没那么多的“自研”。
紧接着,技术领域的人才就开始“贬值”。
曾经想从硅谷挖人的几家企业,把自己的需求改成了从国内找工程师,年薪控制在40万元以内。猎头Mia在KTV点了一首《老子明天不上班》:“感觉自己上半年跑硅谷,最后白干。”
上半年,由于技术尚未成熟,大模型的商业化落地并不十分顺利。开源的Llama解决了卡脖子的大模型技术,也将AI企业发展的进度条从大炼模型,快速拉到应用落地。
相应的,企业们年初招徕技术人才的热情,在下半年一度转移到了产品经理。在Netflix最新发布的招聘启示中,AI产品经理的年薪开到了90万美元,超过了AI技术总监的65万美元。
不过,市场供需并非衡量顶级人才的唯一标尺,Icon(标志)级别的技术大牛热度仍然不减。
对企业来说,技术大牛不光是敲代码的员工,还是一个充满内涵的符号:技术人才,意味着技术的天花板,以及持续吸纳资方、客户和人才的门面。
昆仑万维CHO杨姝一直觉得,人才是AI公司最优质的资产。公司不仅需要基本功扎实的研发者,也需要一个名号响亮的Icon。就像乔布斯之于智能手机,“Icon和研发者的区别在于,Icon是有市场号召力的,还能吸引更牛的人才过来”。
2020年昆仑万维即布局AIGC和AGI领域,目前相关团队整体规模近千人。但到了2023年,为了争夺人才,杨姝和HR同事每周要沟通近百位候选人。最近,昆仑万维还请来了一位“Icon”——顶级AI科学家颜水成,出任天工智能联席CEO和昆仑万维2050全球研究院院长,吸引全球的AI人才。
“杨红霞博士来之前,我感觉市面上没什么人觉得字节能做大模型这件事。”一名大厂HR点评。
作为曾经阿里达摩院大模型M6的项目带头人,杨红霞在今年初转投字节跳动的AI阵营——这一消息也让不少人认为,字节有了和AI“老玩家”百度、阿里同桌竞技的可能。
至于花千万元挖一个技术大牛来做AI到底值不值,上述HR回复36氪:“在实现技术革新前,确保企业形象跟上时代潮流。”
所有人都在警惕泡沫
6月后,水温渐凉。钱在上半年,已经涌向了大模型的早期玩家。
据不完全统计,上半年融到钱的大模型企业大概有20多家,而6月后,数量骤减至不到1/2。
一名双币基金的AI投资人终止了四五家大模型企业的投资进程。她告诉36氪,近期他们只看AI应用。
可惜时至今日,AI赛道依然没有一款“杀手级”应用——市场和投资人都在观望,高开的大模型技术是否能持续高走,给予可观的回报。
“CV(计算机视觉领域)好歹也火了一两年,但大模型冷却的速度巨快。”海浪说,“今年大家只是看似拿了很多钱,其实背负了很大压力。”
与赛道一起降温的,还有企业对AI人才的热情。
年初的抢人热,更多的是企业们面对新技术的兴奋和FOMO(Fear of Missing Out,害怕错过)情绪。“大家也不管招这么多人有没有用,先把气氛炒起来。”年初Mia接到的需求,大多没有指明招募人才数量的范围,“一是挖人确实难,二是企业不知道挖多少人。”
精打细算后,企业们逐渐发现,人海战术、跑马圈地的互联网打法并不适用于大模型。
王慧文曾告诉36氪,他觉得搞大模型“人多了反而起负作用”,最小的建制只要30来人。今年7月,马斯克高调宣布入局大模型领域,新公司xAI只有12名成员。
△xAI的12名成员。图源:xAI官网
人海战术的反例是Meta——即便拥有Llama和OPT两支明星大模型团队,但由于算力资源分配的不平衡,目前超半数Llama作者选择了离职。
在资源紧俏的大模型领域,缩减人员规模既能如马斯克所说“提高人均可支配资源数量”,也能提高管理效率。王小川在媒体访谈中提到,管理过3000人的搜狗后,发现现在百川只有100、300人,非常容易把效率提上去。
更何况,大模型的研究是亟需才能和悟性的领域,人海战术收效甚微。
“一个聪明的大脑胜过万马千军。”智子引擎CEO高一钊告诉36氪,他们团队自研的多模态元乘象ChatImg 2.0,核心算法编写只用了不到5人。
当大模型人才的供需趋向平衡,企业对AI人才的急切之心,也迅速恢复平静。
“企业基本只要招一个厉害的CTO,或者个位数的技术带头人。”Mia近期接到的招人需求数量骤减。顶级人才的流动,在上半年的“热战”中基本已成定局,而模型团队中剩余的工程师,Mia发现只要用三四十万的年薪,并不难从国内外大厂或者高校计算机专业中挖到。
企业们对AI人才扩张的谨慎,更源于在视觉识别(简称CV)领域发生的那场人才扩张泡沫。
2018年,CV的风口吹起了AI四小龙。当时,估值飙升至60亿美元的高汤,一年内融了20多亿美元。
最后大部分融资都去了哪?答案是挖人。当时,即便是CV方向出身的应届毕业生,不少人年薪也能拿到60万元。
但很快,不少公司发现,CV没有太高的技术壁垒。AI企业To B、To G的业务,很快就被上游的云厂商蚕食。这几年四小龙的难处有目共睹,最早上市的商汤,在2022年每赚一块钱,就要净亏2块。
企业不得不让科学家背上营收指标。2020年以来,海浪能明显感到风向的变化,高校出身的教授变得不那么受欢迎,“大家更需要带过团队、做过产品的人”。一家想要智能化转型的物流企业说得更直接:“我们的钱是一个盒子一个盒子搬出来的,不是发论文发出来的。”
迫于营收压力,不少去大厂研究院的大牛,又回到了高校。海浪发现,此前帮大厂挖角的北美高校出身的华人科学家,重新开始以教授的身份发论文。
几乎所有企业都不希望人才泡沫再次产生。
Llama发布前,由于大模型是个高壁垒的新技术,企业给人才定的绩效并不具体,比如“年末前超越GPT-3.5,未来1-2年超越GPT-4”。但Llama把进度条快速拉到做应用的阶段,人才们的绩效,迅速指向了商业化。
赚钱成了首要指标。Mia下半年接到来自企业的不少需求,从挖人,变成了帮人才做项目管理。
一名硅谷出身的研究员对Mia诉苦:“(企业)不是说好给足空间做研究吗?怎么又要背营收?”Mia脑子转得飞快:“企业方觉得您有能力。”
2023年末,是不少企业和投资人检验人才价值的关键点。
“投资人和创始人都需要先看看,到年底花钱找来的人,能跑出什么东西,再决定是否继续入场。”海浪说。从给title的爽快程度,他能感受到今年企业的谨慎:2018年,帮技术大牛谈个T10、P10以上的岗位并不难。但今年,P9的职级都需要垫脚伸手够一够。
早上六七点起,游一小时的泳,紧接着去实验室工作到晚上9点,然后回去陪家人——这是在卡内基梅隆大学读博时蓝振忠的一天,“从不加班熬夜,也不把工作带回家”。
但在这轮热潮中,蓝振忠破了戒。这位技术老手、创业新手最近主动约见了不少投资人,从头学习管理和战略:“在终场来临前,努力让自己不被市场淘汰。”
(应受访者要求,文中海浪、Mia、Joshua为化名)