缝隙中的英伟达我国|深氪lite

liukang20241周前吃瓜科普582

作者 | 杨逍

夹缝中的英伟达中国|深氪lite的视图

修改 | 苏建勋 杨轩

穿戴大花袄,转着红手绢,入乡随俗的英伟达CEO黄仁勋脱下他标志性的黑色皮衣,在全体上海职工的哄闹中,跳起了东北大秧歌。这是时隔4年,黄仁勋再度莅临英伟达我国年会。

在英伟达内部,黄仁勋此次“访华”是高度机密,“当主持人说有请咱们最密切的家人后,许多人都在猜想是谁”, 英伟达内部职工告知36氪,“直到老黄呈现,全场欢腾,完全没想到他会来。”

黄仁勋在年会上扭秧歌(来自网络截图)

英伟达的职工大多视黄仁勋为偶像。他的到来将年会气氛面向极点,也给英伟达我国职工和协作伙伴吃了一颗定心丸。5天时刻,他连赶了3场年会。

美国的芯片禁令,让这家芯片巨子曩昔一年,在我国商场寸步难行,黄仁勋2023年6月原定的拜访我国大陆的行程取消后,乃至有职工在视频会上问道:“你还能来我国吗?”

但黄仁勋的意外莅临,打消了职工的疑虑,也在这个充溢寒意的冬季,向整个英伟达我国职工传递出了活跃的信号。

英伟达无疑是2023年全球最受注目的公司。大模型火爆带来的芯片需求激增,让它在这年赚得盆满钵满,前三个季度总营收到达388亿美元,同比增加85.5%。

英伟达股价更是水涨船高,一年时刻翻了3倍,截止2024年2月2日收盘,英伟达股价已打破660美元/股,有望成为又一家打破2万亿美元市值的科技巨子。

英伟达职工“靠股票致富”一度成为职业热闻,令人艳羡。但在我国,英伟达所面临的局势却较为为难。

显卡两次被禁售,一度让英伟达在我国简直无货可卖,成绩遭受了巨大下滑。公司新改进的PCIe L20(面向我国商场的用于AI推理特供版GPU,以下简称“L20”),在大模型练习商场出售困难。

黄仁勋访华后仅10天,商场上便马上传出HGX H20(面向我国商场的用于AI练习特供版GPU,以下简称“H20”)的音讯。但H20仅面向大客户敞开预订,至少比及2024年下半年才干到货。挨近英伟达的人告知36氪,出售们都表明我国商场四季度“废”了。

英伟达首要经过代理商出货,其官方协作伙伴的职工管业曾暗里泄漏,“第一次被禁后,咱们冲了一波成绩,但第二波被禁后,英伟达简直全系列数据中心的卡悉数砍了,咱们每天问老板,能够卖什么?”

无事可做,也让英伟达部分职工,特别出售和客户服务相关部分产生了巨大的隐忧。部分企业端的出售开端卖起了软件和InfiniBand网络产品(用于服务器间互联的通讯产品,以下简称IB网络),但这聊胜于无。

中心产品两次被禁后,一次视频会议上,英伟达我国职工向黄仁勋提问,“你会裁人吗?”

这是缝隙中的英伟达我国职工最实在的心情反应,他们忧虑自己的出路,虽然黄仁勋一再强调“不会裁人”,但当年代的重锤落下,英伟达我国就好像两个大洲板块磕碰下的鸿沟,除了接受揉捏,别无他法。

“无卡可卖”的2个月

在英伟达生态圈多年,管业(化名)从未阅历过如此困难的时刻。

2023年10月底,美国对我国发起了第2次AI芯片出口控制,除了此前已被禁的A100和H800,专为我国商场推出的改进版芯片A800、H800芯片被列入名单,就连消费范畴的4090卡也成为牺牲品。

这让作为英伟达协作伙伴的管业感触到了一丝失望。由于只卖英伟达产品,管业地点公司的全部成绩都系英伟达之上。

可现在英伟达企业端底子没卡可卖,“其时厌弃A800难卖, 现在咱们每天都得问老板,还能卖什么”, 管业慨叹道。

一时之间,整个工业哀鸿遍野。在当下最炽热的大模型练习商场,英伟达的服务器是最重要和简直仅有的算力兵器。买不到英伟达,就意味着无法练习大模型,在这场百模大战中失掉先机。

为了缩小丢失,第2次禁令到来后,英伟达内部马上行动起来,更改契合规定的产品。

“咱们简直一夜之间从床上爬起,把产品从头创新一遍,软件、硬件部分忙着从头装备GPU,后端忙着对硬件进行稳定性测验,完全是新品发布会前最忙的节奏。”一位英伟达职工回想道。

不到2个月时刻,英伟达便敏捷推出了面向我国游戏商场的特供版别4090D,补上了商场的空缺。

英伟达4090D显卡 (来自淘宝截图)

比起游戏事务,数据中心事务的路无疑难了许多。被禁一个月后,工业便出传英伟达会为我国商场再推出三款改进版的企业端GPU芯片—— HGX H20、L20 PCle和L2 PCle的音讯。

具有推理功用的L20 PCle卡敏捷在商场上推出,但能用于大模型练习的H20,直到黄仁勋访华10天后的1月29日,才在商场上开端预订,但仅有大客户具有预订资历。

A800、H800被禁后的2个多月里,多位从业者告知36氪,英伟达我国商场简直全部数据中心显卡都被禁,现在能卖的GPU只需L20。

这是一款推理芯片,它的显存容量和访存带宽与被禁的L40S简直没有差异,价格还廉价了一半,很合适用在AI的查找、引荐等模型。挨近英伟达的人士林琼称,第一批L20到货后很快就被字节、百度、腾讯等大厂分完了。

只需不用在大模型推理商场,L20就有着极高的性价比。可当英伟达我国不得不用它打大模型商场时,全部就变得困难。

“咱们做了许多测验来证明L20能够用于练习,但客户底子不买单”,英伟达内部职工冯元夏满怀无法。

英伟达的职工很少会遇到如此困难的时刻。这家芯片巨子一手发明晰GPU产品,质量又向来过硬,职工出售时一贯底气十足,很少有心里发虚和抑郁的阅历,“分明是豪华车,却不得不跑在经济车赛道”,一位英伟达职工较为无法。

“A800、H800至少还能用,L20的性价比实在太低了。”一位对芯片需求较为了解的算力供给商周毅明告知36氪。就连头疼卖什么的管业也表明:“见客户底子不说这个,没含义,他们只关心算力。”

优雅的夹缝中的英伟达中国|深氪lite的照片

除了算力功用不合格,L20卡引荐的是4卡机的方案,一台服务器只能放4张卡,这意味着要到达平等算力,它需求更多的机柜、更多的电和更多的场所,运营本钱会更高。

管业苦笑,英伟达出售说这些本钱用买卡省下来的钱就都抵消回来,不过是没东西可卖、不得已而为之的说法。

黄仁勋访华后才缓不济急的H20显卡,虽具有大模型练习功用,但现在完全没货,最早或许要6月份才干交给客户。“产能有限,肯定是出产最挣钱的产品”, 挨近英伟达的人士林琼慨叹。

无法之下,我国的客户们开端了另一种挑选——购买非官方途径的英伟达GPU。

周毅明告知36氪,在第2次禁售之前,国内客户都还老老实实购买为我国商场预备的A800、H800,但二次禁令后,咱们干脆放开了,直接购买H100产品。

“许多公司跑到海外,向国内卖英伟达GPU,每个月经过不同途径都有H100进入我国。”

微信群里售卖英伟达服务器的音讯(作者截图)

买不到货的客户也开端考虑起在海外树立数据中心,处理买卡难问题。AI范畴从业者金杰表明,“许多人找我问询,有没有在海外建数据中心的协作伙伴资源。有大规模练习需求的公司或许不敢出海练习,但零星练习需求的企业,仍是乐意试水。”

方法总比困难多,但无论是在海外购买的英伟达GPU,仍是或许从我国走出去的数据中心客户,其成绩都将不再归于英伟达我国。

英伟达我国能做什么?

面临这种被迫场景,英伟达我国能做的却十分有限。

最直接的,在何时推出、推出何种合规GPU这件事上,英伟达我国没有任何话语权,只能被迫等候与美国总部的交流。本来英伟达方案H20与L20一同在11月发布,但由于美国政府的约束,英伟达不得不调整方案,将H20的发布时刻推延。

哪怕不是这一特别作业,英伟达我国的自主权和决议计划权也相对较弱,这从它的组织架构便可窥见。AMD有大中华区总裁,英特尔和高通有我国区董事长,但英伟达我国没有一个能代表我国区与美国总部进行交流的总担任人。

严厉含义上,英伟达我国并非独立闭环的组织,它的各个事务是总部各功用部分的延伸,每个事务都向总部功用线担任人报告,一个仅十几个人的小团队也不破例。假如将各功用部分都视作八爪鱼的一脚,英伟达我国则更像是每个脚上的触须。

在这种架构下,英伟达我国更多承当的是履行功用,不具有决议计划权。一位英伟达我国前期职工告知36氪,“许多作业都是有效果了才会告知我国,决议计划正确与否,全赖总部想了解。”

以商务为例,哪怕我国大陆已占到英伟达营收的20%左右,是其全球第二大商场,英伟达我国也没有一个商务总担任人,其消费事务和企业卡事务等条线出售担任人,都要报告给亚太区的副总裁。换句话说,在我国,商务条线的高管只在事务担任人等级。

由于事务需求的暴增,英伟达北京办公室的职工比较2021年的约230人扩张了一倍,这其间很大一部分是出售和处理方案团队等前端职工。

“但在请求扩招时,英伟达总部很难了解,为什么需求这么多人?”英伟达内部职工很苦恼。出售们也经常在交流中自嘲,自己在公司没有价值。

此外,商务在日常作业中的自主权也有限。英伟达的产品是一致定价,商务不能对产品打折,乃至他们在签单时也不能确保到货期,也只能向总部请求货源。

这种自主权缺失的问题,在商场营销等部分相同常见。

有英伟达前职工诉苦,“有时候想做一点本土化营销的东西,如微博营销、节庆等,总部并不认同。他们所做的亚马逊电商活动又不契合国内受众食欲。”虽然许多国外巨子在我国区都存在相似的问题,但英伟达无疑是其间对权限缩短较紧的。

“其实这便是一家硬件公司,商场、出售这些都是如虎添翼,重要的仍是产品够好或许够廉价。”一位英伟达前职工告知36氪。

与商场、商务等事务比较,研制是这家公司的人才中心。英伟达我国曾被寄予厚望,总部一度将重要的芯片放在我国研制。

上海团队建立不到5年时,英伟达正研讨全球第一款40nm GPU芯片,其时便将数字后端作业交给了我国团队。这也是英伟达在40nm制程的第一颗芯片,有着特别性。不过这款芯片的研制并不顺畅,其时台积电40nm工艺难产影响了芯片研制进程,就连已退休的张忠谋也不得不回到公司处理工艺问题。

“但总部给了时机,这件事在英特尔、AMD是不或许产生的。” 莫风鸣表明。

英伟达乐意给我国团队时机,但在海外法令等约束要素影响下,总部不得不考虑哪些事务能够放在我国,英伟达我国也很难参加GPU最中心的架构规划和研制,这也让部分职工因“只能做边际作业”、“只能当螺丝钉”等原因离任。

据莫风鸣介绍,英伟达我国部分职工曾有时机参加高端CPU的研制,但被美国政府关注到后该事务报废,从头回收美国总部。

开展到最后,“前端越靠前的越在美国,咱们参加后端。”莫风鸣表明。

现在,英伟达上海的后端团队也是英伟达最大的后端规划团队,简直英伟达每一款芯片等流片都需求我国后端测验、验证团队的参加。英伟达我国也有一些独特性的事务功用,在总部退出视频编解码事务后,英伟达我国成为公司内部仅有具有完好编解码人员装备的团队。

何去何从?

两次产品被禁,英伟达我国的职工都问了黄仁勋同一个问题,“你会裁人吗?”

英伟达的产品不在我国出产,卡全赖进口。一位内部职工忧虑道,“假如哪天老黄舍得抛弃我国商场,当场封闭,就什么也没有了。”在代理商看来,英伟达削减部分职工也并不影响其作业,“他们即便只做大客户的生意,也有很大订单。”

在2023年,裁人一贯是科技大厂避不掉的论题,AMD 、英特尔、高通、德州仪器等公司接连裁人。如AMD对RTG部分,即担任GPU的规划开发的团队进行优化;德州仪器则裁撤了我国区MCU研制团队,将MCU产品线迁往印度。有“英国英伟达”之称的人工智能(AI)芯片独角兽Graphcore,也裁减了大部分我国职工,退出我国。

面临如此杂乱的局势,黄仁勋给出的答复却是“不会”,且表明公司仍将扩招。

他的心情罕见地明显、直接。比照2018年美国总部问是否会裁人时,其时黄仁勋并未给出直接答复,仅仅举例不会容易裁人,2008年金融危机时也是经过全员降薪度过的危机。

震撼的夹缝中的英伟达中国|深氪lite的视图

这确实安慰了人心,特别是研制人员。一位英伟达的研制告知36氪,禁令后咱们很忧虑裁人,“但现在安全感挺高,老黄在公司说话十分有重量。”研制所从事的产品软硬件开发,通常以项目制为周期,其作业方针不以成绩为导向,产品面向全球,所受影响其实相对较小。

最焦虑的是与客户触摸最多的出售职工。“他们只需做底层开发的软件工程师不会忧虑,像商务和SA都十分焦虑。”管业告知36氪。

SA是英伟达与商务协作的部分,帮助推行产品、测验产品功用等。“他们的作业和本地客户联络十分严密,假如没有芯片可卖,作业会受到影响。”一位英伟达内部职工告知36氪。有的出售职工则忧虑“下一年我还在不在都是问题”。但没人知道答案。

禁售后,本来“事无巨细,半小时没回复客户音讯就会投诉你”的英伟达商务们,陷入了苍茫。当代理商问询产品音讯、状况,得到的都是“不要问我”、“等官方回复”、“问咱们商场搭档”的答复。

在此之前,他们完全是另一个状况——每天行程组织很满,“哪怕干到夜里3点,第二天早上照样8点起来、回复作业音讯。”

这种焦虑的心情,在可用于练习商场的H20卡敞开预订后,得到了必定的缓解。

1月29日,黄仁勋访华10天后,新华三宣告将为东方国信第一批供给 H20 GPU 系列算力服务器。这是首个关于H20预订的音讯,也意味着,在不远的将来会有更多我国客户能够订货到H20。

不过,H20在算力上仍是进行了紧缩。H20的峰值算力仅英伟达H100的15%,但显存带宽保持不变。

“老黄十分想保住我国商场,每出产一块H20,就意味着少出产一块H100。H20的价格比较H100十分有诚心,现在能够说是赔钱保商场。”一位英伟达的职工表明。

商场对H20的心情还算活跃。一位职业人士告知36氪,此前咱们关于H20的预期就很低,但这个卡价格上合算,相较国产芯片从头适配CUDA生态和做无数次的大规模测验,H20的本钱是可控的。

不过即便能买到,禁令和合规也会像达摩克利斯之剑相同垂在英伟达我国和国产厂商的头上。“合规卡的生命或许在18个月左右,之后会被新的合规卡替代”,上述职业人士表明。

两年两禁,也完全打破了国内客户的梦想。挨近需求端的从业人士宫浩满怀不满和无法,“今天割5城,明日割10城,总不能他人约束什么咱们用什么”。现在,客户纷繁开端测验国产GPU产品,“哪怕不好用也要用起来”。

替换国产GPU是一件本钱很高的作业,CUDA生态是英伟达强壮的壁垒,企业和GPU公司驻场团队要磨合至少半年,开发算子和打磨产品都需求时刻。现在,有国产GPU公司现已开端与互联网大厂协作,为其写算子库,让GPU显卡能变得好用起来。

跟着商场转向,国产GPU卡的租借和购买价格也水涨船高。AI范畴从业者金杰告知36氪,华为GPU卡的算力租借价格现已跟A100、A800相差不大。

为了争夺或许失掉的商场,一位挨近英伟达出售的协作伙伴泄漏,H20的降价或许会很快到来,这在之前的英伟达,是很少呈现的状况。

除了在风雨中飘摇着的GPU卡,现在,商务们也正尽力寻觅新故事和潜在用户。为了寻求自救,英伟达商务也开端宣扬起了IB网络和SDK等软件。

网络传输才能是英伟达的一大技术优势,英伟达现在将IB网络拿出来独自售卖。网络传输有以太和IB组网两种产品,在做大模型练习时,选用IB组网能有更快的数据传输作用。但大部分客户,都倾向于选用以太网络。英伟达这项事务的营收十分少,“沧海一粟”,很难养起一家公司。

除了IB网络,软件产品也是英伟达的商务们本年发力的要点方向。

售卖软件是英伟达的一项新事务。2022年英伟达第一次被禁前后,英伟达开端将软件产品作为一项独立产品售卖,到2023年8月左右,英伟达还对软件产品进行了调价。

挨近英伟达的人士告知36氪,2023年英伟达的协作伙伴做了许多小型峰会来推行软件产品。如具有在线协同作业功用的NVIDIA Omniverse等。不过由于价格太高,推起来难度也较大。

现有商场之外,英伟达我国也开端找寻新的开展方向——自动驾驭。

这是英伟达投入已久的潜力事务,英伟达的自动驾驭芯片Orin一贯声名嘹亮,在高端智能驾驭商场简直名列前茅,但其全体处理方案一贯在业界被人诟病。此次在我国布置的自动驾驭团队,首要便是从事量产及处理方案事务。

2023年12月,参加英伟达缺乏4个月的吴新宙,火速带着数个部分VP回国,加快自动驾驭事务招聘事宜。现在其招聘已获得开端效果, 2个月时刻,英伟达便招募了超100名职工。

一位猎头告知36氪,他们的招人战略也从以往的看归纳本质,到要求快速进人,补齐团队空缺,更详细的是具有量产服务阅历、能交兵的团队,许多团队为了进人乃至放宽了对英语的要求。

“卷”,是对自动驾驭团队的中心要求,这跟英伟达此前的文明截然相反。实际也确实如此。在一贯以WLB(日子、作业平衡)的英伟达我国,他们开端了周六、周日加班的节奏。

卖软件、处理方案、IB网络,加强自动驾驭范畴重要性,都是英伟达我国对立GPU商场下沉的尽力,由于它懂这种阅历将带来何种冲击。

在GPU概念还不为人知、CPU当道的2015年,美国就曾为了约束我国超算的开展,制止英特尔向我国四家超算公司出口高功用核算芯片。

这给英特尔带来巨创。其时,选用我国E级超算天和2号所收购的英特尔Xeon处理器和至强Phi加快器芯片,占到英特尔该芯片约一半的销量。次年,英特尔Phi 7290、7250加快器价格腰斩,Phi 7290更是于2017年直接停产。而我国也逐步开展出了自研的CPU芯片。

虽然上一年12月,8天内接连拜访了日本、新加坡、马来西亚和越南四国,但黄仁勋清楚的知道我国商场的重要性,他曾在接受金融时报采访时说,“假如失掉了我国商场,咱们并没有应变方案。我国只需一个。”

从建立以来,英伟达我国就在一贯向上,并在现在了到达极点。但当全部改变敏捷袭来,面临本归于自己的年代,以及随时或许流走的时机,英伟达我国现在只能接受、习惯。

在年代的桎梏下,如英特尔的Phi芯片相同,在板块揉捏下坠入海沟,大概是英伟达我国最不肯看到的作业。

(文章中呈现姓名皆为化名)

告发/反应

相关文章

德州仪器与英飞凌携手入英伟达供应链!两大模仿芯片霸主地图扩至AI

来自TF International Securities的闻名科技职业分析师、盯梢苹果等科技巨子供给链的专家郭明錤周三标明,模仿芯片范畴的两大领军者德州仪器(TXN.US)以及英飞凌(IFNNY.U...

友情链接: