英伟达公司是怎么崛起的?

关注者
40
被浏览
24,084
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

NVIDIA 的崛起主要源自于对研发和开发者关系持续的重视。

从编年史来看,NVIDIA 和 AMD、Intel 相比都属于晚辈,后两者的成立时间分别是 1969 年和 1968 年,NVIDIA 则是 1993 年,当初创办这家公司的三个人认为 PC 在未来一定会成为游戏和多媒体设备。

在那个时代,由微软、创新科技、Dell 等公司提出的 MPC 或者说多媒体 PC 的概念已经有两、三年时间了,486SX + 44KHz 16-bit + CD-RAM + 640x480 16-bit 色显卡 + Windows 就可以算是 MPC Level 2(1993),这种级别的 PC 能做的事情也就是播一下音乐,视频能力仍然相当孱弱。

此时的 PC 上跑的游戏都是 2D 为主,不过 3D 游戏也开始渐露头角,例如 Doom,就是 1993 年发布的 3D 图形游戏。

和 2D 游戏不同的是,要实现具有写实感的三维游戏是需要强大的浮点性能和内存带宽,前者是因为几何处理,后者是因为纹理、色彩混合等处理,而且这种需求即使在现今看来也是依然非常重要,在可见的未来也难以满足。

这意味着什么?

第九艺术离不开逼真的画面,而纯 CPU+ 浮点单元以及系统内存带宽根本无法满足三维游戏的爆炸式需求,这就是为什么当年包括 NVIDIA 在内,市场上有不少于 20 多家图形芯片厂商(例如微软就做了一个名为 Talisman 的项目),大家都看到了这个强烈的需求。

NVIDIA 最初的合作伙伴是世嘉,它的第一款产品 NV1(或者说 STG2000,当年 NVIDIA 把完整的的硬件源码提供给了意法半导体)就是世嘉提供游戏的,对于广州的朋友来说,当年(1996 年)如果去过太平洋的话,一楼近楼梯的经销商那里就能看到这个 NV1。

NV1 采用的是 quadratic texture mapping,它处理的多边形是由四个顶点构成的,和由三个顶点构成的三角形在计算上有很大的差别。Quadratic 的优势是跑曲面会比较容易,但是在互动环境下由于难以准确获得对象的确切体积而被摒弃,这也导致了专门打算给世嘉次时代游戏机准备的 NV2 难产,所幸的是世嘉那时候还算财大气粗,依然支付了相关的开发费用。

NVIDIA 决意转向拥抱微软的 DirectX,并在之后获得了回报:Riva128 在四个月内卖出了 100 万片,随后的 NV4(TNT)、NV5(TNT 2)、NV10(GeForce)都取得了成功,特别是 GeForce 开始,提出了 GPU 的定义(每秒处理 1500 万三角形):

在 GeForce 问世的时候,市场上其实还有另一家图形芯片厂商——S3 Graphics 也推出了支持硬件 T&L 的芯片 Savage 2000,但是 Savage 2000 的驱动程序开发人员只有一个人,在这片显卡问世后的很长时间里都从未提供过正确的硬件 T&L 实现。

GeForce 的推出让 NVIDIA 可以涉足一个重要的现金奶牛市场——专业工作站。

在 TNT2 时代,德国艾尔莎就已经透过修改优化 NVIDIA 的驱动程序推出了基于 TNT2 的 GLoria 专业卡,NVIDIA 在之后就把艾尔莎的软件团队打包买走,之后推出了基于 NV10GL 的 Quadro 专业工作站显卡。

Quadro 问世后,以往霸占专业工作站市场的 Permedia、Wildcat、FireGL 等专业卡纷纷败下阵来,可以说,NVIDIA 在工作站领域已经占据着绝对垄断的地位,不仅贡献了稳定、丰厚的利润,而且为 NVIDIA 之后拓展相关领域以及 CUDA 推广提供了不可多得的宝贵经验。

NVIDIA 在 GeForce FX 或者说 NV30 世代犯下了严重的架构取向错误。

NV3x 只支持 32-bit 和 16-bit 像素着色器 ,而对手 ATI R300 系列只支持 24-bit 像素着色器,但是 ATI 凭借微软为其开了 24-bit 支持的方便之门以及台积电 130nm 制程暴雷的原因,NVIDIA 的 NV3X 在性能和耗电表现方面差强人意,可以说被 ATI 成功偷家了。

NVIDIA 的行销部门在这轮大战中发挥了重要的作用,例如和游戏发行商、开发商密切合作,为 NV3X 提供专门的渲染路径,使得 NV3X 在市场上的表现居然可圈可点,甚至 NV34 这样的最底层芯片居然还能在整机领域取得空前的成功,要知道当时在 DIY 市场上 ATI 的红可是完全压倒了 NVIDIA 的绿,A 粉以及 A 粉和 N 粉的激烈对抗就是那个时候出现的,在这之前,显卡领域的粉丝也就只有 V 粉、M 粉、N 粉。

这可以算是 NVIDIA 历史上的第二次危机,不过这个危机很快就过去了,因为 NV40 出来了。NV40 在性能上有了显著的改善,但是由于 NV3X 的惯性,NVIDIA 的份额还在下降,但是基本盘还是保住了,到了 G7x 时代后 NVIDIA 重新崛起,而 ATI 这边维持着吃老本的做派,再也未见 ATI 可以复现类似 R300 这样的巨幅成功了。

NVIDIA 在 07 年推出了 G80,这是历史上第一个基于统一架构的主流 GPU,所谓统一架构,就是指把各种着色器统一到同一个指令集下,好处是节省掉重复的晶体管资源,让 GPU 的晶体管效率大为提升。

随之而来的是,由于指令集统一,之前原本只有顶点着色器才需要的 ieee 754 支持能力现在整个统一架构着色器都能支持了,GPGPU 或者说使用 GPU 执行通用计算得以实现并正式登场。

NVIDIA 在设计 G80 的时候也埋了伏笔,构建了一套极具前瞻性的通用计算架构——CUDA,这包括了多层次线程管理、shared memory 内存资源,更重要的是 NVIDIA 为此配备了空前的研发支持(面向内部的软件团队以及面向外部的软硬件开发协调),从 2007 年 CUDA 正式推出(G80 在更早之前的 2006 年 12 月发布)到了 2012 年(6 年时间)或者说 AI 渐露头角之年,全球已经有 12 万活跃的 CUDA 开发人员,超过 500 家大学有 CUDA 培训课程:

之后的 10 年相信大部分都经历过了,在这期间当然有不少竞争者试图从 NVIDIA 这边分一杯羹,但是它们或多或少都存在其不足。

例如 Google TPU 这类产品,它基本上只仅限于 Google 以云服务的方式提供,你很难在市场上购得,然后软件环境方面,印象中应该也就 Tensorflow 提供支持,生态和商业模式都比较受限。举个例子吧,像一些国内的政府或机构,如果要采购系统集成用于实际应用,就基本不会考虑 TPU 这样的玩意,GPU 虽然是美国的,但是可以放在自己家里或者需要应用的场所里,和 TPU 号称的省电、省钱相比,这是重要得多的问题。

CUDA 的竞争对手目前也没法提供具有真正竞争力的产品,例如 AMD 的 MI 系列,可以在较便宜的情况下提供某种程度相当的性能,但是对于大部分的最终用户来说,能不能快速部署才是关键,没几个人愿意在已有方案的基础上改用一个几乎完全陌生的生态,顶多就是试用而已,待个两三年后,这个第二生态如果还活着并能持续提供更新的时候才会考虑,很多公司特别是初创公司根本熬不过这个阶段。

以目前情况看,如果一切正常的话,AMD 应该是有机会成为 CUDA 的有力竞争者,但是 NVIDIA 这边的配速依然很快,像 AMD 手头的 MI300 有 128GB 显存版本,NVIDIA 这边有 transformer 加速器以及可能的 120GB 版本,留给 AMD 或者 Intel Gaudi 2 等竞品的差异空间仍然非常小。

在过去这么多年里,NVIDIA 只有 GPU 这个产品,这使得它的所有资源都得以围绕 GPU 倾注,相比之下,AMD、Intel 等公司它们不是没有机会,但是往往瞻前顾后,各个部门都希望自己的利益最大化,导致大量的内耗造成了无用功,例如 Larrabee 之类就是一种特殊妥协下的畸形产物。

编辑于 2023-07-11 11:02・IP 属地广东