英伟达公司是怎么崛起的？

Question

英伟达公司是怎么崛起的？

关注者

40

被浏览

24,084

登录后你可以

不限量看优质回答私信答主深度交流精彩内容一键收藏

查看全部 12 个回答

NVIDIA 的崛起主要源自于对研发和开发者关系持续的重视。

从编年史来看，NVIDIA 和 AMD、Intel 相比都属于晚辈，后两者的成立时间分别是 1969 年和 1968 年，NVIDIA 则是 1993 年，当初创办这家公司的三个人认为 PC 在未来一定会成为游戏和多媒体设备。

在那个时代，由微软、创新科技、Dell 等公司提出的 MPC 或者说多媒体 PC 的概念已经有两、三年时间了，486SX + 44KHz 16-bit + CD-RAM + 640x480 16-bit 色显卡 + Windows 就可以算是 MPC Level 2（1993），这种级别的 PC 能做的事情也就是播一下音乐，视频能力仍然相当孱弱。

此时的 PC 上跑的游戏都是 2D 为主，不过 3D 游戏也开始渐露头角，例如 Doom，就是 1993 年发布的 3D 图形游戏。

和 2D 游戏不同的是，要实现具有写实感的三维游戏是需要强大的浮点性能和内存带宽，前者是因为几何处理，后者是因为纹理、色彩混合等处理，而且这种需求即使在现今看来也是依然非常重要，在可见的未来也难以满足。

这意味着什么？

第九艺术离不开逼真的画面，而纯 CPU+ 浮点单元以及系统内存带宽根本无法满足三维游戏的爆炸式需求，这就是为什么当年包括 NVIDIA 在内，市场上有不少于 20 多家图形芯片厂商（例如微软就做了一个名为 Talisman 的项目），大家都看到了这个强烈的需求。

NVIDIA 最初的合作伙伴是世嘉，它的第一款产品 NV1（或者说 STG2000，当年 NVIDIA 把完整的的硬件源码提供给了意法半导体）就是世嘉提供游戏的，对于广州的朋友来说，当年（1996 年）如果去过太平洋的话，一楼近楼梯的经销商那里就能看到这个 NV1。

NV1 采用的是 quadratic texture mapping，它处理的多边形是由四个顶点构成的，和由三个顶点构成的三角形在计算上有很大的差别。Quadratic 的优势是跑曲面会比较容易，但是在互动环境下由于难以准确获得对象的确切体积而被摒弃，这也导致了专门打算给世嘉次时代游戏机准备的 NV2 难产，所幸的是世嘉那时候还算财大气粗，依然支付了相关的开发费用。

NVIDIA 决意转向拥抱微软的 DirectX，并在之后获得了回报：Riva128 在四个月内卖出了 100 万片，随后的 NV4（TNT）、NV5（TNT 2）、NV10（GeForce）都取得了成功，特别是 GeForce 开始，提出了 GPU 的定义（每秒处理 1500 万三角形）：

在 GeForce 问世的时候，市场上其实还有另一家图形芯片厂商——S3 Graphics 也推出了支持硬件 T&L 的芯片 Savage 2000，但是 Savage 2000 的驱动程序开发人员只有一个人，在这片显卡问世后的很长时间里都从未提供过正确的硬件 T&L 实现。

GeForce 的推出让 NVIDIA 可以涉足一个重要的现金奶牛市场——专业工作站。

在 TNT2 时代，德国艾尔莎就已经透过修改优化 NVIDIA 的驱动程序推出了基于 TNT2 的 GLoria 专业卡，NVIDIA 在之后就把艾尔莎的软件团队打包买走，之后推出了基于 NV10GL 的 Quadro 专业工作站显卡。

Quadro 问世后，以往霸占专业工作站市场的 Permedia、Wildcat、FireGL 等专业卡纷纷败下阵来，可以说，NVIDIA 在工作站领域已经占据着绝对垄断的地位，不仅贡献了稳定、丰厚的利润，而且为 NVIDIA 之后拓展相关领域以及 CUDA 推广提供了不可多得的宝贵经验。

NVIDIA 在 GeForce FX 或者说 NV30 世代犯下了严重的架构取向错误。

NV3x 只支持 32-bit 和 16-bit 像素着色器，而对手 ATI R300 系列只支持 24-bit 像素着色器，但是 ATI 凭借微软为其开了 24-bit 支持的方便之门以及台积电 130nm 制程暴雷的原因，NVIDIA 的 NV3X 在性能和耗电表现方面差强人意，可以说被 ATI 成功偷家了。

NVIDIA 的行销部门在这轮大战中发挥了重要的作用，例如和游戏发行商、开发商密切合作，为 NV3X 提供专门的渲染路径，使得 NV3X 在市场上的表现居然可圈可点，甚至 NV34 这样的最底层芯片居然还能在整机领域取得空前的成功，要知道当时在 DIY 市场上 ATI 的红可是完全压倒了 NVIDIA 的绿，A 粉以及 A 粉和 N 粉的激烈对抗就是那个时候出现的，在这之前，显卡领域的粉丝也就只有 V 粉、M 粉、N 粉。

这可以算是 NVIDIA 历史上的第二次危机，不过这个危机很快就过去了，因为 NV40 出来了。NV40 在性能上有了显著的改善，但是由于 NV3X 的惯性，NVIDIA 的份额还在下降，但是基本盘还是保住了，到了 G7x 时代后 NVIDIA 重新崛起，而 ATI 这边维持着吃老本的做派，再也未见 ATI 可以复现类似 R300 这样的巨幅成功了。

NVIDIA 在 07 年推出了 G80，这是历史上第一个基于统一架构的主流 GPU，所谓统一架构，就是指把各种着色器统一到同一个指令集下，好处是节省掉重复的晶体管资源，让 GPU 的晶体管效率大为提升。

随之而来的是，由于指令集统一，之前原本只有顶点着色器才需要的 ieee 754 支持能力现在整个统一架构着色器都能支持了，GPGPU 或者说使用 GPU 执行通用计算得以实现并正式登场。

NVIDIA 在设计 G80 的时候也埋了伏笔，构建了一套极具前瞻性的通用计算架构——CUDA，这包括了多层次线程管理、shared memory 内存资源，更重要的是 NVIDIA 为此配备了空前的研发支持（面向内部的软件团队以及面向外部的软硬件开发协调），从 2007 年 CUDA 正式推出（G80 在更早之前的 2006 年 12 月发布）到了 2012 年（6 年时间）或者说 AI 渐露头角之年，全球已经有 12 万活跃的 CUDA 开发人员，超过 500 家大学有 CUDA 培训课程：

之后的 10 年相信大部分都经历过了，在这期间当然有不少竞争者试图从 NVIDIA 这边分一杯羹，但是它们或多或少都存在其不足。

例如 Google TPU 这类产品，它基本上只仅限于 Google 以云服务的方式提供，你很难在市场上购得，然后软件环境方面，印象中应该也就 Tensorflow 提供支持，生态和商业模式都比较受限。举个例子吧，像一些国内的政府或机构，如果要采购系统集成用于实际应用，就基本不会考虑 TPU 这样的玩意，GPU 虽然是美国的，但是可以放在自己家里或者需要应用的场所里，和 TPU 号称的省电、省钱相比，这是重要得多的问题。

CUDA 的竞争对手目前也没法提供具有真正竞争力的产品，例如 AMD 的 MI 系列，可以在较便宜的情况下提供某种程度相当的性能，但是对于大部分的最终用户来说，能不能快速部署才是关键，没几个人愿意在已有方案的基础上改用一个几乎完全陌生的生态，顶多就是试用而已，待个两三年后，这个第二生态如果还活着并能持续提供更新的时候才会考虑，很多公司特别是初创公司根本熬不过这个阶段。

以目前情况看，如果一切正常的话，AMD 应该是有机会成为 CUDA 的有力竞争者，但是 NVIDIA 这边的配速依然很快，像 AMD 手头的 MI300 有 128GB 显存版本，NVIDIA 这边有 transformer 加速器以及可能的 120GB 版本，留给 AMD 或者 Intel Gaudi 2 等竞品的差异空间仍然非常小。

在过去这么多年里，NVIDIA 只有 GPU 这个产品，这使得它的所有资源都得以围绕 GPU 倾注，相比之下，AMD、Intel 等公司它们不是没有机会，但是往往瞻前顾后，各个部门都希望自己的利益最大化，导致大量的内耗造成了无用功，例如 Larrabee 之类就是一种特殊妥协下的畸形产物。

编辑于 2023-07-11 11:02・IP 属地广东

查看全部 12 个回答