以下是與上一代卡皇 Ampere架構的3090Ti的參數比較:
RTX 4090 采用了臺積電4納米工藝,集成76億個晶體管。由于采用了更先進的工藝,與上一代僅28億晶體管的3090芯片裸片尺寸大體相等。
RTX 4090有 128 個 SM 和 2,520 MHz 升壓時鐘,再加上 24GB GDDR6X 內存,運行速度為 21 Gbps,具有 384 位接口。內存配置與RTX 3090 Ti相比基本沒有變化,然而,就像 AMD 對 RDNA 2 的 Infinity Cache 所做的一樣,Nvidia 顯然會在 AD102 中打包 96MB 的 L2 緩存,而 GA102 中只有 6MB 的 L2 緩存——這還沒有得到官方證實,但我們認為沒有理由懷疑這一點階段。
與 Ampere 相比,核心數量增加了 50% 以上。僅核心數量就可以大幅提升性能,但Nvidia 還調整了 Ada 以達到更高的時鐘頻率,預期提升時鐘為 2.5-2.6 GHz。這比 RTX 3090 的 1,695 MHz 升壓時鐘高出近 50%,比 RTX 3090 Ti 的 1,860 MHz 高出 35%,
結合起來,GPU 著色器計數和時鐘速度產生了理論上的最大性能數據。RTX 3090 的額定值為 35.6 teraflops,RTX 3090 Ti 將其提升至 40 teraflops,而現在 RTX 4090 將指針推高至 82.6 teraflops — 換句話說,是計算能力的兩倍多。雖然僅 teraflops 可能是一個毫無意義的數字,但它在類似的架構中仍然有用。
核心數量和時鐘速度有所提高,但更重要的是,架構更新可以進一步提升性能。在 GPU 著色器上,Nvidia 表示 Ada 內核的功率效率高達兩倍。著色器還支持稱為 SER 的新功能,即著色器執行重新排序,這似乎主要有助于提高光線追蹤性能,但在傳統渲染模式中也可能有用。