NVIDIA GeForce 800

NVIDIA GeForce 800系列,是英伟达研发的图形处理器产品系列,用于笔记本电脑平台。此代显示核心将采用新的Maxwell微架构(芯片代号将以‘GM’开头),以苏格兰理论物理学詹姆士·克拉克·麦克斯韦的名字命名。2014年初悄然发表的行动型显示核心GeForce 820M,尽管列入GeForce 800系列,但仍采用GeForce 500系列‘Fermi’架构的GF117显示核心,因此仅仅是旧型号显示核心更名而已。[1][2]首款基于Maxwell微架构的显示核心实际为GeForce 700系列上的GeForce GTX 750以及750 Ti。[3][4][5]后来,NVIDIA也陆续发布移动平台的GeForce 800M系列的其他型号,除GeForce 830M、840M、GTX 850M以及GTX 860M的部分批量以外,其余的均使用旧有显示核心。NVIDIA宣布新一代Maxwell核心的首发两款产品将被命名为NVIDIA GeForce 900系列,分别为GTX 970和GTX 980。[6][7]而预计GeForce 800系列将使用在OEM市场,就像之前的GeForce 100GeForce 300系列。

NVIDIA GeForce 800系列
发布日期2014年
代号Fermi (28nm)
GF117
Kepler(28nm)
GK104
Maxwell (28nm/20nm)
GM107
GM108
显卡
入门GPU移动平台:820M、830M、840M
中端GPU移动平台:GTX 850M、GTX 860M
高端GPU移动平台:GTX 870M、GTX 880M
API支持
Direct3DDirect3D 12
Shader Model 5.0
OpenGLOpenGL 4.4
OpenCLOpenCL 1.2
历史
前代产品GeForce 700系列
后继产品GeForce 900系列

概观

用于GeForce 800系列上的‘Maxwell’显示核心架构,是用于GeForce 600以及700系列‘Kepler’显示核心架构的下一代,将首次在显示核心上内置ARM架构的CPU核心。[8][9]NVIDIA的CEO黄仁勋称,这样做使得GPU更加独立于主CPU[10]。NVIDIA称‘Maxwell’显示核心架构对比‘Kepler’架构,会有更高的图形处理性能、更简化的可编程性以及更好的能效比[11]

2010年9月NVIDIA宣布下一代显示核心架构‘Maxwell’。[12]首款基于‘Maxwell’架构的消费级显示核心的产品将于2014年早期发卖。[13]稍后将有基于‘Maxwell’显示核心的NVIDIA Tesla运算卡以及NVIDIA Quadro专业图形卡。最后会有供手持式设备使用的基于该架构的NVIDIA Tegra系统单片机出现。[11]

架构特性

初期,Maxwell架构显示核心,仍采用台积电的28nm制程,核心规模也较为有限。首代Maxwell显示核心有GM107和GM108,均面向消费级市场,相比Kepler而言仅是多了一些Kepler架构所没有的附加功能特性,性能、功耗及能效比上与Kepler相去不远。这些新增的特性主要有:

  • NVENC性能的加强。NVENC是NVIDIA开发的视频解码器,在初代Maxwell显示核心上的性能为1.5倍到2倍于Kepler显示核心,在6到8倍的回放速率使仍能实时解码。[14]
  • PureVideo性能加强。NVIDIA提升了Maxwell的视频解码缓存和存储器访问效率,称在Pure Video E功能集视频解码时,比以往的有8到10倍性能提升。然而,H.265硬件解码的支持度仍然不完整,需要软件以及硬件共同执行。[14]
  • 新增一个电源模式‘GC5’。当显示核心进行视频解码作业时,会进入一个新的‘GC5’电源模式,只保留视频解码所需的电路单元的电力供应,节省电力。[14]

显示内存

GM107的L2缓存,由GK107的256KB,大幅增加到2MB,大大降低对显示内存的带宽需求。相应地,NVIDIA仅为GM107的使用128位的存储器控制器位宽,而GM107的性能与kepler的192比特存储器位宽的GK106不相上下,除此以外,减少了存储器位宽,还会节省电能。[14]

SMM

Kepler时代,CUDA核心/流处理器数组被NVIDIA称作SMX,而Maxwell的设计,则改称SMM。SMM数组中,各数组是分离独立的,因此数组中的4个调度引擎控制各自所属的FP32 CUDA核心、加载/存储单元以及特殊功能单元,不像Kepler那样一个调度引擎需要共享资源。不过,纹理单元以及FP64 CUDA核心则仍然是共享的。[14]SMM提供比SMX更细粒度的资源分配,当负载并非为共享资源优化时节省电力。NVIDIA称128个CUDA核心的SMM可以达到192个CUDA核心的SMX的90%的性能。[14]

通用运算

相比GK110/GK208支持CUDA 3.5,GM107可以支持CUDA 5.0通用运算库。在GK110/GK208上现身的动态并发以及HyperQ,基于Maxwell架构的显示核心会全面支持。Maxwell架构为32位整数的原子操作提供原生共享存储器,支持32位和64位的数据比较和交换(compare-and-swap,CAS),可实现其它形式的原子操作功能。

API

Maxwell架构全面支持DirectX 12。[15]

继任架构

接替‘Maxwell’显示核心架构的,是NVIDIA于2013年3月宣布的代号‘Volta’的显示核心架构。[16]2014年,这个构想的架构被定名为‘Pascal’[17][18] ‘Pascal’将实现片上堆栈式动态随机存储器(DRAM),或称‘片上显示内存’,统一存储器架构以及NVLink。[19][17]

产品介绍

桌面型平台

首款基于Maxwell架构的显示核心是GM107,但它却被划入GeForce 700系列,是为GeForce GTX 750和GTX 750 Ti,均使用28纳米制程,[14]它们均于2014年2月18日发布。GeForce GTX 750和GTX 750 Ti的TDP分别仅为55瓦和60瓦,这样使得它们都能直接从PCIe插槽中获取足够的电能而无需辅助供电连接端口。[14]第二款基于Maxwell架构的显示核心GM204被划入GeForce 900系列,是为GeForce GTX 970和GTX 980,它们均于2014年9月19日发布。

移动平台

GeForce 800M的首发产品是GeForce 820M[20] - 使用‘Fermi’显示核心架构的GF117显示核心,仅支持PCI-E 2.0,但支持DirectX 11.2、OpenGL 4.4、OpenCL 1.1、FXAA以及Optimus双显示核心切换,搭载DDR3显示内存。其后发布的GeForce 830M、840M使用规格较低,但基于Maxwell架构的GM108显示核心。GeForce GTX 850M以及GTX 860M后来推出的批量,采用GM107显示核心。GeForce GTX 860M早期版本、870M以及880M均使用GK104核心,但各型号的核心配置不一。

芯片规格

GeForce 800系列本代仅供笔记本电脑使用,而同架构的台式机用图形处理器产品,则为GeForce 900系列以及GeForce GTX 750/750Ti。

  • 1 统一渲染器/流处理器数量 : 纹理映射单元数量 : 渲染输出单元数量
  • 2 像素填充率的估算:ROP的数量乘以基准核心时钟频率(主频单位Hz),单位像素数每秒(P/s)
  • 3 纹理填充率的估算:TMU的数量乘以基准核心时钟频率(主频单位Hz),单位纹理数每秒(T/s)
  • 4 全系列可支持Direct3D 12,但功能层级会是更低的Feture Level 11_0
  • 5 单精度浮点数处理性能的估算,由着色器主频乘以CUDA核心/流处理器数量和每时钟周期CUDA核心/流处理器指令数;双精度浮点数处理性能的估算:核心代号“GMxxx”的为单精度浮点数的1/32,核心代号“GKxxx”的为单精度浮点数的1/24
  • 6 主频资料与实际使用的可能有差别,核心代号“GFxxx”的核心主频分为两部分:CUDA核心主频/着色器主频
型号 推出年分 芯片代号 制程
(纳米)
晶体管数
(百万个)
晶粒面积
(平方毫米)
总线接口 核心配置
SPs:TMUs:ROPs1
主频配置 填充率 显示内存配置 API支持(版本)4 运算性能
(GFLOPS)
热设计功耗
(W)
默认
(MHz)6
加速
(MHz)
存储器
(MT/s)
像素
(GP/s)2
材质
(GT/s)3
容量
(MiB)
总线类型 总线宽度
(比特)
带宽
(GB/s)
DirectX OpenGL OpenCL Vulkan 单精度浮点数5 双精度浮点数5
GeForce 800M[21][22] 2014年3月17日 GF117 28 585 116 PCIe 2.0 x8 48:8:8
(1 SM)
738/1476 N/A 1800 1.476 5.9 2048 DDR3 64 14.4 11.0 4.5 1.1 未知 141.7 未知 15
GeForce 810M (GF117)[23] 2014年3月24日 GF117 28 585 116 PCIe 2.0 x16 48:8:8
(1 SM)
738/1476 N/A 1800 1.576 5.9 1024
2048
DDR3 64 16 11.0 4.4 1.1 未知 141.7 未知 15
GeForce 810M (GK107)[24] 2015年3月21日 GK107 28 1270 118 PCIe 3.0 x16 384:32:16
(2 SMX)
810 未知 1800 6.48 25.92 1024
2048
DDR3 128 28 11.2 4.5 1.2 未知 622.1 未知 45
GeForce 820M (GF117)[20][25] 2013年11月27日 GF117 28 585 116 PCIe 2.0 x16 96:16:4
(2 SM)
625/1250~775/1550 N/A 1800 2.5~3.1 10~12.4 1024
2048
DDR3 64 14.4 11.0 4.4 1.1 未知 240~297.6 未知 15
GeForce 820M (GK107)[26] 2015年3月21日 GK107 28 1270 118 PCIe 3.0 x16 384:32:16
(2 SMX)
810 未知 1800 6.48 25.92 1024
2048
DDR3 128 28 11.2 4.5 1.2 未知 622.1 未知 45
GeForce 825M[27] 2014年3月12日 GK208 28 未知 87 PCIe 3.0 x16 384:32:16
(2 SMX)
850 未知 1800 6.8 27.20 1024
2048
DDR3 64 14.4 12.0 4.5 1.2 1.0 652.8 未知 33
GeForce 830M[28] 2014年3月12日 GM108 28 未知 未知 PCIe 3.0/2.0 x16 256:16:8
(2 SMM)
1082 1150 1800 8.66 17.31 2048 DDR3 64 14.4 12.0 4.5 1.2 1.0 554 未知 33
GeForce 840M [29] 2014年3月12日 GM108 28 未知 未知 PCIe 3.0/2.0 x16 384:24:8
(3 SMM)
1029 1124 2000 8.2 24.7 1024
2048
DDR3 64 16.02 12.0 4.5 1.2 1.0 790.3 未知 33
GeForce 845M (GM107)[30] 2015年2月7日 GM107 28 1870 148 PCIe 3.0 x16 512:32:16
(4 SMM)
863 未知 2000 13.81 27.62 1024
2048
DDR3 64 16 12.0 4.5 1.2 1.0 883.7 未知 45
GeForce 845M (GM108)[31] 2015年8月26日 GM108 28 未知 未知 PCIe 3.0 x16 384:24:8
(3 SMM)
1071 1176 5000 17.14 34.3 1024
2048
GDDR5 64 40 12.0 4.5 1.2 1.0 822.5 未知 33
GeForce GTX 850M[32] 2014年3月14日 GM107 28 1870 148 PCIe 3.0 x16 640:40:16
(5 SMM)
936 未知 5000 14.4 36.1 2048 GDDR5
DDR3
128 80
32
12.0 4.5 1.2 1.0 1198.1 未知 45
GeForce GTX 860M (GK104)[33][34] 2014年3月10日 GK104 28 3540 294 PCIe 3.0 x16 1152:96:16
(6 SMX)
797 915 5000 19.13 76.5 2048 GDDR5 128 80 12.0 4.5 1.2 1.0 1836.3 未知 75
GeForce GTX 860M (GM107)[33][35] 2015年2月5日 GM107 28 1870 148 PCIe 3.0 x16 640:40:16
(5 SMM)
1020 1085 5000 16.32 41.2 2048 GDDR5 128 80 12.0 4.5 1.2 1.0 1317.1 未知 75
GeForce GTX 870M[36] 2014年3月12日 GK104 28 3540 294 PCIe 3.0 x16 1344:112:32
(7 SMX)
941 967 5000 30.1 105.4 3072 GDDR5 192 120 12.0 4.5 1.2 1.0 2529.4 未知 100
GeForce GTX 880M[37] 2014年3月12日 GK104 28 3540 294 PCIe 3.0 x16 1536:128:32
(8 SMX)
954 993 5000 30.53 122.1 4096
8192
GDDR5 256 160 12.0 4.5 1.2 1.0 2930.7 未知 122

参见

参考资料

  1. ^ 马甲新境界:GeForce 800M震撼登场. mydrivers.com. [2014-02-10]. (原始内容存档于2014-02-20). 
  2. ^ G92蝉联四代马甲:GeForce 800M显卡登场. pconline.com.cn. [2014-02-10]. (原始内容存档于2014-02-21). 
  3. ^ Details on Nvidia's GeForce GTX 750 Ti, GTX 750 cards leak页面存档备份,存于互联网档案馆) - techspot.com
  4. ^ GTX750Ti、GTX750长这样:规格也定了页面存档备份,存于互联网档案馆) - mydrivers.com
  5. ^ 新Maxwell显卡GTX750 Ti居然开放预定页面存档备份,存于互联网档案馆) - inpai.com
  6. ^ 抛弃GTX 800系列的命名方式 NVIDIA下月直接发布GTX 980/970. gamersky.com. [2014-09-06]. (原始内容存档于2014-09-06). 
  7. ^ NVIDIA本月18日发GTX 980/970显卡. 网易. [2014-09-06]. (原始内容存档于2014-09-06). 
  8. ^ Nvidia Maxwell to be first GPU with ARM CPU in 2013页面存档备份,存于互联网档案馆), Guru3d.com
  9. ^ 存档副本. [2015-06-20]. (原始内容存档于2013-10-20). 
  10. ^ Nvidia Maxwell Graphics Processors to Have Integrated ARM General-Purpose Cores.页面存档备份,存于互联网档案馆), xbitlabs.com页面存档备份,存于互联网档案馆
  11. ^ 11.0 11.1 Nvidia: Next-Generation Maxwell Architecture Will Break New Grounds..页面存档备份,存于互联网档案馆), xbitlabs.com页面存档备份,存于互联网档案馆
  12. ^ NVIDIA reveals upcoming GPU architectures.页面存档备份,存于互联网档案馆), hexus.net页面存档备份,存于互联网档案馆
  13. ^ 存档副本. [2014-02-10]. (原始内容存档于2014-01-16). 
  14. ^ 14.0 14.1 14.2 14.3 14.4 14.5 14.6 14.7 Smith, Ryan; T S, Ganesh. The NVIDIA GeForce GTX 750 Ti and GTX 750 Review: Maxwell Makes Its Move. AnandTech. 18 February 2014 [18 February 2014]. (原始内容存档于2014年2月18日). 
  15. ^ 存档副本. [2014-04-02]. (原始内容存档于2015-09-11). 
  16. ^ Smith, Ryan. NVIDIA Updates GPU Roadmap; Announces Volta Family For Beyond 2014. AnandTech. 19 March 2013 [19 March 2013]. (原始内容存档于2013-03-21). 
  17. ^ 17.0 17.1 存档副本. [2014-04-02]. (原始内容存档于2014-03-25). 
  18. ^ Smith, Ryan. NVIDIA Updates GPU Roadmap; Unveils Pascal Architecture For 2016. AnandTech. 26 March 2014 [26 March 2014]. (原始内容存档于2014-04-04). 
  19. ^ 存档副本. [2014-02-10]. (原始内容存档于2014-02-21). 
  20. ^ 20.0 20.1 GeForce 820M | Specifications | GeForce. [2014-02-12]. (原始内容存档于2015-12-19). 
  21. ^ GeForce 800M | Specifications | GeForce. [2016-05-30]. (原始内容存档于2016-06-10). 
  22. ^ GeForce 800M | Specifications | techpowerup.com. [2015-02-28]. (原始内容存档于2016-06-24). 
  23. ^ GeForce 810M | Specifications | techpowerup.com. [2016-05-30]. (原始内容存档于2016-06-24). 
  24. ^ GeForce 810M | Specifications | techpowerup.com. [2016-05-30]. (原始内容存档于2016-06-24). 
  25. ^ GeForce 820M | Specifications | techpowerup.com. [2016-05-31]. (原始内容存档于2016-06-25). 
  26. ^ GeForce 820M | Specifications | techpowerup.com. [2016-05-31]. (原始内容存档于2016-05-23). 
  27. ^ GeForce 825M | Specifications | techpowerup.com. [2016-05-30]. (原始内容存档于2016-06-24). 
  28. ^ GeForce 830M | Specifications | GeForce. [2014-04-02]. (原始内容存档于2015-12-10). 
  29. ^ GeForce 840M | Specifications | GeForce. [2014-04-02]. (原始内容存档于2015-12-17). 
  30. ^ GeForce 845M | Specifications | techpowerup.com. [2016-05-30]. (原始内容存档于2016-06-24). 
  31. ^ GeForce 845M | Specifications | techpowerup.com. [2016-05-30]. (原始内容存档于2016-06-24). 
  32. ^ GeForce GTX 850M | Specifications | GeForce. [2014-04-02]. (原始内容存档于2015-12-06). 
  33. ^ 33.0 33.1 GeForce GTX 860M | Specifications | GeForce. [2014-04-02]. (原始内容存档于2015-12-04). 
  34. ^ GeForce GTX 860M | Specifications | techpowerup.com. [2016-05-31]. (原始内容存档于2016-05-19). 
  35. ^ GeForce GTX 860M | Specifications | techpowerup.com. [2016-05-30]. (原始内容存档于2016-05-19). 
  36. ^ GeForce GTX 870M | Specifications | GeForce. [2014-04-02]. (原始内容存档于2015-12-19). 
  37. ^ GeForce GTX 880M | Specifications | GeForce. [2014-04-02]. (原始内容存档于2015-12-10). 

外部链接