Nvidia【所有信息】
目录:
Nvidia Corporation (通常称为Nvidia)是一家在特拉华州注册成立的美国技术公司,总部位于加利福尼亚州圣克拉拉。 Nvidia 设计用于视频游戏和专业市场的图形处理单元,以及用于汽车和移动计算市场的芯片单元 (SoC)系统。 其核心产品线GeForce与AMD的Radeon产品直接竞争。
我们建议阅读我们最好的 PC硬件和组件指南 :
除了制造GPU外, Nvidia还为研究人员和科学家在全球范围内提供并行处理功能 ,使他们能够高效地运行高性能应用程序。 最近,它进入了移动计算市场,在那里生产用于视频游戏机,平板电脑,自动导航和车辆娱乐系统的Tegra移动处理器。 自2014年以来,这使Nvidia成为专注于四个市场的公司:游戏,专业可视化,数据中心以及人工智能和汽车。
内容索引
英伟达的历史
Nvidia由黄仁勋,克里斯·马拉乔夫斯基和柯蒂斯·普里姆于1993年创立。 该公司的三位联合创始人假设,正确的计算方向将通过图形加速处理,认为这种计算模型可以解决通用计算无法解决的问题。 他们还指出,视频游戏是一些计算方面最具挑战性的问题,并且它们的销量令人难以置信 。
从小型视频游戏公司到人工智能巨人
该公司成立之初的初始资本为40, 000美元,最初没有名字,并且联合创始人将其所有NV文件都命名为“下一个版本”。 由于合并了公司的需要,联合创始人审查了所有带有这两个字母的单词,这使他们想到了“ invidia” ,这是拉丁词,意为“嫉妒”。
RIVA TNT于1998年推出, 巩固了Nvidia在开发图形适配器方面的声誉 。 1999年底,Nvidia发布了GeForce 256(NV10) ,其中最引人注目的是在3D硬件中引入了用户级转换和照明(T&L)。 它工作在120 MHz并具有四行像素,实现了高级视频加速,运动补偿和硬件子图像混合。 GeForce大大优于现有产品。
由于产品的成功, Nvidia赢得了为微软Xbox游戏机开发图形硬件的合同,为Nvidia赚了2亿美元。 但是,该项目吸收了其他项目中的许多优秀工程师。 在短期内,这没关系,GeForce2 GTS于2000 年夏天交付。2000 年12月,Nvidia达成协议,收购其唯一竞争对手3dfx的知识资产,后者是面向消费者的3D图形技术的先驱。他从1990年代中期到2000年一直领导该领域。收购过程于2002年4月结束。
在2002年7月,Nvidia以未公开的金额收购了Exluna。 Exluna负责创建各种软件渲染工具 。 后来,在2003年8月,Nvidia以大约7000万美元的价格收购了MediaQ。 它还于2004年4月22日收购了iReady,后者是高性能TCP / IP和iSCSI卸载解决方案的提供商。
Nvidia在视频游戏市场上的成功是如此巨大,以至于2004年12月宣布它将帮助索尼设计PlayStation 3的RSX图形处理器,这是日本公司开发的新一代视频游戏机,它的任务很艰巨,那就是要重蹈历史上最畅销的前任的覆辙。
2006年12月,英伟达获得了美国司法部的嘉奖。 关于图形卡行业中可能存在的反托拉斯违规行为 。 在ATI购买ATI之后,当时AMD已成为其最大的竞争对手。 从那以后,AMD和Nvidia一直是视频游戏图形卡的唯一制造商,不要忘记英特尔的集成芯片。
《福布斯》称英伟达在过去五年中所取得的成就,称其为2007年度最佳公司 。 Nvidia于2007年1月5日宣布已完成对PortalPlayer,Inc的收购。 2008年2月,Nvidia收购了PhysX物理引擎和运行该引擎的物理处理单元的开发商Ageia 。 Nvidia宣布计划将PhysX技术集成到其未来的GeForce GPU产品中。
Nvidia面临巨大困难,2008年7月,据报道该公司生产的某些移动芯片组和移动GPU由于制造缺陷而导致异常故障率下降,当其收入减少约2亿美元时 。 在2008年9月,Nvidia受到了受影响者的集体诉讼,称有缺陷的GPU已被合并到Apple,Dell和HP生产的某些型号的笔记本电脑中。 肥皂剧在2010年9月结束,当时Nvidia达成协议,将向受影响的笔记本电脑的所有者返还维修或在某些情况下产品更换的费用。
最初在移动世界大会上展出后,Nvidia于2011年11月发布了面向移动设备的ARG Tegra 3芯片系统 。 Nvidia声称该芯片具有首个四核移动CPU。 2013年1月,Nvidia推出了Tegra 4以及Nvidia Shield (基于Android的便携式游戏机,由新处理器提供动力)。
Nvidia于2016年5月6日推出了GeForce GTX 1080和1070图形卡,这是第一个基于新Pascal微体系结构的图形卡。 Nvidia声称这两种型号均优于基于Maxwell的Titan X型号。 这些卡分别集成了GDDR5X和GDDR5内存,并使用16nm制造工艺。 Pascal架构还支持称为同时多投影(SMP)的新硬件功能,该功能旨在提高多监视器和虚拟现实渲染的质量 。 Pascal已使符合Nvidia Max-Q设计标准的笔记本电脑的制造成为可能。
2017年5月,英伟达(Nvidia)宣布与丰田汽车公司(Toyota Motor Corp)建立合作关系,丰田汽车公司将在其自动驾驶汽车上使用英伟达的Drive X系列人工智能平台 。 2017年7月,英伟达与中国搜索巨头百度公司宣布了强大的AI合作伙伴关系,其中包括云计算,自动驾驶,消费类设备以及百度的AI框架PaddlePaddle。
Nvidia GeForce和Nvidia Pascal主导游戏
GeForce是基于Nvidia于1999年创建的图形处理单元(GPU)的图形卡的品牌名称 。 迄今为止,GeForce系列自诞生以来已经有16代了 。 针对这些卡的专业用户的版本以Quadro为名,并在驱动程序级别包含一些区别功能。 GeForce的直接竞争对手是AMD的Radeon卡。
Pascal是Nvidia开发的最新GPU微体系结构的代号,该微体系已进入视频游戏市场,是先前Maxwell体系结构的后继产品。 Pascal架构于2016年4月首次引入,2016年4月5日发布了用于服务器的Tesla P100。目前,Pascal主要用于GeForce 10系列,GeForce GTX 1080和GTX最初的1070种视频游戏卡分别于2016年5月17日和2016年6月10日发布。 Pascal采用台积电(TSMC)的16nm FinFET工艺制造 ,与以28nm FinFET制造的Maxwell相比,它具有更高的能效和性能。
Pascal架构在内部组织为所谓的流式多处理器( SM),这些功能单元由64个CUDA内核组成 ,而这些CUDA内核又分为两个处理模块,每个模块分别具有32个CUDA内核。其中有一个指令缓冲区,一个扭曲计划器,2个纹理映射单元和2个调度单元。 这些SM驱动器相当于AMD的CU。
Nvidia的Pascal架构被设计为游戏界中最高效,最先进的架构。 Nvidia的工程团队在创建GPU架构方面付出了很大的努力,该架构具有很高的时钟速度,同时又保持了严格的功耗。 为此,在其所有电路中均选择了非常仔细和优化的设计,从而使Pascal的频率能够比Maxwell高40% ,这个数字比该工艺所允许的最高数字高16 nm,而没有在设计级别进行所有优化。
内存是图形卡性能的关键要素,GDDR5技术于2009年发布,因此对于当今功能最强大的图形卡已经过时了。 这就是Pascal支持GDDR5X内存的原因,GDDR5X内存是这些显卡发布时历史上最快,最先进的内存接口标准 ,传输速度高达10 Gbps或位之间的近100皮秒。数据。 与GDDR5相比,GDDR5X内存还允许图形卡消耗更少的功率,因为其工作电压为1.35V,而更快的GDDR5芯片则需要1.5V甚至更高。 在相同的功耗下,这种电压降低将使工作频率提高43%。
Pascal的另一项重要创新来自不降低性能的内存压缩技术 ,从而降低了GPU对带宽的需求。 Pascal包括第四代delta颜色压缩技术。 使用增量颜色压缩, GPU可以分析场景以计算可以压缩其信息而又不牺牲场景质量的像素。 虽然Maxwell架构无法压缩与某些元素有关的数据,例如Project Cars游戏中的植被和汽车零件,但Pascal可以压缩有关这些元素的大多数信息,因此比麦克斯韦。 结果,Pascal能够显着减少必须从内存中提取的字节数。 字节的减少意味着有效带宽增加了20%,与GDDR5和Maxwell架构相比,使用GDDR5X内存使带宽增加了1.7倍。
Pascal还提供了与异步计算有关的重要改进,这是非常重要的,因为当前的工作负载非常复杂。 由于有了这些改进, Pascal架构可以更有效地在所有不同的SM单元之间分配负载 ,这意味着几乎没有未使用的CUDA内核。 这样可以使GPU的优化更大,从而更好地利用其拥有的所有资源。
下表总结了所有基于Pascal的GeForce卡的最重要功能。
NVIDIA GEFORCE PASCAL图形卡 |
||||||
CUDA核心 | 频率(MHz) | 记忆体 | 记忆体介面 | 内存带宽(GB /秒) | TDP(宽) | |
NVIDIA GeForce GT1030 | 384 | 1468 | 2 GB GDDR5 | 64位 | 48 | 30 |
NVIDIA GeForce GTX1050 | 640 | 1455 | 2 GB GDDR5 | 128位 | 112 | 75 |
NVIDIA GeForce GTX1050Ti | 768 | 1392 | 4 GB GDDR5 | 128位 | 112 | 75 |
NVIDIA GeForce GTX1060 3 GB | 1152 | 1506/1708 | 3GB GDDR5 | 192位 | 192 | 120 |
NVIDIA GeForce GTX1060 6GB | 1280 | 1506/1708 | 6 GB GDDR5 | 192位 | 192 | 120 |
NVIDIA GeForce GTX1070 | 1920年 | 1506/1683 | 8GB GDDR5 | 256位 | 256 | 150 |
NVIDIA GeForce GTX1070Ti | 2432 | 1607/1683 | 8GB GDDR5 | 256位 | 256 | 180 |
NVIDIA GeForce GTX1080 | 2560 | 1607/1733 | 8 GB GDDR5X | 256位 | 320 | 180 |
NVIDIA GeForce GTX1080 Ti | 3584 | 1480/1582 | 11 GB GDDR5X | 352位 | 484 | 250 |
NVIDIA GeForce GTX Titan Xp | 3840 | 1582 | 12 GB GDDR5X | 384位 | 547 | 250 |
人工智能和Volta架构
Nvidia的GPU广泛用于深度学习,人工智能和加速分析大量数据的领域。 该公司开发了基于GPU技术的深度学习 ,以利用人工智能解决诸如癌症检测,天气预报和自动驾驶汽车(例如著名的特斯拉)之类的问题。
Nvidia的目标是帮助网络学习“思考 ”。 Nvidia的GPU非常适合深度学习任务,因为它们是为并行计算而设计的,并且可以很好地处理深度学习中普遍使用的矢量和矩阵运算。 研究人员,实验室,技术公司和商业公司都使用该公司的GPU。 2009年,英伟达参加了深度学习的大爆炸 ,因为深度学习神经网络与公司的图形处理单元相结合。 同年,Google Brain使用Nvidia的GPU创建了能够进行机器学习的深度神经网络,Andrew Ng决定让他们将深度学习系统的速度提高100倍。
2016年4月,英伟达推出了基于8-GPU集群的DGX-1超级计算机 ,通过将GPU与专门设计的软件相结合来增强用户使用深度学习的能力。 Nvidia还开发了基于GPU的Nvidia Tesla K80和P100虚拟机 ,可通过Google Cloud(可在2016年11月安装)获得。Microsoft在其N系列预览中添加了基于Nvidia GPU技术的服务器,基于Tesla K80卡。 Nvidia还与IBM合作创建了一套软件套件,以增强其GPU的AI功能。 2017年,英伟达的GPU也在RIKEN富士通高级智能项目中心上线了。
2018年5 月 , 英伟达人工智能部门的研究人员意识到机器人可以通过简单地观察做同样工作的人来学习做某事的可能性。 为了实现这一目标,他们创建了一个系统,经过简短的审查和测试,现在可以将其用于控制下一代通用机器人。
Volta是Nvidia开发的最先进的GPU微体系结构的代号 ,它是Pascal的继任架构,并于2013年3月宣布为未来路线图的一部分。该架构以Alessandro Volta命名。 ,电池的物理学家,化学家和发明家。 尽管Volta架构使用的是Nvidia Titan V图形卡,但它尚未进入游戏领域,后者主要面向消费领域,也可以在游戏设备中使用。
这款Nvidia Titan V是基于GV100内核的图形卡和三个HBM2内存堆栈,全部封装在一起 。 该卡总共具有12 GB的HBM2内存,可通过3072位内存接口工作。 其GPU包含2100万个晶体管,5120个CUDA内核和640个Tensor内核 ,可在深度学习中提供110 TeraFLOPS性能。 其工作频率为1200 MHz基本频率和Turbo模式下的1455 MHz,而内存工作于850 MHz,提供652.8 GB / s的带宽。 最近宣布了CEO版本,该版本可将内存增加到32GB。
Nvidia生产的第一款具有Volta架构的图形卡是Tesla V100 ,它是Nvidia DGX-1系统的一部分。 Tesla V100使用2017年6月21日发布的GV100内核 。 Volta GV100 GPU内置12nm FinFET制造工艺,具有32GB HBM2内存,能够提供高达900GB / s的带宽。
Volta还实现了最新的Nvidia Tegra SoC,名为Xavier,该芯片于2016年9月28日发布。Xavier包含70亿个晶体管和8个定制ARMv8内核,以及带有512个CUDA内核和TPU的Volta GPU 。称为DLA(深度学习加速器)的开源(张量处理单元)。 Xavier可以实时以8K Ultra HD分辨率(7680×4320像素)对视频进行编码和解码,由于采用了12种制造工艺,所有这些器件的TDP为20-30瓦,芯片尺寸估计约为300mm2。 nm FinFET。
Volta架构的特点是率先包含Tensor Core ,这些内核专门设计用于在深度学习任务中提供比常规CUDA内核更好的性能。 张量核心是将两个FP16 4×4矩阵相乘,然后使用合并的加法和乘法运算将第三个FP16或FP32矩阵添加到结果中的单元 ,获得可以有选择地降级为FP16结果的FP32结果。 张量核旨在加速神经网络训练。
Volta还因其包括先进的专有NVLink接口而引人注目,该接口是 Nvidia开发的用于短程半导体通信的基于有线的通信协议 ,可用于基于以下处理器系统的数据代码传输和控制。 CPU和GPU,以及仅基于GPU的CPU和GPU。 NVLink在其第一个和第二个版本中指定了点对点连接,每个数据通道和每个地址的数据速率分别为20和25 Gb / s 。 对于输入和输出数据流的总和,实际系统中的总数据速率为160和300 GB / s。 迄今为止推出的NVLink产品专注于高性能应用程序空间。 NVLINK于2014年3月首次发布,它使用由Nvidia开发和开发的专有高速信号互连。
下表总结了基于Volta的卡的最重要的功能:
NVIDIA VOLTA图形卡 |
||||||||
CUDA核心 | 核心张量 | 频率(MHz) | 记忆体 | 记忆体介面 | 内存带宽(GB /秒) | TDP(宽) | ||
特斯拉V100 | 5120 | 640 | 1465 | 32GB HBM2 | 4, 096位 | 900 | 250 | |
GeForce Titan V | 5120 | 640 | 1200/1455 | 12 GB HBM2 | 3, 072位 | 652 | 250 | |
GeForce Titan V CEO版 | 5120 | 640 | 1200/1455 | 32GB HBM2 | 4, 096位 | 900 | 250 |
英伟达的未来经历图灵和安培
根据迄今为止出现的所有谣言, 未来的两种Nvidia体系结构将是Turing和Ampere ,当您阅读本文时,很可能已经正式宣布了其中的一种。 到目前为止,关于这两种体系结构尚无定论 ,尽管据说图灵将是面向游戏市场的Volta的简化版本 ,实际上,预计将采用相同的12 nm制造工艺。
安培听起来像图灵的继任者架构,尽管它也可能是沃尔特在人工智能领域的继任者。 对此一无所知,尽管可以预见它将以7 nm的速度制造似乎是合乎逻辑的。 有传言称,英伟达将在八月的下个月在Gamecom上发布其新的GeForce卡,只有到那时,我们才会怀疑图灵或安培究竟是什么。
NVIDIA G-Sync,结束图像同步问题
G-Sync是Nvidia开发的专有自适应同步技术 ,其主要目的是消除屏幕撕裂现象,并消除对诸如Vsync之类的软件形式的替代品的需求。 G-Sync 通过强制屏幕适应输出设备 ,图形卡而不是输出设备适应屏幕的帧速率来消除屏幕撕裂 ,从而导致图像撕裂屏幕。
为了使显示器与G-Sync兼容,它必须包含Nvidia出售的硬件模块 。 AMD(Advanced Micro Devices)已发布了一种类似的显示器技术,称为FreeSync,该技术具有与G-Sync相同的功能,但不需要任何特定的硬件。
英伟达(Nvidia)创建了一项特殊功能,以避免在屏幕上绘制副本时准备新帧的可能性,这可能会产生延迟和/或卡顿现象, 模块会预期更新并等待下一帧完成 。 在非固定的更新方案中,像素过载也会引起误解,解决方案可以预测下一次更新的时间,因此,应针对每个面板实施并调整过载值 ,以避免重影。
该模块基于具有156K逻辑元件,396个DSP模块和67个LVDS通道的Altera Arria V GX系列FPGA 。 它是采用TSMC 28LP工艺生产的,并与三块芯片组合在一起,用于总共768 MB的DDR3L DRAM,以实现一定的带宽。 所使用的FPGA还具有LVDS接口来控制监视器面板。 该模块旨在代替普通的攀登机,并由监控器制造商轻松集成,监控器制造商只需要照顾电源电路板和输入连接即可。
G-Sync由于其专有性而受到批评,而且当存在免费替代产品时,它仍会得到推广,例如 VESA Adaptive-Sync标准,它是DisplayPort 1.2a的可选功能。 尽管AMD的FreeSync基于DisplayPort 1.2a,但G-Sync需要Nvidia制造的模块,而不是通常的屏幕缩放器,Nvidia GeForce显卡才能正常工作,并与Kepler,Maxwell,Pascal和伏
下一步就是采用G-Sync HDR技术 ,顾名思义,该技术 增加了HDR功能,从而大大改善了显示器的图像质量 。 为了使之成为可能,必须在硬件上做出重大飞跃。 这款新版本的G-Sync HDR 使用Intel Altera Arria 10 GX 480 FPGA ,这是一种高度先进且高度可编程的处理器,可以对其进行编码,以实现广泛的应用, 同时还配有Micron的3 GB DDR4 2400MHz内存 。 这使得这些显示器的价格更加昂贵。
至此,我们结束了您对Nvidia的所有了解。 请记住,您可以在社交网络上共享它,以便吸引更多用户。 如果您有任何建议或要补充的内容,也可以发表评论。
摩托罗拉Moto G:所有信息
关于摩托罗拉Moto G的一切:技术特性,图像,电池,相机,操作系统,可用性和价格。
Nvidia rtx【所有信息】
我们已经有了新的NVIDIA RTX显卡。 从旗舰机型:NVIDIA RTX 2080 Ti到最适合4K游戏玩家的机型:
vid Nvidia Quadro【所有信息】?
有关Nvidia Quadro专业显卡的所有信息:特性,设计,性能,优缺点✅