基准:这是什么? 有什么用 历史,类型和提示
目录:
基准测试是我们日常硬件分析的重要组成部分,它们使我们能够为您提供不同组件(例如CPU,图形卡,存储单元等)之间科学上可比的测量结果。 今天,我们将为它的历史,类型,它们的工作方式 ,它们的度量 ,最常见的度量提供一些思路,我们还将为您提供一些提示,说明如何执行它们以及我们应该信任哪些方法。
我们今天在PC或移动世界中所知道的基准是从工业环境继承而来的技术,这些技术自革命以来就允许在受控环境中基于可比数据进行决策。
现代计算机世界将这些技术几乎应用于其许多不同领域,并且家庭用户也已将它们作为可靠的方式来了解我们系统的性能和功能以及何时获得重要信息的可靠方式。做出重要决定,例如购买我们的新计算机,手机,图形卡等。
今天,我们将讨论PC基准测试的历史,现有基准测试的类型以及系统的哪些组件更适合这种类型的测试,而不仅仅是性能 。
内容索引
历史沿革
基准或测量系统采用受控的环境和可识别的措施,这些措施和方法在科学上是可比较和可验证的,并且自从存在以来就与计算机领域共存。 这样, 基准已经民主化,以致失去了其基本本质的一部分,即它可以由第三方进行审核和验证。 现在,我们将其更多地用作性能的快速比较,但是第三方对它的准确性的可追溯性无疑已经大大丧失了。
最经典的基准测试方法始终是指系统CPU的计算能力,尽管最近它在不同组件之间有所不同,因为这些组件在计算机中已占优势和重要性。
仍然使用的两个最经典的度量单位是Dhrystones和Whetstones。 在某种程度上,两者都已成为我们今天所知道的所有综合基准的基础。
最古老的是磨刀石 ( Whetstones) (英国国家电力公司的原子能部门所在的英国本地),后来, Dhrystone用第一个名字命名(湿法和干法)。
第一个是70年代设计的,第二个是80年代设计的,两者都是我们连续几年拥有比较性能的基础。 精简的磨刀石可让您深入了解处理器在浮点运算(具有大量小数的运算)中的计算能力。
Dhrystone是它的对应物,因为它专用于不带小数的基本指令,两者都通过两种完全不同但互补的方法清晰地描绘了处理器的性能。 磨刀石和Dhrystone衍生了两个概念,即我们今天更常用的MIPS和FLOP 。
在进行这些测量之后,出现了诸如FLOP(浮点算术-浮点算术)之类的其他术语 ,由于它是许多现代技术中高级计算的基础,因此在计算机中现在比以往任何时候都更加重要。例如人工智能算法,医疗算法,天气预报,模糊逻辑,加密等。
LINPACK由工程师Jack Dongarra在1980年代开发,并在今天继续用于测量所有类型系统的浮点计算能力。 当前有根据体系结构,CPU制造商等优化的版本。
FLOPS填补了我们有关图形卡(一定是熟悉的单精度或双精度),处理器的文章,并且是计算运行中或开发中的任何超级计算机的电源要求和硬件开发的基础。
FLOP是当今行业中最需要的性能测量单位,但它一直与MIPS(每秒数百万条指令)结合使用,这是一个有趣的测量指标,因为它可以提供给我们大量的指令处理器每秒可执行的基本算术,但与其他度量单位相比,它更多地取决于处理器的体系结构(ARM,RISC,x86等)和编程语言。
随着性能的提高,乘数发生了。 现在,我们在GIPS和GFLOPS中测量家用CPU的性能。 基数保持不变,经典算术运算。 Sisoft Sandra在其一些综合基准中继续为我们提供此类测量。
MIPS还被更多地归类为CPU,而FLOP则扩展到了其他蓬勃发展的领域,例如处理能力或对特定任务(例如我们都安装在处理器或处理器上的GPU)非常侧重的前处理器的一般计算。我们专用的扩充卡。
对于这些基本概念,时间已在增加新的度量单位,而新的度量单位比现代计算机或超级计算机中的度量单位重要或重要。 数据传输是已变得非常重要的一种措施,目前以IOP ( 每秒的输入和输出操作)以及其他形式(例如MB / GB / TB存储措施)与花费时间相比进行了度量。从一个点到另一个点的传输(MBps-兆字节每秒)。
AS-SSD可以MBPS或IOP来衡量硬盘的性能。
当前,我们还以不同的乘数来使用转移度量,作为解释两点之间的信息传递速度的一种方式,当发出某些信息时,我们实际上必须生成更多的信息。 这取决于用于信息传输的协议。
PCI Express接口中是一个清晰的示例,并且我们经常使用。 在此协议下,对于我们要移动的每8位信息(0或1s),我们必须生成10位信息,因为该额外信息用于控制为纠错,数据完整性等发送的通信。
IP(它是您用来阅读本文的一种协议,也使您的300MT / s连接实际上提供了不到300mbps的速度),这也是引入真实信息“丢失”的其他知名协议。
因此,当我们引用接口发送的原始信息而不是在接收器中实际处理的信息时,我们使用Gigatransfer或传输。 实际上,一条8GT / s PCI Express 3.0数据总线正在为连接在这些点之间的每条线发送6.4GBps的信息。 通过将PCI Express协议集成到家用和专业计算机的所有主要总线中,传输已变得非常重要。
近年来,我们还开始将度量作为一种将处理能力与现代计算中其他非常重要的因素联系起来的方式进行组合,其中消耗是这些度量之一,被引入作为两个系统性能之间的比较规模。 今天,能源效率比过程功率重要或重要,因此很容易看到基准,这些基准根据测量元素的消耗瓦特来比较过程功率。
实际上,超级计算机的宏大列表中的一个并没有太多地涉及所有计算节点之间的计算机总功率,而是基于整个系统消耗的瓦特或能量来开发该功率。 Green500清单( 每瓦 FLOPS- 每瓦FLOPS )清楚地表明了现在的消费量是任何自重基准的基础,尽管毫无疑问,我们所有人都将继续密切关注未将此因素作为调节因素的TOP500清单。
基准类型
尽管我们可以谈论更多的基准族或基准类型,但我还是会在最接近我们所有人(或多或少的高级用户)的两个最普通类中简化清单。
一方面,我们拥有综合基准 ,这些基准在很大程度上为我们提供了我们之前讨论过的措施。 综合基准是使用针对特定平台和体系结构的或多或少稳定的程序代码执行受控测试的程序。 它们是执行非常特定的测试的程序,这些程序可以集成我们的一个或多个组件,但是始终执行相同的测试 ,而无需更改。
图像渲染一直是了解现代系统中CPU性能的好方法,因为这是一项艰巨的任务。 Cinebench R15还进行了几项测试,其中一项针对GPU,两项针对CPU,我们可以在其中了解具有多个内核和进程线程的系统的性能。
它们提供了一个受控的测试环境,除版本外没有任何更改,并且正确记录了这些更改,以便用户知道可以相互比较哪些版本。 这些类型的程序可以使用其他代码段或特定的基准测试来分别测试计算机的不同子系统,以执行某种类型的测试,或者将其组合在一起,从而可能会影响一个,两个或多个系统组件的性能。 集成在游戏或Cinebench ,Sisoft Sandra, SuperPI , 3DMark等程序中的基准是合成基准的明确示例。
我们不应该与真实基准混淆的其他综合基准是模拟真实程序的执行或在真实程序中执行动作脚本的基准,它们也是综合的,因为测试中没有随机性,PC Mark是一个明显的例子。综合基准程序,我们可以将其与真实基准混淆。
实际基准测试是一种非常不同的测试方法,因为它接受使用程序衡量其性能的随机性。 当我们根据硬件的可能性调整游戏的质量参数时,玩家会习惯执行此类基准测试或性能测试。
在玩游戏时衡量游戏性能是真正的基准。
当您打开游戏提供的FPS并尝试连续达到所需的60FPS时,它们便在执行真正的基准测试。 可以将其推论到任何其他类型的程序,如果您是开发人员,则在优化程序代码时,您还将进行真正的基准测试,其中测试代码的更改或执行方式在以下平台上进行:稳定或可变的硬件。
两种类型的基准都很重要,第一种基准使我们可以在受控环境中将系统与其他基准进行比较,第二种基准是优化操作的一种方式,其中还添加了两个重要因素,即执行的随机性和人为因素。 这两个因素为我们要测试的一个或多个组件的性能提供了另一种观点。
基准测试时的注意事项
为了使基准有用且有效,我们必须考虑到某些确实重要的因素。 在不同平台和体系结构之间进行比较会引入一个重要的不确定性因素,这就是为什么这种类型的基准测试可以使您将iOS手机与Windows x86计算机进行比较的原因,举个例子,您必须使用镊子,因为它不仅会改变操作系统内核,但是处理器体系结构有很大不同。 此类基准测试的开发人员(例如Geekbench)在其难以控制的不同版本之间引入了校正因子。
因此,基准在不同硬件之间具有可比性的第一个关键是测试生态系统应尽可能类似于基准平台 ,操作系统,驱动程序和软件版本。 这里肯定会有一些我们无法控制同质化的元素,例如如果我们针对Nvidia图形测试AMD图形,则是图形控制器,但是其余的我们必须尝试使其尽可能稳定。 在这种情况下,我们还将包括硬件,因为要比较图形卡,您要做的就是使用相同的操作系统,相同的处理器,相同的内存以及所有运行参数,并使其保持相同,包括基准测试中的质量,分辨率和测试参数。 我们的测试生态系统越稳定,我们的结果就越可靠和具有可比性。
我们建议阅读如何知道处理器是否存在瓶颈?
我们还必须考虑的另一件事是,基准测试通常会对我们要测试的硬件施加压力 ,并且通常使该硬件经受正常情况下在系统正常使用中不会出现的情况。 我们从硬盘驱动器,图形卡或处理器获得的每个基准测试都会将其提交给可能对硬件造成危险的情况,因此,我们必须制定适当的措施,以使应力点不会成为断裂点,或者在性能降低的一个要素,因为许多组件具有保护系统,例如在超出使用范围的温度下,保护系统会降低其性能。 适当的冷却,两次测试之间的休息时间,正确输送被测部件……一切都应处于理想状态,以使测试顺利进行。
另一方面,我们也正是使用这类基准测试,以便使系统承受压力,以便在这种情况下查看其稳定性 ,这是应用基准测试的另一种方式,因为它不仅要了解性能,而且要了解性能。如果系统在这些压力较大的情况下能够正常运行,则系统将保持稳定甚至更高。
结论
对于那些致力于专业测试计算机硬件的人来说,基准测试是一种工作工具,而且由于有了它, 用户才能以科学,可验证的方式比较或了解我们下一代计算机在其每个子系统中的性能,并能精确地了解其性能 。可与工业水平上使用的工具相比。
就像您在图像中看到的那样,测试表试图精确地标准化测试方法,以使比较基准尽可能可靠,并且在引入修改结果的变量时可以进行测试。
但是,就像任何“实验室”测试一样,要使其可靠,必须要有适当的条件来执行它,甚至要使它在不同系统之间具有可比性。
今天,我们向您介绍了这类程序的历史,它的不同类型,它们的工作方式以及如何从中获得可靠的信息。 它们很有用,但对我来说,它们只是要记住的另一条信息, 我将始终将其置于个人经验和使用我们每天都会使用的真实程序进行主动测试的背后。
基准可以很好地将最低性能数据放入我们的决策过程中,但是它们不应定义这些决策,并且作为最后的提示,请避免使用声称能够在架构,操作系统等之间进行性能比较的综合基准。
叶问:这是什么,它如何工作以及如何隐藏它
什么是IP,它如何工作以及如何隐藏我的IP。 您需要了解有关IP的所有信息,以安全地导航并隐藏在Internet上。 含义IP。
vid什么是nvidia的光线追踪? 有什么用
我们解释说,这是Nvidia在其新的RTX显卡中推出的Ray Tracing✅✅它的作用是什么?
→欠压:这是什么? 有什么用 以及如何做?
电压过低或时钟不足是处理器或显卡消耗更少的热量和更少热量的好习惯。 ☝