Geekbench版本6的创建者以及为什么基准测试在现实世界中很重要

2023-02-18 10:42:39冷酷的灯泡

我们在Ars 审查了很多硬件,审查过程的一部分涉及运行基准应用程序。我们使用的确切应用程序可能会随着时间和我们试图测量的内容而改变,但目的是相同的:比较两个或多个事物的相对性能并确保产品在现实生活中的性能与他们在纸上做。

Geekbench版本6的创建者以及为什么基准测试在现实世界中很重要

十多年来, Geekbench一直是我们测试套件的一部分,这是一款 CPU 和 GPU 计算基准测试,今天发布了第六个主要版本。部分原因是它体积小、免费且易于运行;部分原因是开发商 Primate Labs 维护着一个庞大的可搜索数据库,涵盖数百万台设备上的数百万次测试;部分原因是它几乎可以在阳光下的任何东西上运行,因此 Geekbench 已成为 Internet 上最常用(也是争论最多的)基准测试工具之一。

“我真的很高兴人们似乎已经抓住了它,”Primate Labs 的创始人和 Geekbench 的创建者John Poole在谈到 Geekbench 的受欢迎程度时告诉 Ars。“我知道 PCWorld 的 Gordon Ung 基本上称 Geekbench 为 Twitter 争论的官方基准,这是它的后果。”

从一开始就跨平台

Geekbench 的跨平台兼容性是其吸引力的一部分,从最早的版本开始就已经融入了基准测试。它始于 PowerPC Mac 时代的鼎盛时期,当时 Apple 的硬件异国情调且小众,在 Mac OS X 上运行的应用程序相对较少。

“大约在 2002 年,我才转向 Mac,”Poole 告诉 Ars。“所以我习惯了那个生态系统。然后[Power Mac] G5出来了,我想,哦,这看起来真的很酷。我出去买了一个新的 G5,感觉它比我以前的 Mac 慢.我想,好吧,这真的很奇怪;发生了什么事……所以,你知道,我抓住了我可以下载并运行的[基准测试],但我真的很困惑,因为基准测试说的不是以我的经验为乐。

“所以我真的去了,我对一个流行的基准进行了逆向工程,发现测试,由于缺乏更好的词,太糟糕了,”Poole 说。“他们并没有真正测试任何实质性的东西,你知道,对非常少量的数据进行非常简单的算术运算,没有真正测试任何东西。所以我想,写一个基准有多难?也许我应该写我的自己的。”

最初的 Geekbench(称为“Geekbench 2006”,显然已经过时了)在发布时支持 Windows 和 macOS。2007 年发布的Geekbench 2增加了对 Linux 的支持。随后于 2010 年推出了正式的 iPhone 版本,并于 2012 年推出了Android 版本。自 Geekbench 3 于 2013 年年中发布以来,大约每三年发布一次具有新重点领域和重新制定测试的改进版本。

并且不仅仅是可以运行 Geekbench 的主流通用硬件和软件。Geekbench可以在 PlayStation 3 的 Cell 处理器上运行([不是] 作为通用 CPU 令人印象深刻,”普尔当时写道)。甚至有一个版本可以在短命的黑莓 10上本地运行。在 Ars,我们已经在各种设备上运行它,从古怪的全开源 MNT Reform 笔记本电脑,第一波 Android Wear 智能手表,到数百台台式机、笔记本电脑、手机和平板电脑。

Geekbench 6 的新功能

Geekbench 会不断更新错误修复、特定测试的更新以及解决新硬件问题的改进,但基准测试的新主要版本是一个让软件更彻底地重新思考的机会。

在 Geekbench 6 中,最大的变化可能是多核分数的计算方式,衡量的是“核心如何合作完成一项共享任务”,而不是为每个核心分配不同的任务。这是为了更好地反映实际多核工作负载的运行方式,特别是混合 CPU 架构,混合了大型、快速的内核和小型、节能的内核,这是一种不断增长的芯片类别,包括大多数现代 ARM 处理器和英特尔的第 12-和第 13 代 CPU。

许多 Geekbench 5 时代的测试现在使用更大的数据集运行,并且有新的测试用于在视频通话期间模糊背景和运行机器学习模型,这两件事现在比 2019 年发布 Geekbench 5 时更常见。

“当你看看人们如何使用他们的智能手机时,从 2019 年到 2023 年的一个简单变化就是他们相机的智能手机传感器尺寸,”Poole 告诉 Ars。“iPhone 有48 兆像素的传感器。我认为,三星的一些手机上有高达 108 兆像素的传感器。我已经忘记了。但是你已经看到了正在发生的相机数据爆炸。你也有新的应用程序不一定在 2019 年......我在 2019 年没有进行视频会议,现在我每天大部分时间都在电脑前这样做。所以,你知道,我们增加了工作负载,可以捕获其中一些,对性能的影响。”

机器学习 (ML) 也是 Geekbench 6 的关注点,但程度不及Geekbench ML(Primate Labs 的 ML 特定基准)。(Geekbench ML 使用您设备的 CPU、GPU 和 AI 加速硬件运行测试,如果有的话;Geekbench 6 仍然是一个主要以 CPU 为中心的基准测试。)

“谈到视频会议应用程序,”Poole 继续说道,“当你做任何类型的背景效果时 [to] 隐藏你凌乱的背景或类似的东西,那就是在后台使用 ML 将图像分割成前景和背景,然后应用模糊。所以,你有一个专门用来捕捉那种性能的工作负载......照片库应用程序,像 Apple Photos 或 Google photos 之类的东西,他们将在自动标记图像的背景。”

其他更改只是为了解决对应用程序正在测试的内容的困惑。这包括删除广泛的子分数类别,如“整数”和“加密”,后者经常让 Geekbench 用户(甚至一些 Ars 评论者)感到困惑,他们错误地认为它衡量的是加密货币挖掘性能而不是加密硬件加速。一些单独的测试也已重命名。

“拥有称为‘相机’的工作负载会让人们认为我们实际上是在测试相机,”Poole 说。“我记得在 [Geekbench] 5 发布后,我们介绍了相机工作负载,人们说,‘哦,这是在测试相机。’ 我只是,我记得坐在我的办公桌前说,‘哦,哇,我们真的把那个搞砸了。’”

推荐阅读

阅读排行