主页 > 课堂发明 >处理器运算效能知多少?Intel 再次强调真实世界应用重要性

处理器运算效能知多少?Intel 再次强调真实世界应用重要性

作者: 时间:2020-05-22 303° 课堂发明

Intel 昨日在台同步举办第十代 Core 系列处理器代号 Comet Lake 发表会,会后更聚集技术型媒体针对桌上型与行动版处理器效能进行交流,除了能够先行一窥 Ice Lake 内建显示绘图、深度学习指令集加速效果,亦针对硕果仅存 2 家主要 x86 处理器厂商效能测试方式提出解方。

代号 Ice Lake 的第十代 Core 系列行动版处理器,採用 Intel 第二代 10 奈米製程,相对使用于第一代 Cannon Lake Core i3-8121U,本次 Ice Lake 才算是首批大量出货 10 奈米产品。Ice Lake 在微架构、指令集、内建显示绘图、I/O 等也跨出一大步,Sunny Cove 微架构对比使用已久的 Skylake 进步不少,Gen11 更依赖众多 EU 达成 Gen9 1.7 倍~1.8 倍效能。

内建显示绘图效能部分,Intel 将 Ice Lake U cTDP 调整至 25W,以便和 TDP 25W AMD Ryzen 7 3700U 进行比较。藉由 Total War: THREE KINGDOMS「全军破敌:三国」游戏实测,在相同设定之下,Ryzen 7 3700U 表现仅为 18.5FPS,而 Ice Lake U cTDP 25W 则有 32.2FPS,因此玩家确实能够期待 Gen11 所带来的效能增长幅度,也别忘了 Gen11 还支援 Variable Rate Shading,降低画面当中不重要物件的 shading rate。

处理器运算效能知多少?Intel 再次强调真实世界应用重要性 ▲ 使用 Total War: THREE KINGDOMS「全军破敌:三国」游戏实测,Ice Lake U cTDP 25W 画面张数甚至能够胜过 Ryzen 7 3700U。

处理器运算效能知多少?Intel 再次强调真实世界应用重要性 ▲ Ice Lake U 内建 Gen11 显示绘图处理器支援 Variable Rate Shading,开启此功能之后,3DMark VRS feature test 画面张数提升约 40.7%。

另一方面,Ice Lake 所增加的 AVX-512 系列指令集,市场行销名词 DL Boost 能够强化深度学习方面的运算效能,Intel 于会场展示 AIXPRT Image Classification 应用,使用电脑辨识照片当中的生物。Ice Lake U 每秒能够辨识约 164.48 张图片,Ryzen 7 3700U 每秒约辨识 26.15 张,差距不小。

处理器运算效能知多少?Intel 再次强调真实世界应用重要性 ▲ 深度学习应用,Ice Lake U 于 AIXPRT Image Classification 展示程式效能约为 Ryzen 7 3700U 的 6.3 倍。

处理器运算效能知多少?Intel 再次强调真实世界应用重要性 ▲ 电池续航力不用多说,一向都是 Intel 的强项。

针对竞争对手第三代 Ryzen 桌上型处理器利用 Cinebench R20 展示 IPC 效能一事,Intel 表示 Cinema 4D 多用于大型专案渲染工作,例如商业广告或是电影等,一般消费者日常并不太容易接触到此软体。依笔者看法,Cinebench R20 能够反映第三代 Ryzen 桌上型处理器部分优秀面向,例如 AVX2 浮点运算效能、大型快取带来的优势,但玩家应该也要同时参考其它不同类型测试。

如同我们的处理器评测项目多元,于截稿或是 NDA 时限之前,笔者均会尽量多提供一些效能数据,并依据双方微架构的不同,分析各种应用的优缺点。加上 x86 微架构演化至今,AMD 与 Intel 双方在设计时各有取捨,例如 Intel 设计并同时製造晶圆晶片,因此设计和製造双方相辅相成,至今仍多使用单一晶粒设计;AMD 则因交由 GlobalFoundries 或是 TSMC 代工,因此选择较有效率的多晶片封装方式。

Intel 所提出来的多晶片组装劣势之一,即为 Infinity Fabric 资料存取、传递延迟。依据 Intel 内部测试,第三代 Ryzen 桌上型处理器单一 CCX 内部核心相互存取的延迟约为 33ns(约略值,依据运作频率不同略有增减),不同 CCX 之间则约为 78ns,CCX 和系统记忆体之间约为 75ns。Intel 目前主流市场均使用 ring 汇流排架构串联处理器内部核心、LLC、GPU、SA 等区块,因此相互存取延迟均为 44ns,对外存取系统记忆体则是约 62ns。

处理器运算效能知多少?Intel 再次强调真实世界应用重要性 ▲ 由于 AMD 和 Intel 双方处理器内部互连架构的不同,AMD 存取延迟比较高。

AMD 并非不知道 Infinity Fabric 互连延迟相对 Intel ring 汇流排略高的缺点,因此每个 CCD 晶粒均有大型 L3 快取,行销名词 Game Cache 用于填补存取延迟对效能的影响。当应用模式不利于预测模型导致 cache miss,或是资料组 data set 过大放不进 L3 快取时,AMD 较高的存取延迟就会对效能产生影响。

处理器运算效能知多少?Intel 再次强调真实世界应用重要性 ▲ cache miss 机率过高、data set 过大,因而考验处理器对外存取系统记忆体的效率,Intel 以 Core i7-9700K 和 Ryzen 9 3900X 执行流体模拟示範。

处理器运算效能知多少?Intel 再次强调真实世界应用重要性 ▲ 左方为 Ryzen 9 3900X 执行成绩,需要 17 分 49 秒,右方为 Core i7-9700K 执行成绩,仅需 15 分 24 秒。

综上所述,AMD 和 Intel 双方 x86 微架构不同,各自考量与取捨的先后顺序更是大异其趣,因此双方效能并非单方压制另外一方,而是根据使用者的实际使用情境出现变化,过去习惯参考单一 CPUMark 99 分数选择产品早已不适用,玩家应以自身使用情境,如游戏导向、生产力工作导向、渲染绘图导向、多工综合应用......等,再参考我们以及各大信誉良好媒体所製作的评测,选择对自己最佳的产品。

处理器运算效能知多少?Intel 再次强调真实世界应用重要性 ▲ 以 Intel 观点而言,Core i9-9900K/i7-9700K 和 Ryzen 9 3900X 相互比较,虽然在 Cinebench R20 多执行绪不敌对手,但在其它多种实际应用仍有领先优势。

上一篇:
下一篇: