见见Xe HPG,英特尔首批显卡内的跳动之心

文章:《见见Xe HPG,英特尔首批显卡内的跳动之心》_配图这是一个新的竞争时代的开始。
今天,英特尔发布了其首次亮相的Arc图形处理器,预示着其长期被戏弄的进入独立消费显卡领域。
英伟达和AMD要当心了。
Chipzilla现在处于竞争之中,由其新的Xe HPG(高性能游戏)GPU架构推动。
英特尔在Arc的首次亮相中采取了不寻常的(但在战略上明智的)方法,为价格适中的便携式笔记本电脑推出了Arc 3显卡。
它使公司能够利用其在笔记本电脑和软件支持方面的强大优势,而不是在台式机游戏帧速率方面大打出手,而英伟达和AMD在台式机上站稳了脚跟。
我们已经在单独的一篇文章中介绍了Arc 3笔记本电脑GPU的展示和英特尔的杀手级功能,解释了日常人们应该从这一新一代笔记本电脑中期待什么。
有一些非常引人注目的东西,包括关键的“深度链接”功能,当您将Intel Arc GPU与Intel Core处理器配对时,这些功能会增加令人大开眼界的能力。
但这不是本文的重点。
作为展示的一部分,英特尔研究员Tom Peterson还向媒体提供了支撑这些Arc“炼金术士”显卡的Xe HPG架构的高级概述。
这是我们第一次看到支持英特尔独立显卡雄心的螺母和螺栓。
因此,正如我们对NVIDIA的Ampere和AMD的rDNA 2架构所做的那样,这里是关于英特尔Arc Xe HPG芯片内部的简短技术解释。
就像NVIDIA和AMD在设计中使用不同的技术和术语一样,英特尔的Arc芯片依赖于一些专有概念(包括需要解释的对时钟速度的新看法)。
这使得很难将Arc与竞争对手的GPU架构进行比较–英特尔甚至没有使用像Rop和TMUS这样的常用术语–但当我们完成这里的工作时,您将对Xe HPG的运行机制有一个坚实的高级理解。
让我们深入挖掘。
英特尔对于英特尔来说,Xe HPG“渲染切片”构成了每一个Arc GPU的主干。
英特尔的笔记本电脑和台式机Arc产品可以扩展或这些渲染切片是其核心,包含专用的光线跟踪单元、光栅化器、几何图形块和Arc的基本构建块,即Xe内核本身。
XE XPG可以一直扩展到Arc移动GPU中的八个渲染切片,由笔记本电脑形式的旗舰Arc A770M GPU代表。
每个渲染切片包含四个Xe核心和四个光线跟踪单元,以及运行现代GPU所需的所有其他位。
这些渲染切片完全兼容DirectX 12旗舰版,这意味着英特尔的Arc图形处理器可以处理光线跟踪、可变速率着色、网格着色以及与该标准相关的所有其他功能。
英特尔让我们深入了解Xe内核本身。
每个Xe核心(同样,每个渲染切片有四个)由三个关键比特组成:16个处理更传统的光栅化任务的256位“XVe”向量引擎,16个处理机器学习任务的1024位“XMX”矩阵引擎(就像NVIDIA的竞争对手RTX GPU中的张量核心),以及192KB的共享L1/SLM高速缓存。
这种缓存可以用来在计算工作负载期间保存任务,或者在游戏时保存着色器和纹理。
英特尔PC游戏中最大的几家公司可能正在押注光线跟踪是图形的未来,但目前传统渲染仍然是王道。
每个XE向量引擎都包括一个专用的浮点(FP)执行端口来处理传统的着色任务,以及一个共享的INT/EM端口,可以同时处理基于整数的任务。
NVIDIA通过其RTX 20系列“图灵”架构引入了并发FP/INT流水线,以防止整数任务阻塞FP32流水线,自那以来这已成为标准。
我们在2018年写道:“当NVIDIA检查现实世界游戏的表现时,它发现,每执行100条浮点指令,平均也会处理36条、多达50条非浮点指令,导致情况变得混乱。
”“新的整数管道句柄这些额外的指令与FP32流水线分开并与之并行。
同时执行这两个任务会大大提高速度。
英特尔英特尔专用的“XMX”矩阵引擎与每个Xe酷睿中的矢量引擎挂钩。
它们与NVIDIA的RTX张量核大体相似,旨在极大地加速机器学习任务。
这些都是XeSS的潜力,XeSS是英特尔吹嘘的NVIDIA DLSS上采样的竞争对手,以及其他特殊的SASE功能,如超级计算和英特尔新的弧控指挥中心的虚拟相机功能。
(再一次,阅读我们的Arc笔记本电脑GPU揭示了更深入地了解这些消费者级功能的内容。
)英特尔当被兼容的软件(如XeSS游戏或支持Hyper Compute的应用程序)点击时,XMX内核的4深度收缩阵列可以计算多达256次乘法累加(MAC)运算,每个时钟用于INT8推断,比带有DP4a硬件的现代GPU提供的64次运算/时钟和较旧的GPU支持的16次运算/时钟大幅增加。
英特尔的XeSS支持后备模式,在竞争对手没有XMX内核的Nvidia和AMD显卡上运行,默认使用DP4a硬件。
这张图很好地说明了为什么英特尔希望XeSS在内置XMX硬件的Arc GPU上运行得更快。
英特尔每颗Xe酷睿共有16个矢量和矩阵引擎,每个引擎成对同步运行,能够同时运行FP、INT和XMX任务。
Arc图形处理器确实可以保持非常非常繁忙的状态。
英特尔一直以其以闪电般的QuickSync技术为先导的媒体引擎而自豪,Xe XPG的媒体引擎也是如此。
它包括图形芯片的所有现代功能-各种8K HDR编码和解码支持、HEVC、VP9等等-但还有一个其他芯片(CPU或GPU)无法提供的重要功能:硬件加速的AV1编码。
高效的下一代视频标准是由一家公司开发的这是一个由行业巨头组成的联盟,并正在迅速成为标准,现代桌面GPU支持AV1解码,可以帮助您观看8K视频而不会让您的系统着火,但到目前为止,您需要单独使用软件来实际创建AV1视频。
英特尔表示,Arc解锁的硬件加速AV1创建速度比软件编码快50倍,或者它能够以与其他编码器相同的比特率提供更清晰的流媒体视频。
全英特尔笔记本电脑提供的Hyper Encode功能是该公司Deep Link套件的一部分,该套件利用了CPU和GPU中的媒体引擎,而不是其中之一,基于Arc的系统可能会对视频创作者产生极大的吸引力(当然,如果游戏性能达到要求)。
英特尔Xe HPG显示引擎在Arc GPU堆栈中保持一致,这意味着每个Arc显卡都提供相同的视频输出功能(尽管具体的端口配置因型号而异)。
如果你真的尝试在一对8K屏幕上玩游戏,不要指望有好的帧速率,但如果你想要所有的像素来完成你的工作任务,那么知道Arc会支持它是件好事!英特尔,让我们花点时间把所有这些技术讨论带回实际领域。
英特尔将一堆Xe内核和渲染切片拼凑成一对专为移动市场设计的Arc“炼金术师”图形处理器:更高端的ACM-G10和更普通的ACM-G11,这将出现在今天发布的首款Arc 3笔记本电脑中。
从那里,这些GPU可以被切片和切成小块,以满足不同的市场需求。
以下是第一代笔记本电脑的Arc显卡是如何脱颖而出的:Arc 3笔记本电脑今天发布,Arc 5和Arc 7笔记本电脑预计将在今年夏天早些时候推出。
在这些笔记本电脑GPU规格图表中,可能会有一些东西跳跃到你的脑海中:它们的超低时钟速度。
在这个时代,NVIDIA的图形处理器推动2 GHz,一些AMD图形处理器支持2.5 GHz,英特尔的Arc最高可达1650 MHz,GOI低至900 MHz的NG值有点让人瞠目结舌。
然而,竞争对手图形品牌之间的时钟速度并不像看起来那么清晰。
英特尔AMD针对Radeon GPU的“游戏时钟”与NVIDIA的“Boost Clock”不同,我之前已经解释过了。
英特尔正在为其Arc图形处理器使用另一种指标,称为“图形时钟”。
Petersen将Intel的图形时钟定义为特定GPU所针对的典型工作负载的平均时钟速度(例如,针对XPG的游戏以及针对工作站卡的可能的计算任务)。
如果您查看上面的笔记本电脑GPU图表,您还会看到为每个图表定义的TDP范围;图形时钟基于最低可用TDP。
换句话说,英特尔的图形时钟基本上代表了Arc GPU最糟糕的情况。
尽管如此,图形核心可以以不同的速度运行,这取决于它们被推的力度有多大-例如,在2D复古游戏中,它们会达到更高的速度,而在复杂的现代游戏中,它们的速度会低得多,这些游戏会击中Xe Core和渲染切片的每个部分。
瓦数也可以对性能产生巨大的影响;正如我们在NVIDIA的移动GeForce产品中所看到的那样,向GPU注入更多的能量可以帮助推动较低级别的GPU超过表面上更强大的兄弟图形处理器的低瓦数版本。
同样值得注意的是,时钟速度并不是一切。
在同一家公司的架构中,更快的通常是更好的–比方说,2 GHz的GeForce图形处理器会比1.5 GHz的快。
但AMD的台式机RADEON RX 6500 XT尽管配备了快得离谱的2.8 GHz时钟速度,但仍落后于其兄弟机型。
正如AMD的罗伯特·哈洛克最近在我们的完整Nerd播客中解释的那样,原始的时钟速度提高远远不是提高性能的唯一方法。
该公司的Ryzen7 5800X3D处理器实际上通过降低时钟速度和在芯片上放置一个巨大的高速缓存来大幅提升游戏性能。
这是我想说的复杂。
不要太深入地研究英特尔Arc GPU的时钟速度,直到PS和台式机显卡最终掌握在评审者手中。
英特尔,这就是我们的英特尔XE HPG架构之旅。
该公司在今天以移动为中心的发布会上保持了相当高的水平,但我们预计随着初夏Arc 5和7笔记本电脑的到来,以及Arc台式机显卡在第二季度的某个时候到来,我们将看到一份包含更多细节的白皮书发布。
如果所有这些关于矩阵引擎和媒体编码器的讨论让你既热又烦,请务必查看我们对Arc 3笔记本电脑GPU发布的单独报道,以更实际地了解英特尔在这些硬件功能上到底做了什么。
这些深度链接功能可能真的是一些非常美味的特别调味汁。
现在,剩下的就是等待审查了。
布拉德·查科斯整天都在台式电脑上钻研,发太多推文。
他专攻显卡和游戏,但涵盖了从安全到Windows提示和各种PC硬件的一切。

推荐阅读

文章:《新的Meta.ai网站可以立即绘制出令人惊叹的人工智能艺术》缩略图

新的Meta.ai网站可以立即绘制出令人惊叹的人工智能艺术

Meta已经推出了Meta.ai,这是一个专门针对人工智能的网站,它有一个竞争对手无法提供的酷钩子:它可以实时生成图像,甚至可以按需制作动画。 然而,有一个问题:Meta真的很想继续改进Meta.ai,要做到这一点,它只有在你登录到你的Facebook账户后才能提供图片生成。 Meta加入了其他LLMS或AI聊天机器人的行列,如Google Gemini、微软的各种风格的Copilot、Anthr…

文章:《Windows的人工智能未来可能会以高通为特色》缩略图

Windows的人工智能未来可能会以高通为特色

多年来,AMD,尤其是英特尔一直主导着个人电脑行业,即使在高通推出了用于笔记本电脑的首款骁龙处理器之后。现在,微软可能会让高通的骁龙X Elite处理器凭借即将推出的Windows功能占据主导地位–并将AMD和英特尔拒之门外。 今年5月,微软将在西雅图主办一年一度的构建大会。据微软称,微软将以首席执行官萨蒂亚·纳德拉的演讲拉开会议的序幕,他将“分享我们在硬件和软件方面的人工智能愿景”。…

文章:《Razer的新RGB鼠标垫是有史以来最闪亮的鼠标垫》缩略图

Razer的新RGB鼠标垫是有史以来最闪亮的鼠标垫

哈哈,Razer喜欢在东西上添加RGB灯。对于科技记者来说,这是一个很容易开的笑话,我承认我不止一次沉浸在这个笑话中。但说实话,Razer的产品通常非常时尚和独特,最近他们一直在使用RGB照明作为微妙的强调,而不是一个预先的卖点。但Firefly V2 Pro鼠标垫一直都是全RGB的。 Razer以前也制作过连接USB、注入RGB的鼠标垫,以至于你现在可以在亚马逊上找到模仿者,只需几美元。一般来说…