深入研究:Intel Arc的AV1视频编码是GPU流媒体的未来

文章:《深入研究:Intel Arc的AV1视频编码是GPU流媒体的未来》_配图

想象一下这样一个世界,在不消耗更多带宽的情况下,视频流可以拥有更高的质量,或者在对数据上限的影响减半的情况下具有相同的质量。在这个世界里,Twitch流并不是一团糟,YouTube视频实际上可以类似于你自己玩游戏的视觉体验。

这个世界就是AV1承诺的未来:一个新的开源视频编解码器,目标是在统治了近20年后,取代H.264作为主要视频标准。通常很难编码的实时AV1编码现在可以通过英特尔的首款Arc Aliciist显卡提供给消费者(尽管到目前为止,这款显卡仅限于中国,美国计划在今年夏天晚些时候发布)。

我使用定制的Gunnir Arc A380台式机卡对英特尔的GPU编码器进行了测试,看看它是否提供了我们迄今看到的AV1的承诺,以及它如何与现有的H.264编码器竞争,这些编码器通常用于直播。我还想解释为什么所有这些都如此重要。这里面有很多东西,所以让我们深入研究一下。

[进一步阅读:PC游戏的最佳显卡]

在H.264成为世界各地主要的视频编解码器之前,在线视频一团糟。我有很多美好的回忆,我的Windows 98和Windows XP电脑上充斥着各种各样的视频播放器应用程序,从QuickTime到RealPlayer,再到合法性可疑的DivX/Xvid播放器,所有这些都是为了玩AMV或从eMule或LimeWire下载的游戏预告片。然后,一旦YouTube开始流行起来,我们都不得不处理.FLV Flash视频文件。这很难跟上。H.264接管并被几乎所有的应用程序、网站和设备接受,感觉就像魔术一样。但随着年复一年的过去,视频标准的目标是更高的分辨率和更高的帧速率,对运行效率更高的视频编解码器的需求越来越大。

虽然H.264实际上是免版税的,但H.265仍然有很多专利和许可成本–这就是为什么你看不到很多消费者应用程序支持它,而且几乎没有直播平台接受它。

YouTube和Netflix转而几乎完全使用VP9(谷歌自己的开源视频编解码器),但同样,消费者应用领域几乎不存在采用VP9的情况,而且视频流媒体巨头似乎仍然希望获得更高的效率。

这就是开放媒体联盟的用武之地。AOM是一项合作努力,旨在为媒体流媒体开发开源、免版税和灵活的解决方案。AOM得到了几乎所有网络媒体大公司的支持,包括谷歌、Adobe、Nvidia、Netflix、微软、英特尔、Meta、三星、亚马逊、Mozilla,甚至苹果。AOM的重点是创建AV1(并通过安全的专利审查过程进行保护,并建立一个法律辩护基金以保持技术的开放),AV1是一个开源视频和图像编解码器的生态系统。已经开发了用于元数据甚至图像格式的工具,但我在这里重点介绍的是AV1比特流视频编解码器。

对于这么多大公司(以及竞争对手)来说,在一个单独的项目上合作可能看起来很奇怪,但最终这是一项对所有人都有利的努力。无论流媒体的未来如何,更低的带宽成本、更高质量的产品和更容易的互操作性似乎都击败了之前围绕每个人开发自己的封闭解决方案的理念的好处。

我个人唯一关心的问题是,这些公司中的许多公司在视频线上线下都在推动反消费者DRM的历史,以及这些过去的行动可能会如何影响AV1的实施。

所有这些都很棒,但你如何才能真正获得AV1视频呢?请记住,新的编解码器的采用通常非常缓慢,而AV1的发展非常快,综合考虑,你现在实际上可以在网上观看相当多的AV1。

从YouTube开始,你应该进入你的YouTube播放设置(在登录时),并选择“始终首选AV1”,以增加你实际获得AV1视频转码的机会。从那时起,任何5K或更高分辨率的视频都应该已经有AV1代码转换准备好播放。YouTube早在2018年也创建了这个“AV1 Beta发布播放列表”,其中包含一些样本视频,最初提供给AV1副本用于一些保证测试。据传闻,我已经看到越来越多的高流量视频,我经常在AV1上播放。

这段视频不会在视频播放器中为你显示任何不同的东西,但如果你在视频播放时用鼠标右键点击视频,然后点击“书呆子的状态”,如果一切正常的话,你应该会在“编解码器”旁边看到“av01”。

实际上,能够解码AV1可能是一个喜忧参半的问题。大多数2017年或以后的现代四核电脑在CPU上解码1080p AV1视频应该不会有任何问题。但一旦超过1080p,你就会想要硬件加速解码。NVIDIA的GeForce RTX 30系列显卡支持AV1解码(例如RTX 3050),AMD的Radeon RX 6000系列图形处理器也是如此,甚至Intel第11代和更新的CPU上的iGPU也是如此。如果您有此硬件,请确保您的驱动程序是最新的,并从Microsoft应用商店下载免费的AV1视频扩展,然后刷新您的浏览器。根据您的图形硬件,您甚至可以看到您的系统的“视频解码”部分正在Windows任务管理器中工作。(注:所有这些功能仅适用于Windows 10和Windows 11,不支持Windows 7。)

Netflix已经将一些电影的AV1流媒体传输到兼容设备上,因为许多电视、游戏机(包括老款PlayStation4 Pro)和一些移动设备已经支持它。事实证明,Netflix的流媒体是AV1“胶片颗粒合成”功能的一个很好的展示–编码器能够分析视频文件的胶片颗粒,移除它以干净地压缩镜头,然后向解码器提供指令,以忠实地重新创建它,而不会在颗粒上浪费不必要的比特。

早在2020年,Twitch的前首席研究工程师沈月诗也与我分享了AV1演示,展示了AV1可以为Twitch流媒体带来什么。在这里,你可以在1440p 120fps下观看几乎无阻塞的游戏,带宽仅为8 Mbps,1080p 60fps仅使用4.5 Mbps,720p 60fps仅使用2.2 Mbps。虽然不是真实世界的直播测试,但考虑到普通H.264编码器在正常Twitch流中以那样的比特率产生的质量非常差,它仍然令人印象深刻。

沈阳最初预计Twitch将在2025年完全采用AV1,希望最早在今年或2023年推出大牌内容流媒体。希望现在有了消费者可访问的编码器,他们可以很快开始启用这些新功能。

在CPU上运行的AV1编码器已经有很长一段时间了,但它们很难运行,即使在高核计数的机器上处理样本也要花费很多小时。过去几年,性能一直在稳步提高,从OBS Studio 27.2版开始,有两个编码器选项(SVT-AV1和AOM AV1)可供使用。正如我在OBS更新发布时所说的那样,这些视频仍然很难实时运行,但它们是可用的,也是迈向消费者AV1视频的第一步。

大多数流媒体和内容创作者一直在等待硬件加速的编码器出现在下一代显卡上。如前所述,英特尔、AMD和NVIDIA都在他们的上一代硬件中添加了硬件AV1解码器,可以肯定的是,至少NVIDIA将在RTX 4000硬件上有AV1硬件编码器,如果AMD没有RX 7000的话。然而,尽管他们自己也有许多延迟,英特尔还是第一个在新的Arc炼金师图形卡系列上推出了GPU AV1编码器。

我想用新的A380图形处理器研究的第一件事是,与目前可用的选项相比,AV1编码的实际表现如何。虽然AV1作为整体编解码器非常有前途,但您从任何编解码器中获得的结果都取决于编码器的实现和实时运行所必需的牺牲。GPU编码器在GPU内的固定功能硬件上运行,允许在对正常3D工作负载(如游戏性能)影响最小的情况下进行视频编码和解码,但并不总是产生“理想”的条件。

右击并在新选项卡中打开以全分辨率查看。

我之前已经介绍了不同的硬件H.264编码器如何通过迭代的GPU代进行改进,可以看出,例如,使用NVIDIA的NVENC进行编码的早期实现远没有产生像他们的新卡那样高的质量。我最近还研究了如何通过软件更新(例如AMD最近对其AMF编码器的更新)在一定程度上改进编码器质量。所有这一切意味着,虽然第一个可访问的AV1编码器有足够的空间被炒作,但也有空间让人对它的第一次迭代感到失望,还有更多的迭代即将到来。

我找到的量化视频质量的最可靠方法是Netflix的VMAF-Video多方法评估融合。这是一种评估视频质量的算法,其方式与实际观众对给定距离和大小的视频质量的感受非常接近,而不是依赖于纯噪声测量,如PSNR。Netflix已经开发这项技术(并在博客上谈论它)好几年了,它已经达到了非常可靠的测量差异的程度,这有助于说明我通常会尝试通过重复的并排屏幕截图向您展示什么。

我一直在测试大量的无损游戏和真人视频样本,但为了便于演示,我想专注于FPS类型的几个游戏。快节奏的摄像头移动,具有大量粒子效果的高细节图形,以及许多HUD元素相结合,为视频编码提供了一种“最坏的情况”,几乎每个Twitch Streamer都在努力应对。

我的重点是1080p 60fps视频,有三种主要码率:3500kbps、6000kbps和8000kbps。3500kbps(或3.5 Mbps)是通常建议在1080p(至少在AV1之前)使用的最低带宽,6000kbps是Twitch流的软“上限”,8000kbps是非官方的带宽上限,许多人可以将其发送到Twitch而不会出现问题。Twitch是这里关注的焦点,因为该网站提供的“源”质量流不会经历YouTube流所做的第二阶段压缩,这使得更高质量的编码器以更低的比特率获得了一些好处。

右击并在新选项卡中打开以全分辨率查看。

在这里,我将英特尔、NVIDIA和AMD常见的硬件H.264编码器与在“VerySlow”CPU使用率预设下运行的CPU X264编码器进行比较-这种预设不能实时运行,但通常被认为是质量目标的基准-以及英特尔的AV1 GPU编码器和两个SVT-AV1编码预设,人们可以(在像Threadriper这样的高端CPU上)进行实时编码。

这些结果令人着迷。

右击并在新选项卡中打开以全分辨率查看。

在6和8 Mbps的速度下,Intel Arc的AV1编码器在得分高于X264 VerySlow和得分略低之间来回切换(VMAF得分在0-100范围内运行,100是无损/未压缩来源素材的完美匹配),但得分仍然显著高于最好的GPU H.264编码器。就其本身而言,这已经足够令人印象深刻了。如果你是一个游戏流媒体用户,并且你使用双PC流媒体设置,或者让PCIe通道和插槽为你的机器添加第二个GPU,一旦在Twitch上启用AV1,你将能够以相同的比特率以比整个网站上的大多数内容高得多的质量流媒体。

但如果我们看看更低的3.5 Mbps的比特率,英特尔的AV1编码器比任何H.264编码器都要高,包括X264VerySlow。在一些游戏测试中,在Arc A380上编码的AV1在3.5 Mbps的速度下的得分高于大多数H.264选项在6 Mbps的得分(几乎是带宽的两倍)。

右击并在新选项卡中打开以全分辨率查看。

理论上,如果Twitch现在支持AV1流媒体,那么使用Arc A380对他们的广播进行编码的流媒体将使参与这一过程的每个人–流媒体自己、观众和Twitch/Amazon–在不影响质量的情况下将带宽削减一半。这也意味着您可以立即获得质量的跃升,而不需要更改拖缆端的任何网络要求。

从数据到实际的视觉效果,结果仍然同样令人印象深刻。

英特尔的AV1编码器在6 Mbps和8 Mbps的速度下,与H.264编码器相比,一目了然地呈现出更多相同的内容。有少量增加的锐度,但不足以突出,但在光线变化较大或阴影较大的区域缺乏非常明显的遮挡或人工效果。

右击并在新选项卡中打开以全分辨率查看。

同样,在这些更高的比特率下比较结果不会让你大吃一惊,但这是一种改进。AV1似乎在将细节不得不牺牲的区域更流畅地融合在一起方面做得非常好,而不是创建你习惯看到的像素化外观的阻挡。有时,在一定的距离上,你甚至会感觉到H.264视频的一部分看起来比AV1视频更“清晰”,因为额外的“挤压”给人一种增加细节的错觉,但放大后,那个细节实际上并不在那里。

右击并在新选项卡中打开以全分辨率查看。

在仅3.5 Mbps的速度下,英特尔的AV1编码器确实开始显示出少量的渐变宏块,但与H.264相比,在屏幕的细节部分避免了宏块,并真正提供了在如此低的比特率下你认为不可能实现的效果。

我的VMAF图表还包括几个额外的数据点,这些数据点的得分明显高于英特尔的AV1编码器。这是使用SVT-AV1 CPU编码器的两种编码。该编码器使用“预设”(类似于X264)的编号方式,较小的数字更难以较高的质量进行编码(类似于使用X264进行较慢的编码),较大的数字更容易以较差的质量进行编码。在我的测试中,即使是在32核的Thadriper CPU上,8和9也是唯一可以实时编码的逼真预设。因此,为了保持基准质量不太理想的主题,我在图表中加入了SVT预设值7和8。

右击并在新选项卡中打开以全分辨率查看。

正如你所看到的,虽然这两个特定的预置之间存在微小的差异,但它们的得分都远远超过了英特尔的AV1编码器。X264 VerySlow的性能远远超过任何GPU H.264编码器,这是意料之中的。

我认为将这些内容包括在内很重要,原因有两个。首先,如果你只是在编码上传到YouTube、档案等的视频,你可以在AV1上使用这些较慢的编码器配置文件,并指数级地提高比特率效率(节省空间和上传时间,或者提高你已经承诺的文件大小的质量)。其次,我希望这是我们在接下来的几年里对GPU AV1编码器的期待的预览。

虽然英特尔的QuickSync视频H.264编码器(在Arc GPU和第12代iGPU上)目前在质量上领先于NVIDIA和AMD,但前几代产品落后于NVIDIA(如果我们追溯到足够远的话甚至落后于AMD),这意味着如果NVIDIA推出采用AV1编码器的RTX 4000,它的性能至少可以比英特尔的产品好一些。另外,正如前面提到的,这只是第一次迭代。随着硬件的改进,编码器也会改进。我真的希望NVIDIA和AMD在AV1编码器方面展开竞争,为用户提供更高的质量–但我不得不说,我们的起跑线在英特尔的Arc显卡上,这让我非常兴奋。

视频流的未来非常光明,而且明显不那么拥挤。我正在用AV1上传我所有的YouTube视频,并期待着在平台允许的情况下尽快以新的格式流媒体。

[披露:我的Gunnir Photon A380显卡单元是英特尔抽样给我的,以便包含在我的YouTube频道上通常的编码器质量分析内容中。我没有得到英特尔支付的任何报道,我没有义务说任何具体的事情,英特尔也没有看到我在发布之前发布的任何关于GPU的帖子。出于同样的目的,NVIDIA和AMD也给我寄来了GPU样本。]

作为互联网的Stream教授,Adam主要专注于技术教育,在他的YouTube频道EposVox上使用捕获和编码魔法。当他没有测试最新的硬件和流媒体工具时,你通常会发现他躲在霓虹灯和CRT显示器的光芒中玩模拟视频和复古硬件。

推荐阅读

文章:《再见,廉价的固态硬盘?WD和希捷警告称,PC存储设备的价格正在上涨》缩略图

再见,廉价的固态硬盘?WD和希捷警告称,PC存储设备的价格正在上涨

如果你想买硬盘或固态硬盘,那就赶快行动吧!否则,你可能会支付比你想要的更多的钱。 据台湾分析公司TrendForce称,存储设备制造商西部数据和现在的希捷已致信客户,警告他们这些公司将提高硬盘驱动器的价格。WD的信中说,它也将提高固态硬盘的价格。 这封由希捷执行副总裁兼首席商务官BS Teh签署的信中写道:“我们业务的多个细分领域仍在继续[D]需求恢复,我们减少的制造能力正在限制我们满足所有客户需…

文章:《华硕与英特尔CPU崩溃作斗争,主板基本输入输出系统》缩略图

华硕与英特尔CPU崩溃作斗争,主板基本输入输出系统

英特尔制造了一些非常好、非常昂贵的CPU,现在正以一种不太好的方式崩溃。即使是英特尔也不确定为什么一些高端第13代和第14代处理器会在超负荷的情况下崩溃,但他们正在努力解决这一问题。与此同时,一些原始设备制造商和系统建造商正在将支持问题掌握在自己手中。华硕是最新一家积极推出高端主板的公司。 VideoCardz.com报道称,支持第13代和第14代酷睿处理器的华硕Z790主板的最新BIOS更新包括…

文章:《AOC最新的游戏显示器刷新率高达540赫兹》缩略图

AOC最新的游戏显示器刷新率高达540赫兹

当谈到对体育运动有抱负的游戏玩家时,当谈到帧速率时,不会有“太快”这样的事情。因此,也不存在速度太快的显示器。AOC的最新设计以540赫兹的面板迎合了速度狂人的需求。虽然这令人印象深刻,但更令我印象深刻的是,这不是什么高不可攀的怪物–它是一款24英寸的1080p设计。 这使得AOC Agon AG246FK同时成为地球上最快的显示器之一–就在一年前,NVIDIA还将500赫…