2025年03月05日23時00分 / 提供:マイナビニュース
●テスト機材の概要 / 3DMark
先に概要をご紹介したRadeon RX 9070 XT/Radeon 9070の性能比較掲載がやっと解禁になったので、早速性能をお届けしたいと思う。ちなみに国内発売開始は3月7日(金)の午前11時との事だ。
○評価機材
概要の際にご紹介した様に、Radeon RX 9070 XT/9070はAMDのReferenceの提供が無いので、OEMパートナーから提供された製品での比較となる。今回は
ASUS TUF Gaming Radeon RX 9070(Photo01~11)
ASUS TUF Gaming Radeon RX 9070 XT(Photo10~22)
の2枚を利用した。
また性能の比較用にはAMD経由で
ASRock Radeon RX 7800 XT Phantom Gaming 16GB OC(Photo23~31)
の他、ASUSより
ASUS TUF Gaming Radeon RX 7900 XT OC Edition 20GB
ASUS Dual GeForce RTX 4070 OC Edition 12GB GDDR6X(Photo32~40)
ASUS ProArt GeForce RTX 4070 Ti SUPER 16GB GDDR6X OC Edition(Photo41~49)
をお借りして行った。
テスト環境は表1に示す通りである。本当だったらRyzen 7 9800X3Dあたりを用意したかったのだが、ちょっとタイミング的に間に合わずRyzen 7 7800X3Dとなってしまった。
グラフ中の表記は
RX 7800 XT :ASRock Radeon RX 7800 XT Phantom Gaming
RX 7900 XT :ASUS TUF Gaming Radeon RX 7900 XT OC Edition
RX 9070 :ASUS TUF Gaming Radeon RX 9070
RX 9070 XT :ASUS TUF Gaming Radeon RX 9070 XT
RTX 4070 :ASUS Dual GeForce RTX 4070 OC Edition
RTX 4070 Ti Super:ASUS ProArt GeForce RTX 4070 Ti SUPER
となっている。また解像度表記も何時もの通り
2K :1920×1080pixel
2.5K:2560×1440pixel
3K :3200×1800pixel
4K :3840×2160pixel
としている。
Game Benchmarkについては以前とほぼ同じ設定であるが、ちょっと変更した部分もあるので、変更したものだけ追加で説明を行う。大筋は以前と変わらない。基本的なスタンスは
FSR/RSR/DLSSなどのSuper Resolutionやフレーム生成機能は全て無効化
NVIDIAに特有の描画サポート(NVIDIA Reflexなど)は使わない。
AMDのFidelityFXについては、NVIDIAのGPUでも利用できるものはそのまま利用。そうでない機能(例えばFidelityFX Denoiser)は無効化
としている。今回はあくまでもGPUの生の性能比較であり、Super Samplingの有無は利用するタイトルによって状況が変わってくるからだ。とりあえずFSR4とかDLSS4の様なフレーム生成は最新タイトルに限られるし、古いものならDLSS 3までとかRSR(Radeon Super Sampling)でカバーできるからあとはユーザーの好み(どこまでの描画劣化を許容できるか)で決まる話であり、ベンチマークに採用するための基準が定まらないためである。
○◆3DMark v2.31.8372(グラフ1~3)
3DMark v2.31.8372
UL Benchmarks
https://benchmarks.ul.com/3dmark
ではまず3DMarkから。Overall(グラフ1)を見ると、負荷の軽いNightRaid/WildLifeはGeForce無双といった感じになっているが、SolarBay以降になるとかなりRadeon RX 7090/7090 XTが健闘しているのが判る。特筆すべきはRay Tracingを多用するPortRoyal/SpeedWayや、Vulkan ray tracingを使うSolarBayでRadeon RX 7090がRadeon RX 9700 XT以上の性能を出し、GeForce RTX 4070は凌いでいる事だ。流石にGeForce RTX 4070 Ti Superには及ばないが、こちらはRadeon RX 7090 XTの相手であって、同等以上のスコアを出している。スコア、といってももうCPU性能は関係ない(同じCPUを使っている)から、実質的にはGraphics Score(グラフ2)と傾向は同じであり、純粋にこうした負荷の高いレンダリング処理で同等以上の性能を出している、としてよいかと思う。元々CESにおける発表で、Radeon RX 9070 XTはGeForce RTX 4070 Ti相当、Radeon RX 9070はGeForce RTX 4070 Super対抗という位置づけが成されていたが、3DMarkの結果を見る限りこの目標は達成できているように思う。
ところでRadeon RX 9070 XT/9070はPCI Express Gen5対応のGPUとされており、これをPCI Express Testで確認してみた(グラフ3)。結果はご覧の様にGen 4の場合のほぼ倍の帯域が利用できており、正しくPCI Express Gen5であると確認できた(後でSandraでも同じテストを行う)。
●ゲームその1: Avatar FoP / Borderlands 3 / Company of Heroes 3 / Cyberpunk 2077
○◆Avatar Frontiers of Pandora(グラフ4~10)
Avatar Frontiers of Pandora
Ubisoft
https://www.ubisoft.com/ja-jp/game/avatar/frontiers-of-pandora
まず結果(グラフ4~6)GeForce系に厳しい結果になったのがAFOP。Radeon RX 9070 XTは全解像度でRadeon RX 7090 XTを上回るフレームレートを出しているし、Radeon RX 9070もかなり良い結果を残している。GeForce RTX 4070 Ti Superも2Kでは健闘しているが、2.5K以上で急速にフレームレートを落としている。
フレームレート変動(グラフ7~10)を見ても、Radeon RX 9070 XT/Radeon RX 9070はかなり安定している。そもそも最小フレームレート(グラフ6)で見ても、4Kですら最小フレームレートが60fpsを上回っているから、普通に4Kでのプレイが可能である。GeForce RTX 4070は当然として、GeForce RTX 4070 Ti Superですら4Kでこのフレームレートだとちょっと厳しい。DLSSの利用を前提にしないと快適とは言えないだろうからだ。
○◆Borderlands 3(グラフ11~17)
Borderlands 3
2K Games
https://borderlands.com/ja-JP/
意外にRadeon RX 9070系が振るわないのがこちらのBorderlands 3。結果(Photo11~13)を見ると、Radeon RX 9070 XTはRadeon RX 7900 XTに及ばない(それも結構明確な差がついている)のが判る。平均フレームレートだけでなく最大/最小フレームレートでもこれは明確である。あるいはBorderlands 3のShader最適化がまだRDNA 4をうまく扱えていないということだろうか? ただRadeon RX 9070がGeForce RTX 4070 Ti Superとほぼ同等の結果だから、それなりに性能の上乗せがある事は間違いなさそうなのだが。
フレームレート変動をみても、Radeon RX 7900 XTとRadeon RX 9070 XT、それとGeForce RTX 4070 Ti Super&Radeon RX 9070が明確にグラフが分離しており、4Kまでこの傾向が明確になっているあたり、現時点での性能の差は明確である。
それはともかく、Radeon RX 9070ですら4Kで80fps以上の性能をコンスタントに発揮しており、4Kが十分プレイできる事そのものは間違いないと言える。
○◆Company of Heroes 3(グラフ18~24)
Company of Heroes 3
Relic Entertainment
https://www.companyofheroes.com
Borderlands 3よりさらに性能が振るわないのがこのCompany of Heroes 3。今回行った12のゲームタイトルで一番性能が低かったのがこちらだ。結果(グラフ18~20)で明白なように、平均/最大/最小フレームレートのいずれでも、Radeon RX 9070 XTはどうにかGeForce RTX 4070と同等。Radeon RX 9070はそれをさらに下回る。幸いにもその一番低いRadeon RX 9070の最小フレームレートを見ても、4Kでちょっとだけ60fpsを下回る程度だから、FSRを組み合わせれば4K Playableであるとは言えるとは思うが、Game EngineがRDNA4をうまく扱えていない感じがする。あるいは後でアップデートとかあって性能が向上しそうな気もするが、あくまでも現時点での性能はそんな訳で芳しくない。
フレームレート変動(グラフ21~24)を見てもこれは明らかで、Radeon RX 7800 XTにすら及ばないのはちょっと不思議である。まぁ新製品だとたまにこう言う事もある、という良い例になった(後でもう一回こうした事態をご紹介する)。
○◆Cyberpunk 2077(グラフ25~31)
Cyberpunk 2077
CD PROJEKT RED
https://www.cyberpunk.net/us/ja/
逆にRadeon RX 9070シリーズの面目躍如となったのがCyberpunk 2077。結果(グラフ25~27)で判るように、最高速はRadeon RX 9070 XT。2Kで言えはこれにRadeon RX 7900 XTが続くが、Radeon RX 9070も僅差であり、解像度があがるとほぼRadeon RX 7900 XTなみのフレームレートを達成している。GeForce RTX 4070 Ti Superも2Kでは健闘しているが、それ以上の解像度では及ばない結果になっている。この傾向は最大/最小フレームレートでも再現しており、もう純粋に描画性能の差となっている。
フレームレート変動(グラフ28~31)からもこれは明らかで、4Kの場合でもRadeon RX 9070は60fpsを常にキープ、時々50fps台まで落ちるGeForce RTX 4070 Ti Superを上回る性能を発揮しており、十分Playableの範疇である。Radeon RX 9070ですらこれだから、Radeon RX 9070は殆どのシーンで70fpsを超える性能を発揮しており、平均80fps近い。性能の高さが示されたとしてよいと思う。
●ゲームその2: F1 24 / Far Cry 6 / ForSpoken / Hitman 3
○◆F1 24(グラフ32~38)
F1 24
EA Sports
https://www.ea.com/ja-jp/games/f1/f1-24
設定は基本的にはこちらで説明した通りであるが、Graphics PresetをHighにするとGeForce系では自動的にNvidia ReflexがOnになってしまう。そこでこれを明示的にOffにしたので、PresetはCustom扱いになってしまった(Radeon系は無条件でOffになる)。あとAnisotropic Filteringは16xとしている。
さて、Ray Tracingがデフォルトで有効になるF1 24であるが、結果(グラフ32~34)を見るとRadeon RX 9070 XTは結構高い数値になっている。Radeon RX 7900 XTとの差はそう大きくは無い(10fps程度)だが、確実に向上している。一方Radeon RX 9070はGeForce RTX 4070 Ti Superに微妙に及ばない程度であり、Radeon RX 7800 XTとの差は明白である。
フレームレート変動(グラフ35~38)からもこの傾向は読み取れる。まぁ他のゲームに比べると、相対的に負荷が低いゲームという事もあるのだろうが、今回試した6つのGPUの何れも4Kで十分Playableな範疇であり、描画オプションをHighからUltra Highまで上げてもRadeon RX 7900 XTなら十分4Kで楽しめそうだ。
○◆Far Cry 6(グラフ39~45)
Far Cry 6
Ubisoft Entertainment
https://www.ubisoft.com/ja-jp/game/far-cry/far-cry-6
結果(グラフ39~41)を見ると、特に2Kでは明らかにCPUがボトルネックになっている感は否めない。ただそれでもそのボトルネックにおけるフレームレートでRadeon RX 9070 XTは他を圧倒しているのも事実で、Radeon RX 7900 XTから40fps近い上乗せを得ている。またRadeon RX 9070は、そのRadeon RX 7900 XTと同等のフレームレートを実現しているのは流石である。フレームレート変動(グラフ42~45)からもこれは明らかで、勿論今回描画オプションはHighだしDXR ReflectionとかDXR ShadowはOffにしているから、こうしたものを有効にするとフレームレートは落ちるとは思うが、FSR/DLSSを併用すればフルオプションで4Kをプレイしても十分な性能が確保できるであろう結果、として良いかと思う。
○◆Forspoken(グラフ46~52)
ForSpoken
Square Enix
https://www.jp.square-enix.com/forspoken/
2.5Kだけ何故か性能が下がるForspokenだが、今回もその傾向は健在である(グラフ46~48)。それはともかくとして、結果を見ると見事に3グループに分離している。つまり
Radeon RX 9070 XT
Radeon RX 7900 XT/Radeon RX 9070/GeForce RTX 4070 Ti Super
Radeon RX 7800 XT/GeForce RTX 4070
である。Radeon RX 9070 XTは第2グループ(Radeon RX 7900 XT/Radeon RX 9070/GeForce RTX 4070 Ti Super)に比べて常に10fps程度の上乗せを実現しており、これは最大/最小フレームレートの結果も同じである。フレームレート変動(グラフ49~52)もやはりこれを忠実に再現した格好になっており、特にRadeon RX 9070 XTは4Kでもまだゆとりがある。今回は描画オプションをHighで比較したが、もう一段上にしても良かったかもしれない。
○◆Hitman 3(グラフ53~59)
Hitman 3
IO Interactive A/S
https://www.epicgames.com/store/ja/product/hitman-3/home
結果(グラフ53~55)を見ると、こちらも2K~2.5KあたりではちょっとCPUがボトルネックになっている感がある。Ryzen 7 9800X3Dを持ってくればもう少し傾向が変わったかもしれない。それはともかく、Hitman 3ではRadeon RX 9070 XTはRadeon RX 7900 XTに微妙に追いつかない程度の性能となっている。いや概ね同じといえば同じで、言うほどの差ではないので同等としても良い程度ではあるのだろうが。そしてRadeon RX 9700はGeForce RTX 4070 Ti Superとほぼ同程度という結果になっている。
フレームレート変動(グラフ55~59)で言うと、2Kとか2.5Kはちょっと変動が激しすぎて個別の傾向が読みにくい。比較的すっきりしている4Kで言えば、フレームレートは
Radeon RX 7900 XT≧Radeon RX 9070 XT
Radeon RX 9700≧GeForce RTX 4070 Ti Super
といった感じになっており、フレームレート的にも何れも4Kで十分楽しめる数値になっている。必ずしもRadeon RX 9070 XTが最高速という訳ではなく、Radeon RX 7900 XTと同等というケースもあるという実例ではあるが、割と面白い結果になったと思う。
●ゲームその3: Metro Exodus / SoT Tomb Raider / The Division 2 / Watch Dogs Legion
○◆Metro Exodus PC:Enhanced Edition(グラフ60~66)
Metro Exodus PC:Enhanced Edition
4A Games
https://www.metrothegame.com/
PC:Enhanced EditionではRay Tracing必須になったこともあってRadeon系列の性能が低かったMetro Exodusであるが、結果(グラフ60~62)を見ると2KこそRadeon RX 9070 XTとGeForce RTX 4070 Ti Superが同等ながら、それ以上の解像度ではRadeon RX 9070 XTが最高速を記録した。最大フレームレートこそGeForce RTX 4070 Ti Superが何か突き抜けているが、最小フレームレートではRadeon RX 9070 XTが圧倒的で、これにRadeon RX 9070が続いているというあたりは、明らかに底力が向上した感じを見て取れる。
フレームレート変動(グラフ63~66)を見ると、一番フレームレートが低下する75~90秒付近の数値が、Radeon RX 9070 XTが他を圧倒しているというあたりが、確かにRay Tracingの性能が大きく上がっている事の証拠としても良いと思う。実際この期間はRadeon RX 9070の性能もGeForce RTX 4070 Ti Superに匹敵している。ここまで性能が上がっているなら、描画PresetをUltraからExtremeに変更しても、そこそこには動くかもしれない。もっとも4Kではこの期間、Radeon RX 9070 XTですら60fpsを切っているので、流石にSuper Resolution無しで描画オプションを変更するのは無理そうであるが。
○◆Shadow of the Tomb Raider(グラフ67~73)
Shadow of the Tomb Raider
SQUARE ENIX
https://tombraider.square-enix-games.com/en-us
相対的に軽い部類に入るShadow of the Tomb Raider。Ray Tracing Shadow Qualityを設定しても良いかとも思ったが、一応Offのままにしている(現在ではMedium/High/Ultraが選べるようになった)。
結果(グラフ67~69)を見ると結果は
Radeon RX 9070 XT>GeForce RTX 4070 Ti Super≧Radeon RX 7900 XT≧Radeon RX 9070
といった感じになっている。Radeon RX 9070 XTは全解像度でフレームレートにして10fps以上GeForce RTX 4070 Ti Superを引き離しており、。その下は団子という感じ。結構Radeon RX 9070も健闘している感じだ。最大フレームレートは2KだけRadeon RX 9070が暴れているが、あとはまぁ妥当な範囲。それより最小フレームレートで2.5K以上の解像度だとRadeon RX 9070 XTが圧倒的に高いあたりが底力を見せつけている格好だ。
フレームレート変動(グラフ70~73)を見ると、2KはややCPUがボトルネックかなという感じも無くは無いが、それ以上の解像度はRadeon RX 9070 XTの圧勝という感じ。4Kですら100fpsを切らないのは流石である。
○◆Tom Clancy's The Division 2(グラフ74~80)
Tom Clancy's The Division 2
Ubisoft
https://www.ubisoft.co.jp/division2/
同じく軽めの部類に入るTom Clancy's The Division 2であるが、結果(グラフ74~76)を見るとここでは意地をかけて(?)GeForce RTX 4070 Ti Superが最高速となった。もっともこれは2Kだけの話で、2.5K以上だとその差は僅かとなり、4KだとRadeon RX 7900 XTに負けるのだが。逆にRadeon RX 9070 XTは微妙にRadeon RX 7900 XTに及ばない程度。まぁこの3製品でトップグループを形成、Radeon RX 9070が単独4位というちょっと面白い傾向になっている。最小フレームレートを見ても、最高速はGeForce RTX 4070 Ti Superであり、Division 2に関してはGeForce RTX 4070 Ti Superが最高速という結論で良いかと思う。
この傾向はフレームレート変動(グラフ77~80)を見ると良く判る。どの解像度でも、Radeon RX 9070 XTは40~55秒付近でGeForce RTX 4070 Ti SuperやRadeon RX 7900 XTに及ばないという傾向が見て取れる。他の期間ではそれなりに近いのだが、どうもこの15秒間の処理の低さが最終的な平均フレームレートに反映されたという事の様に思われる。まぁただそのRadeon RX 9070 XTは元よりRadeon RX 9070であっても、4Kで80fps前後のフレームレートを維持しており、4Kでのプレイに支障はないだろう。
○◆Watch Dogs:Legion(グラフ81~87)
Watch Dogs:Legion
Ubisoft
https://www.ubisoft.co.jp/wdlegion/
最後のWatch Dogsであるが、結果(グラフ81~83)を見るとどうもこちらもCPUボトルネックが発生しているようで、特に2Kで顕著である。Radeon RX 9070XTに関しては2.5Kもまだボトルネックの影響をうけているようだ。これは最大フレームレートにも言えることで、Radeon RX 9070XTやRadeon RX 7900 XTは3Kまで、Radeon RX 7800 XTも2.5Kまで影響を受けているっぽい。
それはともかく、性能としては
Radeon RX 9070 XT>Radeon RX 9070≧Radeon RX 7900 XT≒GeForce RTX 4070 Ti Super
という感じだ。
GeForce RTX 4070 Ti Superに関して言えば、2KではRadeon RX 7900 XTより高速だが2.5Kで同等、3K以上ではRadeon RX 7900 XTに負けると言った微妙な位置に居る。
これはフレームレート変動(グラフ84~87)を見ると明確である。2Kではかなりグラフが重なって見えるが、2.5Kでは大分分離、3K以降ではRadeon RX 9070とRadeon RX 7900 XTは重なるがあとは分離して見える。恐らくCPUをRyzen 7 9800X3Dにしたら、2K/2.5Kでももう少しグラフが明確に分離したかもしれない。
●ゲームベンチマーク総評
○◆ゲームベンチマーク総評(グラフ88~91)
普段だとCPU性能比較ということで2Kのみで平均フレームレートを比較するが、今回はGPU性能比較という事で4つの解像度それぞれで比較してみた。フレームレートをそのまま示しても判りにくいので、今回はRadeon RX 7800 XTのフレームレートを基準として、その相対性能を12のゲームについて計算。最後に全体の幾何平均をAverageとして示している。まず2K(グラフ88)で言えば、Radeon RX 9070 XTはGeForce RTX 4070 Ti SuperやRadeon RX 9700 XTと比べてそんなに差は大きくないが、それでも最高速。2.5K(グラフ89)だと、特にGeForce RTX 4070 Ti Superとの差がやや大きくなり始め、3K(グラフ90)ではその差が顕著となる。4KではRadeon RX 7900 XTとの差も大きくなっており、文句なくトップ性能としてよいだろう。思うにCPUがRyzen 7 9800X3Dだったら、2K/2.5Kの性能差がもう少し大きくなったように思う。
一方Radeon RX 9070の方は、2KではRadeon RX 9070 XTにもGeForce RTX 4070 Ti Superにもちょっと及ばないが、2.5KではGeForce RTX 4070 Ti Superにちょい近づき、3Kではかなり接近。4Kでもまだ微妙に追いついてはいないものの、かなり遜色ないところまで来ている。GeForce RTX 4070 Ti Superと比較してこの結果だから、悪くは無いと言って良いと思う。
●Sandra / HandBrake / AIDA64 / PCMark / Procyon
○◆Sandra 20/21 31.139(グラフ92)
Sandra 20/21 31.139
SiSoftware
https://www.sisoftware.co.uk/
さてここからはゲーム性能以外の部分を。まずはSandraだが今回はVideo Memory Bandwidthのみである。要するに先のグラフ3と同じくPCIe経由での帯域の確認である。結果はご覧の様に、Radeon RX 9070シリーズはそれ以外の製品の倍の転送性能を発揮しており、間違いなくPCI Express Gen5が動作している事が確認できた。
○◆HandBrake 1.9.2(グラフ93)
HandBrake 1.9.2
HandBrake
https://handbrake.fr
何でHandBrakeか? というと、これはMedia Encoderの性能比較である。これまでだとTMPGEnc Video Mastering Works 7を使うのが常なのだが、今回Radeon RX 9070シリーズで利用しようとしたところ、こんなエラーが出て実行できなかった(Photo50)。
恐らくなのだが、Radeon RX 9070シリーズに対応した新バージョンのAMD Media SDKを利用してTMPGEnc Video Mastering Works 7のビルドをやり直す必要があるのだと思われる。同種の事は過去にもあった。TMPGEnc Video Mastering Works 7は今年2月6日にVersion 7.1.1.36が公開されており、これを利用したのだが残念ながらまだ未対応の模様だ
。
ということで他のツールを探したところ、現状でRadeon RX 9070が動作したのがHandbrakeだった、という話である。
ベンチマーク方法だが、元データ(VP9フォーマット、4K30fps、11296フレーム)をAMD及びNVIDIAのMedia Encoderを利用してHEVC(10bit HEVCフォーマット、4K30fps、Constant Quality Level 24、Main 10 Profile)に変換する時間を測定した。TMPGEncだとバッチを使って同時に複数Streamのエンコードが可能だったが、今回HandBrakeで同じ環境を実現する事ができなかったので、1streamだけでのエンコードとなっている。
グラフ93がその結果だが、ご覧の通りあまり芳しくない。恐らくだが、HandBrakeもまだRDNA 4のMedia Encoderに未対応(そもそもVersion 1.9.2は今年2月23日にリリースされたもので、最新のAMD Media SDKを利用しているかどうかも疑わしい)で、互換モードで動作しているためにその性能が発揮できていないのではないか? と考えて居る。この辺は今後、アプリケーションの対応が済んだ段階でないとちゃんと確認出来ないようだ。
とりあえず現状としては、動くには動くが、最適化されていないという結果となってしまった。
○◆AIDA64 v7.60.7300(グラフ94)
AIDA64 v7.60.7300
FinalWire Ltd.
https://www.aida64.com
AIDA64にはBuild inのGPGPU Benchmarkが搭載されている。Sandraにもあるのだが、以前も書いたがこちら2023年末を境にメンテナンスが成されなくなっており(なんせトップページ https://www.sisoftware.co.uk の最新の話題は2023年10月末、ベンチマーク自身のバージョンも2023年12月30日リリースの31.139が最後となっている)、まともに動かない事が増えて来たので、今回はAIDA64の方を利用してみた。
さてAIDA64のGPGPUベンチマークはこんな具合(Photo51)に12項目で実施する様になっている。実際は12ではなく、例えばMemory ReadでもPinnedとPageableでそれぞれ測定を行うし、Memory Copyは15/32/64/128/256/512/1024MBの7パターンで実施して、平均をとるといった具合。Single-PrecisionならFMA Float 1/2/4/8/16とFMAC Float 1/2/4/8/16を実施しての平均値といった感じに全部で100項目のテストを行い、これを12項目にまとめて示している格好だ。ただ結果はご覧の通り、12項目がそれぞれ別の単位で出力されるのでグラフにまとめるのが難しい。なので生の結果は表2に示し、グラフ94はRadeon RX 7800 XTの結果を100%とした相対性能グラフとさせていただいた。
結果を見ると、まずMemory Read/WriteにおけるRadeon RX 9070系の性能の高さが目立つが、その割にMemory Copyが妙に遅いのはどういうことか? あと32bit/64bitのInteger IOPSでGeForce RTX 4070/4070 Ti Superの性能が突出しているが、これは生データを見ても本当に突出しているので、恐らくはGeForce RTXではTensorRTを使って処理しているのではないか? という気がする。ただそれを除くと概ね理解できる性能になっている。しいて言えば、Radeon RX 7900 XTが84CU×2000MHz(Game Frequency)、Radeon RX 9070 XTが64CU×2170MHz(Game Frequency:Photo11参照)だが、RDNA 4ではSIMD VectorがDualになっているので、本来ならSingle Precisionの性能とかはRadeon RX 9070 XTの方が60%位高速になっていてもおかしく無いにも関わらず、実際にはRadeon RX 7900 XTの方が高速な結果になっているというのは、ベンチマークがRDNA 4対応になっておらず、RDNA 3相当の動き方をしているという事なのだろうか?SHA-1 Hashの性能とかが本来想定される性能に近い気がする。アプリケーションのRDNA 4への最適化作業が結構広範に必要、ということなのかもしれない。
○◆PCMark 10 v2.1.2704(グラフ95~100)
PCMark 10 v2.1.2704
UL Benchmarks
https://benchmarks.ul.com/pcmark10
OpenCL周りの確認も兼ねて、普通にGPUとして使えるという確認のためにPCMark 10も実施してみた。基本的にここでは大差ない筈で、実際Overall(グラフ95)を見てみるとそんな感じ。Test Group(グラフ96)を見ると差がついているのはDigital Contents CreationとGaming(要するに3DMark Firestrike)である。Essentials(グラフ97)ではApp Startupで妙にGeForce RTX 4070系が遅いが、その分Web Browsingで盛り返している。そしてProductivityではSpreadsheetでGeForce RTX 4070系が高い性能を出している。
まずApp Startupは確かにGeForce系が遅い(例えばWriterのCold StartはRadeon系が1.4秒弱のところ、2秒強を要している)。一方Web Browsingは、殆どのテストは同等だがShopLoadのテストでややGeForce系のロード時間が短いといった違いが見られる。Productivity(グラフ98)では、特にOpenCLを利用したSpreadsheetMonteCarloOclなどで処理時間が劇的に違う(Radeon系が平均2.2秒、対してGeForce RTX 4070が1.5秒、GeFoce RTX 4070 Ti Superは0.68秒)事が大きな要因となっている。
ではOpenCLだとGeForceの方が高速か? というとそういう単純な話でもない。Digital Contents Creation(グラフ99)を見ると、まずRenderingAndVisualizationは3DMark Slingshotのスコアがそのままだから仕方ないとして、例えばPhotoEditionDenoiseOcl(OpenCLベースの写真のDenoise)の処理時間は、Radeon系が0.18秒前後なのにGeForce系は0.37~0.57秒と2~3倍の時間を要しているなど、得手不得手が確実に存在している。結果から言えば、グラフ95のPCMark 10 Score(ExtendedはFireStrikeが入るから怪しくなる)が示すように、「普通に使うにはあまり差が無い」として良さそうだ。グラフ100(Office365での性能)もこれを物語っている。
○◆Procyon v2.10.1542(グラフ101~107)
UL Benchmarks
https://benchmarks.ul.com/procyon
最後はProcyonだが、実はこのProcyonは昨年4月には生成AIを利用した画像生成、昨年11月にはLLMを利用したテキスト生成もサポートした。要するにStable DiffusionやLlamaなどの性能を比較できる様になったということだ。なので最後にこうしたAI性能の比較をしてみたいと思う。
グラフ101がOverallである。グラフがちょっとバグっているのは、GPUによって利用できるInference Engineが異なるためである。これは特にImage Generationが判りやすく、Stable DiffusionでRadeon系はONNXしか利用できないのに対し、GeForce系はONNXとTensorRTが選択できる(一部ONNXで動作しないものもある)。それもあってGeForce系ではONNXとTensorRTの両方の結果を示している。これはComputer Visionも同じで、Radeon系はWindows MLでのみの動作だが、GeForce系はWindows MLとTensorRTの両対応となっている。そんな訳でこれまでより結果の項目が多い訳だが、特にGeForce系でStable Diffusionを実施するのはONNXを使うよりもTensorRTを使う方が圧倒的に高速であり、その結果がこのグラフという訳だ。もっともここまで性能差があるのはStable Diffusion 1.5でINT 8を利用した場合のみで、他のケースではもう少し穏当な性能差になっていることが判る。
ということで個別に結果を見てみたい。まずそのImage Generation(グラフ102)。結果は画像生成時間で、なのでバーが短いほど高速である。もうここではRadeon系が不利なのは判り切った事で、Stable DiffusionのINT8だと概ね1枚52秒掛かっているのが、GeForceだとONNXを使っても35秒、TensorRTだと1秒前後でしかない。
ただ同じStable Diffusion 1.5でもFP16を使うと大分差が縮まる(ちなみに何故かGeForce系はONNXでFP16が使えないのでTensorRTのみ)。またGPUによる性能差が出るのがStale Diffusion XLで、こちらはFP16のみだがRadeon RX 9070/9070 TiはRadeon RX 7800 XT/7900 XTに比べて大きく処理時間を減らしている。といってもまだGeForce RTX 4070/4070 Ti Superには遠く及ばないのだが。面白いのはそのGeForce系で、ONNXを使った方が高速なことだ。どうしてこうなるのだろう?
次がText Generationである。こちらではONNX RuntimeかOpenVINO Runtimeだが、推奨はONNXということでこちらで統一している。このText GenerationはTTFT(Time to First Token)と(OTS)Output Token Speedの2つからスコアが決まり、
TTFT_Score=C1÷Average TTFT
OTS_Score =C2×Average OTS
Score=√(TTFT_Score×OTS_Score)
と算出される。C1/C2は係数で、これは利用するモデル(Phi-3.5/Mistral-7B/Llama-2-13B/Llama-3.1-8B)毎に決まっている(こちらに詳しい数値が示されている)。
ということでグラフ103にTTFTの、グラフ104にOTSの結果をそれぞれ示してみた。結果から言えば、OTSに関して言えばRadeon系も結構健闘してはいるのだが、TTFTではGeForce系の敵ではなく、結局これがスコアに響いて結果的に大差を付けられて負けという格好である。それはともかくとしてRadeon RX 9070/9070 XTは健闘してはいるものの、Radeon RX 7900 XTに及ばないのは単に最適化の問題なのか、それとも構造的な問題なのかは現時点でははっきりしない。この先最適化が進めばもう少し性能が改善するかどうかも不明である。少なくともテキスト生成という用途で言えば、Radeon RX 7900 XTとさして変わらない(とは言えRadeon RX 7800 XTよりはマシ)というあたりだろうか?
最後がComputer Visionである(グラフ105~107)。スコアは6種類のModelのそれぞれのAverage Inference Timeの相乗平均の逆数で計算されるのだが。そのInference Timeをそのまま示しても見にくいので逆数を取って速度(つまり毎秒当たりのInference実行数)を示してみた。
Modelによって結果に大きな違うがある訳だが、それでも全体としてGeForce系が圧倒的に有利、というのはComputer Visionでも同じである。ちなみにRadeon系はWindows ML、GeForce系はWindows MLとTensorRTの両方の結果を示しているが、そのWindows MLであってもGeForce系の方が有利というものが少なくない。ただそれでも例えばINTのInception v4とかFP16/FP32のMobilenet v3やFP32のResnet 50の様に、時々勝負になるケースも無くはないが、全体としてはやはり勝負にならない。
ただその中でRadeon RX 9070/9070 XTの性能は? というと、少なくともRadeon RX 7800 XT/7900 XTよりは改善しているものは多い。恐らくであるが、これもWindows MLのRadeonへの最適化がちゃんと行われれば、もう少し性能は改善しそうな気がする。その意味ではまだアプリケーションの最適化待ちの状態から変わらない、というのが結論になるだろう。
●消費電力 / 評価のまとめと考察
○◆消費電力(グラフ108~113)
最後に消費電力を。今回は3DMark SpeedWay(グラフ108)、Hitman 3 2K(グラフ109)、Metro Exodus PC:Enhanced Edition 2K(グラフ110)、Shadow of the Tomb Raider 2K(グラフ111)の4つの動作中の消費電力変動を測定し、それらの動作中の平均消費電力(グラフ112)、及び待機状態との差(グラフ113)をまとめてみた。
まず変動で気が付くのが、Radeon RX 9070 XTは割と積極的に省電力モードに入る事で、Hitman 3とかMetro Exodus、Shadow of the Tomb RaiderなどをRadeon RX 7900 XTと比較するとこれが目立つ。ただRadeon RX 9070はそこまで消費電力が下がらないあたり、Radeon RX 9070は能力一杯に動いている関係で省電力モードに入りにくいが、Radeon RX 9070 XTは多少ゆとりが生まれているということだろうか?
そのあたりもあってか、Radeon RX 9070 XTの実効消費電力差を見ると、Radeon RX 7900 XTと同等以下に収まっているのは、性能の上がり具合を考えるとよく頑張ったと評して良いかと思う。またRadeon RX 9070もRadeon RX 7800 XTを下回る消費電力に収まっており、こちらもかなり優秀としてよいと思う。流石にGeForce RTX 4070よりはそれなりに多いのは仕方ないが。全般的にRadeon RX 9070シリーズは性能/消費電力比を大分改善した、と評して良いのではないかと思う。
○考察
ということでベンチマーク結果をお届けした。総じて優秀で、確かにGeForce RTX 4070グレードと比較した場合には十分競争力がある製品として良いと思う。これでGeForce RTX 5080/5090と戦うのは論外であるが。今回機材手配の関係で実現しなかったが、GeForce RTX 5070 Tiと比較しても、そう悪い結果にはならない様に思える。
問題は価格と入手性である。この原稿を書いている時点(3月4日19時)でもまだ本国価格・日本価格ともに公開されていない。こちらのPhoto07の脚注に書いたように、筆者はRadeon RX 9070XTが$699、Radeon RX 9070が$599辺りではないかと予想しており、Radeon RX 9070XTが12万円台、Radeon RX 9070が10万円台ならまぁ相対的に割安感はあるだろう。あとはどれだけ製品が流通するか次第だ。AI系をメインにするユーザーにはちょっとお勧めしにくいが、Gamingがメインであれば、結構良い選択肢になる様に思うのだが、さて?