PR

 NVIDIAは2008年6月16日、新しいグラフィックスチップ「GeForce GTX 200」シリーズを発表した。同シリーズは、最上位モデルの「GeForce GTX 280」とその廉価版となる「GeForce GTX 260」の2製品から構成され、従来ハイエンドだった製品「GeForce 9800 GTX」の上位に位置付けられる。

 同シリーズは、NVIDIAにとって第2世代のユニファイド(統合型)シェーダーアーキテクチャーを採用する初めての製品となる。従来製品に比べて処理効率を高めるとともに、演算コア数を従来製品の128から240へと増やすことにより、大幅な性能アップを実現する。

 単一デザインのシェーダーユニットでさまざまな処理をこなすDirectX 10では、シェーダーの役割を果たす演算コアそのものの性能だけでなく、複数のコアを効率良く使えるようにするスループット(一定時間に処理できる仕事量)性能が求められる。そこでNVIDIAは、GeForce GTX 200シリーズにおいて、コアの浮動小数点演算機能を従来の2倍の精度となる64ビット浮動小数点演算に対応させることで、コアそのものの処理能力を向上させ、より複雑な演算処理ができるようにしている。

 さらに、演算処理における管理単位となるクラスター構成も変更。GeForce 9000/同8000シリーズでは、16個の演算コアを1つのクラスターとして演算処理を行なってきたが、GeForce GTX 200シリーズでは24個のコアを1つの演算クラスターとし、さらにその中に3つのスレッド処理クラスター(プログラムの一連の流れを処理する)に分割している(※)。このスレッド処理クラスターは8個の演算コアで構成され、命令発行ユニットと16KBの共有メモリーを搭載。16KBと小さなサイズながら、この共有メモリーが頻繁に使われる命令やジオメトリーデータなどを格納、ほかのコアとデータを共有することで、スループット性能を大幅に向上させることに役立っている。こうした機能強化により、GeForce GTX 280では従来のGeForce 9800 GTX/同8800 GTXに比べ、2倍のスレッド処理能力を実現している。

 GeForce GTX 200シリーズでは、スレッド処理クラスターが扱えるレジスターファイルサイズを従来の2倍にしている。レジスターファイルは、グラフィックスチップの処理命令などを格納するファイルのことで、このファイルサイズを2倍にすることで、複雑な処理でもメモリーへのアクセスを最小限に抑え、スループット性能を引き上げるのに役立っている。さらにジオメトリーシェーダー性能やテクスチャー処理性能など、そのほかの機能についても見直しを図り、それぞれ処理効率を高めている。

 同社でテクニカルマーケティングを統括するトニー・タマシ上級副社長は、このGeForce GTX 200シリーズを、3Dゲームなどのグラフィックス性能に特化した従来のグラフィックスチップとは一線を画す「これからのグラフィックスチップ」と位置付けている。すなわち、今後グラフィックスチップは、グラフィックス処理だけでなく、そのほかの汎用処理性能も高めていくことになるとみているわけだ。

 NVIDIAはGeForce GTX 200シリーズを、グラフィックスチップから汎用処理も視野に入れた新世代のグラフィックスチップへの転換を果たす重要な製品に位置付けている。このため、NVIDIAがGeForce GTX 200シリーズの強化に「CPU的手法を各所で導入した」(タマシ氏)というように、これまでと異なるアプローチでアーキテクチャーを拡張した。

 このアーキテクチャー拡張により、GeForce GTX 280では、IntelのCore2 Extreme QX9650の96GFLOPSの約10倍となる、933GFLOPSと、スーパーコンピューター並みの演算処理能力を実現している。このけた外れな演算処理能力を、グラフィックス処理のみならず、一般的なアプリケーションでも使えるようにすることこそ、NVIDIAが次世代グラフィックスチップに課した課題なのだ。

 NVIDIAは、この新世代のグラフィックスチップの誕生を期に、製品の命名方法も変更した。新しい命名方法は、製品のセグメントを示すクラスを先頭にし、続いて3けたのモデルナンバーを割り振る。これは、現在、GeForce 9800シリーズと同8800シリーズに数多くのモデルが存在し、その上下関係が把握しづらいという市場の声を反映したものだという。ちなみに、GeForce GTX 280の“2”は、第2世代のユニファイドシェーダー構成を採用したモデルであることを意味し、3けたの型番は製品セグメントをまたいでもかぶらないように配慮される予定だ。つまり、GeForce 9600GT後継モデルが登場する際には、“GT 240”といったモデルナンバーになる予定だという。

 GeForce GTX 280は、従来のGeForce 9800 GTX/同8800 GTXの約2倍となる240個の演算コアを内蔵するだけでなく、前述の通り大幅なアーキテクチャー拡張を加えることによって、65nmプロセスで約14億トランジスターを集積する巨大なチップとなった。そのパッケージサイズは約45×45mmとなり、NVIDIAの共同創始者でもあるジェンツェン・ファンCEOは「台湾の半導体製造委託工場のTSMC(Taiwan Semiconductor Manufacturing Company)でもかつて経験したことがないほど、非常に複雑で巨大なシリコンとなった」と紹介するほどだ。

■変更履歴
記事冒頭で演算コア数を320としていたのは、240の誤りでした。本文は修正済みです。[2008/06/18 11:00]