Larrabee単語

ララビー

3.6千文字の記事

掲示板へ

記事編集

Larrabeeとは、米 Intel社が現在開発中のx86系並列型データプロセッサである。

概要

後期Pentiumにあたる"P54C"アーキテクチャをベースにベクトル演算器を拡張したものを1コアとし、それを多数並べてリングバスで繋いだものの他、テクスチャユニット、メモリコントローラ、ディスプレイインターフェース、PCI Express インターフェースを搭載し1プロセッサとする。

初期は別個の製品として発売される予定だが、IntelはLarrabeeで培ったノウハウを用い2014年には並列データ演算用のコプロセッサとしてCPUに統合するつもりだった。

Larrabeeは結局製品化されず、これに続く「Larrabee2」も中止されたが、Larrabeeのアーキテクチャを受け継いだ「Xeon Phi」が後に発売されている。^[1]

もっと詳しくて長ったらしい話

LarrabeeはGPUなのか

Larrabee（正確に言えばLarrabee以降に連なるであろう一連の製品群）は今のところ、「Intelの開発している新しいGPU」という認識が多いようで、実際そう書いているサイトもいくつかある。
それは間違いではないが、簡潔に書きすぎて誤解を招く表現である。

Larrabeeが狙う市場の一部分が3D グラフィックスというだけの話で、別に3D グラフィックス処理のためだけに作られたものではない。

というか3D グラフィックの為の演算回路をハードウェアで搭載しているNVIDEAやATIのGPUに、ほぼ全て（テクスチャ演算以外）の処理を全てソフトでやろうとしているLarrabeeが現状勝てるはずがない。（固定機能 ICとCPUに同じ処理をさせた場合、固定機能 ICのほうが高い性能を示すのは当然である）

正確に言えば、Larrabeeが見据えているのはHPC分野を代表とする超並列データ計算だ。

CPU化するGPU、GPU化するCPU

GPUは2D表示機能が成熟しきって以降、3D グラフィック演算性能を高速化する方向でひたすら進化してきた。ひたすら進化するうち、GPUはハイエンドでは演算ユニットが100以上、演算性能も1TFLOPSを超えるものすら出てくる超並列型巨大プロセッサとなった。(極端な話、3D グラフィック演算は仮想カメラから見てどの物体のどの面がどんな色で一番手前に見えるかを画面のドット毎に計算する超マルチスレッドプログラムといえる)

となれば、その演算性能を超並列データ計算に流用しようという動きが出てくるのも必然といえるし、DirectX8より採用されたプログラマブルシェーダがそれを可能にした。

実際、二大GPU メーカーの片割れであるnVIDIAはGPUをグラフィック以外の並列演算に使用するためにCUDAというプラットフォームを発表したし、CUDA専用のGPU(ディスプレイ出力は持たないが内部構造は間違いなくGPU)としてTeslaというシリーズを発表している。

一方のIntel。"Prescott"でシングルスレッド性能の向上に行き詰って以降、マルチコア及び並列演算性能の強化に力を入れているのは皆さんご存知の通りだろう。マルチコア化の流れは既に8コアの開発中コア"Nehal em-EX"が発表される段階まで来ているし、それ以降の16コア、24コア、さらには32コアでさえも既に計画の中に入っていると言われる。

単体の性能はそこまで高くないコンパクトなユニットを数十から百数十個並べることでCPUより汎用性は低いながらも高い並列演算性能を実現するGPU、コア単体の性能向上を諦めたかわりにコアをいくつも搭載することにより高い汎用性とそれなりのシングルスレッド性能を維持しつつ並列演算性能を向上させているCPU。

CPUとGPU、お互いの特徴が近づきつつあるということをわかっていただけただろうか。

「CPU」の足かせ

前節で触れたIntelのマルチコア及び並列演算性能の強化というのは、現在の製品で言うところのCore2 シリーズ及びCorei7 シリーズの話である。パソコンの「CPUとして」開発されているCore系プロセッサは、今までのソフトウェア資産を今までと少なくとも同等かそれ以上の速度で実行できることを期待される。つまり、「1コアあたりのシングルスレッド性能を最低でも維持する」ことが前提なのだ。

しかし、それではGPUの処理速度向上に食らい付いていくことはできない。「シングルスレッド性能の維持」という足かせゆえ、コアのサイズをある程度大きくせざるを得ず、その分たくさんのコアを並べることが出来ないからだ。

ではどうするか、というのは意外にも逆転の発想で簡単に解決する。

要は「CPUとして開発しなければ」シングルスレッド性能の維持という足かせを取り払う、すなわちシングルスレッド性能を削ることが出来るようになるわけで、シングルスレッド性能を削りサイズを縮小した分たくさんのコアを並べ全体としての並列演算性能を稼ぐことが出来る。Atomの項でも述べたが、今までIntelは2倍の面積で1.25～1.4倍程度の性能となる機能にトランジスタを費やしてきた。

ということは最も基本的なコアに立ち返ればもっとも良い面積性能比（もちろん消費電力も）が得られるはずである。x86に連なる歴代のコアの中でP54Cの次となるP55Cは製品名であるMMX Pentiumが示すとおり、拡張命令 MMXが実装されている。すなわちP54Cは最後の「素の」x86系アーキテクチャであり、故に P54Cがコアのベースとして選ばれたのである。

Larrabeeの位置づけ

Larrabeeは「CPU」というカテゴリに属するゆえの足かせを取り払うことによって1コアのサイズを小さくして面積性能比を高め、それを現在のCPUよりも圧倒的に多く並べることによって並列演算性能を稼ぐというコンセプトであるのは前節で納得していただけただろう。それはマルチコア、並列化する現行のCPUよりも更に数段GPUの側に寄った設計思想であり、CPUの弱点を解消するためのものだと言える。

では逆に、Larrabeeは何を武器に戦うのだろうか。弱点を埋めるのも良いが、相手に対する優位点がなければ弱点をいくら埋めても勝つことは出来ないはずである。

と、問題提起しておきながら答えは至極簡単だ。単純に、「x86系であること」である。x86系のコードを実行出来るということは過去のx86系CPU用プログラムをほとんど手間無く実行出来る（性能は落ちるだろうが）ということだし、仮に新しくプログラムを組むとしても使い慣れた言語を使用出来るというメリットはとても大きい。プログラマにとって新しい言語を習得するというのは面倒なことだし、それでなくともGPUのプログラム文法は扱いづらいのだ。

ソフトの変化を期待するLarrabee

とはいえ、現状ではLarrabeeが普及するのはまだ難しい。並列データ演算のためのプラットフォームとしてはCUDAに先を越されてしまっているし、3D グラフィック演算に従来のDirectXを用いる状況ではやはり最適化されたGeForceやRADEONのほうが速い。

その状況を打開するにはまず、ソフトウェアを作るメーカーに「従来の制約から解き放たれた自由な3D グラフィック処理、超並列データ演算」を体験してもらい、納得してもらい、そして移行してもらう必要があるだろう。そして3D グラフィック処理がLarrabeeに移行した時、それは従来の「GPUが専門に担う」といったような特別なものではなく単にCPUが演算する数多くのタスクの中の一つとなるのだ。

すなわち、Larrabeeが普及するためには「Larrabeeが従来の土俵に上がるのではなく、ソフトをLarrabeeの土俵に招き入れ」なければならない。過去のソフトとの互換性を重視するPCにおいてはなかなか難しい取り組みだが、もしこれが成功したとしたらと考えるとその時のインパクトは計り知れないものがある。

これからのLarrabee

残念ながら、第一世代となるLarrabee1の製品化は見送られてしまった。2010年のGPUにはまだ対抗出来ないと判断されたからである。

しかしこれは計画の頓挫を意味するものではなく、Intelはまだ2014年のCPUへの統合を諦めてはいない。第二世代のLarrabee2から製品化されるといううわさもある。

3D グラフィックス、いやソフトウェア全体をガラリと変えてしまう可能性すらも秘めているLarrabeeに、これからも注目せざるを得ない。

脚注

*GPU黒歴史 Intel Larrabeeほかマイナー系GPUを総ざらえ 2012.7.2

ページ番号: 3449759
初版作成日: 09/06/03 02:54

リビジョン番号: 3004080
最終更新日: 22/02/24 20:34

編集内容についての説明/コメント:

概要に追記しました（中止

記事編集編集履歴を閲覧

キーワード「Larrabee」でニコニコ動画を検索

タグ「Larrabee」でニコニコ動画を検索

ニコニ広告で宣伝された記事

ウマ娘プリティーダービー (単) 記事と一緒に動画もおすすめ！

提供： RAY

87083900pt

この記事の掲示板に最近描かれたお絵カキコ

お絵カキコがありません

この記事の掲示板に最近投稿されたピコカキコ

ピコカキコがありません

Larrabee

Larrabeeの記事へ戻る

3 ななしのよっしん非表示 2009/11/02(月) 14:38:23 ID: tQJ9xUfgMQ レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: Larrabeeを採用したPCが一般人の手元に届くのは、
いつごろなんだろうね。; 👍
高評価

0
👎
低評価

0
4 ななしのよっしん非表示 2009/11/05(木) 14:58:59 ID: 3WIBGsX3Oq レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: 正直言って、期待できない。
というか、出てくるのが予定より遅すぎて…
ホントに来年出るのか？; 👍
高評価

0
👎
低評価

0
5 ななしのよっしん非表示 2009/12/09(水) 20:27:09 ID: tQJ9xUfgMQ レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: Larrabee こけちゃったね、残念; 👍
高評価

0
👎
低評価

0
6 ななしのよっしん非表示 2010/01/09(土) 00:22:53 ID: TCIIIuWyjT レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: 将来出てくるLarrabee3が追加CPU的な位置づけで出てくるとしたらPCの世代的な寿命を伸ばせる物になるかも。
PCI Expressさえあれば型遅れPCでもある程度性能がアップできるし。
動かす時はCPUとLarrabeeが協力して１プロセスの処理を２コア CPUのように処理できるようになればいいなあ。
それとも、それぞれ別のプロセスをsをするプロセッサとして動作するのかな。; 👍
高評価

0
👎
低評価

0
7 ななしのよっしん非表示 2010/01/09(土) 00:25:56 ID: TCIIIuWyjT レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: ↑あう、、、タッチパッドに手が当たって投稿になってしまった、、；；
s＝処理、、、ということで。（後のをも無しで；）; 👍
高評価

0
👎
低評価

0
8 ななしのよっしん非表示 2010/05/26(水) 00:11:20 ID: 2mylHArD4X レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: いつ出んのかねぇ…
結局SandyBridgeのが先になったし…22nm プロセス CPUより先には出る…よね？; 👍
高評価

0
👎
低評価

0
9 ななしのよっしん非表示 2012/06/21(木) 06:23:21 ID: 6u52Hf7mCS レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: きたああああああああああ
 http://ascii.jp/elem/000/000/703/703244/; 👍
高評価

0
👎
低評価

0
10 ななしのよっしん非表示 2012/09/10(月) 09:46:50 ID: tQJ9xUfgMQ レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: http://pc.watch.impress.co.jp/docs/column/kaigai/20120910_558566.html
これで勝つる！; 👍
高評価

0
👎
低評価

0
11 ななしのよっしん非表示 2012/10/05(金) 14:23:50 ID: tqdgo0Zo5E レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: Larrabeeって名前は捨ててKnightsシリーズになったのか; 👍
高評価

0
👎
低評価

0
12 ななしのよっしん非表示 2013/09/23(月) 21:51:34 ID: tQJ9xUfgMQ レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: ラララビさん。
失礼、噛みました。; 👍
高評価

0
👎
低評価

0

Larrabeeの記事へ戻る

Larrabee単語

概要