2024年12月3日
PlayStation開発担当者に聞く、リアルタイムインタラクティブ技術の過去・現在・未来 (1/2)
初代のPlayStation®の開発に携わり、長期にわたりゲーム領域に従事してきた豊禎治。近年は、ゲームをはじめとするインタラクティブエンタテインメントに貢献する先端技術の研究をリードし、特にリアルタイムレイトレーシングを使った写実的CG表現や知的情報処理を用い認知(コグニション)を考慮したUI技術など広範な先端技術の研究に取り組んでいます。これまでのキャリアとテクノロジーにかける想いを聞きました。
-
豊 禎治
株式会社ソニー・インタラクティブ
エンタテインメント
Distinguished Fellow
AI研究からPlayStation開発の道へ
──まずソニー入社のきっかけについて教えてください。また、学生時代の専攻や入社後、最初に担当した業務はどのようなものだったのでしょうか
学生時代はコンピュータサイエンスを専攻し、主にAI(人工知能)について学んでいました。私の研究テーマは、コンピュータの計算速度やメモリーに限度が無ければ、人間と見分けがつかないAIが生まれるのではないかという壮大な仮説で、それを証明するためのアプリケーションとして、自動翻訳に取り組みました。機械にひたすら学習させていくことで訳語を正確にしていく論文を発表したところ、担当教授からニューラルネットを研究するように勧められました。人間が教えるのではなくコンピュータが自律的に学ぶ仕組みに興味を持ちはじめた頃に就職時期を迎えました。
当時、学生時代の先輩がソニーの研究所でまさにAIを研究していたことがきっかけで、私もソニーに入社。最初の業務は、ソニーのデジタルオーディオ技術を活用した、他社ゲーム機のサウンドチップの受託開発です。バイオリンなど楽器の音や人の話し声をサンプリングすることで、それらの音をいろいろな音程で再生できる、という当時としては画期的なもの。私は作曲家が譜面のデータを入れるための入力システムの開発に携わりました。もともとはAIに関わりたくて入社しましたが、中学生くらいからロックミュージックが好きでアンプやスピーカーなどソニーのオーディオにも興味があったので、精力的に取り組むことができましたね。
サウンドチップの次に手がけたのは、ROMカセットのゲーム機の周辺機器となるCD-ROMの読み込み機器の開発です。従来のROMカセットの100倍以上のデータ容量をもつCD-ROMならではのゲームとはどうあるべきか、を突き詰めていくプロジェクトでした。その後、紆余曲折を経て、私たちはソニーとしての新たなゲーム機の開発をスタートさせました。ここからPlayStationは生まれました。
計算機能を半導体のチップに閉じ込める
──PlayStationの開発で印象に残っているエピソードを教えてください。
PlayStationのコンセプトについて、プロジェクト責任者であった久夛良木さんの頭の中には明確なイメージがありました。当時コンピュータグラフィック(CG)だけでつくられた映画が登場しはじめていて、あのフルCGの世界のゲームを創りたいと。
ただ、フルCGでのゲーム作りの実現には非常に困難が伴いました。当初私は、背景を動画としてあらかじめCGで作り込み、動く背景の前にキャラクターを出すようにすればインタラクティブに動いているように見えるのではないか考えたんです。それで確かにフルCGのゲームはできたのですが、何せ単調なんですよね。プレイヤーからすると、撃って敵を倒すだけのゲームです。それってゲームとして本当に面白いのか、と疑問が残りました。
そこで、ゲーム画面すべてをリアルタイムにCG映像でつくっていく方式へと発想を転換しました。リアルタイムCGは最低でも1秒あたり30フレームないと滑らかに動いているように見えません。つまり、1/30秒で1枚のCG映像をつくる必要があるわけです。3D世界の最小単位は、3つの頂点で構成される「ポリゴン」です。ポリゴンをたくさん組み合わせることで高精細な物体を作ることが可能になります。ではどれぐらいポリゴンや演算量が必要になるのか。PlayStation向けの最初につくったデモムービーを例にすると、恐竜本体は2,700ポリゴンで構成されています。動く恐竜をスクリーンに投影するには、1秒あたり、2,700ポリゴン×3頂点×30フレーム=243,000回の頂点演算が必要です。
デモとしてPlayStationで最初につくった恐竜
当時、そのような処理が可能なワークステーションは1台数千万円と非常に高額なものだったので、家庭用ゲーム機でどう再現するかが大きな課題でした。久夛良木さんのアイデアは、頂点演算の機能を半導体のチップの中に閉じ込めてCPUに入れ込めば、安価に量産可能になるはず、というもので、ジオメトリエンジン※を開発しCPUに入れ込むことで実現に漕ぎ着けました。ここが一番のブレークスルーであり、その後のPSシリーズの基礎的な技術の一つとなっています。
※ジオメトリエンジン:3DCGにおいて座標変換を専門的に行うソフトウェアやハードウェア
私自身が直接開発に関わったのはPS3までですが、ソフトウエアエンジニアとして意識していたのは、ゲームソフトを開発するゲームデベロッパーにとって、いかに使いやすい開発環境を提供できるか。3DCGのライブラリーを担当していたので、3DソフトウェアライブラリーをAPIとしてデベロッパーに提供していました。
ここで培った技術や考え方が、私の現在の専門であるリアルタイムレイトレーシングなどインタラクティブ技術へと最終的につながっていきます。現在は、これまでの経験を活かして、インタラクティブ技術やソニーのデジタルインタラクティブ技術のビジョンや方向性を考える立場にあります。リアルタイム3DCGの切り口からゲーム業界全般を見通して、新たな技術がゲームをどう変えていくかというところに現在関心を持っています。
リアルタイムレイトレーシングの進化
──リアルタイムグラフィックスやリアルタイムレイトレーシング、UIなどのインタラクティブ技術の魅力と今後の展望についてお話ください。
ゲームは基本的に、リアルタイムで場面や挙動を創り出していくコンテンツです。初代PlayStationからPlayStation 5 (PS5®)、そしてこの先の未来まで、コンピュータの性能の進化が続いて演算能力が向上し、大量のシミュレーションを走らせることでよりリアルにどんどん近づいていくでしょう。
リアルタイムレイトレーシングを例にその進化を紹介しましょう。レイ(ray)とは光線のこと。光源や物体の状況を踏まえて処理を行うことで、3DCGをディスプレイ上に表現します。従来、ポリゴンに貼られた模様(テクスチャ)をポリゴン単位で処理をして色を決めていました。レイトレーシングでは眼に飛び込んでくる無数のレイを光源からたどりシミュレートします。これには、膨大な計算が必要になりますが、光線をサンプリングして計算可能な数に落とし込み、かつ目の中に飛び込んでくる光が何回反射しているのかも合わせて計算することで、キャラクターの動きに合わせた写実的で美しい3DCG処理が実現可能になっています。
光源と眼に飛び込んでくる無数のレイ
演算能力が現在の数万倍にまで向上すれば、人の目には現実と区別がつかないほどのリアルタイム3DCGによる映像表現が実現できると予測されています。
このような演算能力の向上のほかに、画質の劣化を抑えるためのさまざまな試行錯誤が続いています。そこで期待しているのがAIの活用です。たとえば、レイが少ないと暗闇で撮影した写真や映像のようにノイズが乗ってしまうのですが、これをAIによって除去する技術が確立されています。また、2024年11月に発売されたPS5 Proには、AIによって強化された超解像度技術によって圧巻の鮮明さを実現するPlayStation スペクトルスーパーレゾリューション(PSSR)が搭載されています。
ただ、現在の技術においても再現が難しいものもあります。その一つが人間です。たとえば髪の毛の一本一本の再現やふわっとした動き、微妙な表情についても改善の余地があります。人間はゲームのなかで登場する重要な存在だからこそ、少しでも不自然だと不気味の谷現象によって違和感が生まれ、体験が損なわれてしまいます。人間をいかにリアルに表現し、自由にコントロールできるかが現在の主な課題の一つと言えるでしょう。
