ITmedia NEWS > STUDIO >

ベタ塗りすら不要、NVIDIAのお絵かきAIが進化 文字からリアルな画像生成

» 2021年11月24日 13時00分 公開
[井上輝一ITmedia]

 米NVIDIAは11月22日(米国時間)、風景画像を自動生成する同社のAI技術「GauGAN」(ゴーギャン)の新モデルである「GauGAN 2」を発表した。従来はベタ塗りからリアルな画像を生成できていたが、GauGAN 2では文字情報を与えるだけで画像を生成できるようになった。

岩場に向かって白波が立っている様子の画像が文字から生成されている

 同社が公開している動画では「ocean waves hitting rocks on the beach」(ビーチの岩に当たる波)と入力する過程が収められており、「ocean」の段階では湾を俯瞰した画像が作られ、「waves」まで入れると波が現れ、「hitting rocks」まで入れた段階では波打ち際の画像が生成されている。

「ocean」の段階では湾を俯瞰した画像が作られている
「waves」まで入れると波が現れる
「hitting rocks」まで入れた段階では波打ち際の画像が生成されている

 最後の「on the beach」の段階では、手前に岩場ができ、岩場に向かって白波が立っている様子の画像となっている。

できあがった画像

 同社のスーパーコンピュータ「NVIDIA Selene」を使い、1000万枚の風景画像を学習したという。その際、研究チームは「冬」や「霧」「虹」といった各画像の特徴を表す単語をひも付けていた。

 同技術を体験できるWebアプリのデモ版を公開している。文字から画像を生成した後に、ベタ塗り機能を使って調整し、再度画像を生成することも可能だ。

Webアプリのデモ版の使い方

Copyright © ITmedia, Inc. All Rights Reserved.