ITmedia NEWS > 製品動向 >

Google Assistantの「リアルな機械音声」 作ったのはDeepMind

» 2017年10月05日 20時00分 公開
[井上輝一ITmedia]

 米Alphabet傘下のDeepMindは10月4日(米国時間)、Googleの音声アシスタントである「Google Assistant」の英語と日本語の音声に、同社の機械学習による音声合成アルゴリズム「WaveNet」の改良版が採用されていることを発表した。スマートスピーカー「Google Home」やAndroid上のアプリなど、全てのプラットフォーム上の音声がWaveNetによるものだという。

Google Assistantに採用されたDeepMindの「WaveNet」

 WaveNetは、DeepMindが2016年9月に公開した音声合成アルゴリズム。人間の声を分割・連結して音声を生成する今までの音声合成アルゴリズムに対し、WaveNetはディープラーニングで人間の声を学習し、1回の発声ごとに生の音声波形を0からモデリングすることで、より自然な音声を生成できるとする。

 2016年の公開時では1回の音声合成に必要な計算コストが高く、製品への導入を見送っていたが、Google Assistantに採用された改良版は2016年モデルに比べて生成速度が1000倍高速になったという。

聴覚上の音声の品質を評価する「平均オピニオン評点」(最低が1、最高が5)によるWaveNetの評価。既存の音声合成アルゴリズムより高評価で、人の声のスコア(4.667)にも迫るという

Copyright © ITmedia, Inc. All Rights Reserved.