ITmedia NEWS > 製品動向 >

Googleの「コロナ感染者予測」は信頼に足るのか 専門家がメカニズムを解説(1/2 ページ)

» 2021年05月05日 10時00分 公開
[樋口隆充ITmedia]

 新型コロナの感染拡大に伴い、政府が出した3度目の緊急事態宣言下での大型連休が終盤に差し掛かった。しかし、変異株の流行もあり、東京、大阪を中心に主要都市での新規陽性者数は再び増加傾向にある。

 先行きに不透明感がある中、注目を集め続けているものがある。米Googleの新型コロナに関する予測サービス「COVID-19感染予測(日本版)」(以下、Googleモデル)だ。機械学習を用いた独自の計算式に基づき、都道府県別に日別の新規陽性者数、死亡者数などを予測する。

photo 米Googleの「COVID-19感染予測(日本版)」

 「AlphaGo」など、人間のトッププロを超える囲碁AIを開発した英DeepMindを傘下に持つGoogleが出したモデルであることから、その注目度は高い。しかし、必ずしも予測が当たるかというとそうではない。例えばGoogleモデルは1月12日に、新規感染者数が2月6日に1万人を超えると予想していたが、実際には1月8〜16日がピークで、2月に向けて下降。6日の実際の新規感染者数は約2000人だった。

 高い実績を誇る数々のAIで知られるGoogle。その一方で、予測を外すこともあるGoogleモデル。Googleモデルは信頼に足るのか、その予測とどう向き合うべきなのか。データ分析・数理モデリングの専門家である江崎貴裕さん(東京大学特任講師)に聞いた。

従来モデルとは異なるGoogleモデル

 画像認識などの分野を中心に成果を上げているAI。Googleモデルにも予測結果の算出に一部でAIが使われているが、江崎さんは囲碁などに使われるAIとGoogleモデルは「全く別物だ」と断言する。

 一般的なAIの特徴について江崎さんは「基本的には閉じた環境、つまりあまり状況が変わらないときに十分なデータを用意して学習することで正しい答えを出すことができるタイプ」と解説する。これに対し、Googleモデルは、感染状況によって人々の動向が日々変化する上、世界的にも初の経験であることからこうしたタイプには該当しないという。

 Googleモデルは「SEIRモデル」という数理モデルに基づいている。SEIRモデルでは、全人口を、免疫を持っていない人(Susceptible)、感染が潜伏期間中の人(Exposed)、発症した人(Infectious)、回復した人(Recovered)に分類する。感染症が順番に人に伝染していく過程を数式にしたもので、感染症の予測で一般的に使われるモデルだ。潜伏期間を省いた「SIRモデル」もあり、こちらはTwitterでの噂や流行の広がり方を分析するのにも使われるという。

 算出した予測数値に感染スピードを示す「パラメータ」を組み合わせることで陽性者数を予測する仕組みだ。このパラメータを推定するためにGoogleは機械学習に基づいたアルゴリズムを利用している。

 SEIRモデルはS、E、I、Rそれぞれの関係を表す4つの方程式からなり、各式の変数には係数(パラメータ)が付く。パラメータは感染率や発症率、回復率などを表しており、一般的にはある感染症について過去のデータを分析することで、これらのパラメータを推定する。

 例えばy=axという方程式で説明すると、aがパラメータで、xy平面にプロットした点群からaがいくつくらいと計算するのと同じだ。

 Googleモデルでは、このパラメータの推定に機械学習を導入し、日々得られる各種データからパラメータを随時更新している。

 SEIRモデル、数理モデルなどと聞くと、拒否反応を示す人も一部いるかもしれないが、その構造自体はシンプルなもので「現在の19歳の人口を基に1年後の20歳の人口を予測することと、そう大きくは違わない」と江崎さん。

 ただ、Googleモデルのパラメータは人の行動次第で変動するため、予測結果が大きく外れることもある。新型コロナの予測については、日本で何も対応しなければ42万人の死者が出るという予測結果を出した北海道大学の西浦博教授(当時、現京都大学大学院教授)が批判を浴びた。予測結果が悲観的で、結果だけでいえば大きく予想を外したからだ。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.