ITmedia NEWS > 企業・業界動向 >

データサイエンティストの仕事は奪われない 「Kaggle Grandmaster」が語るデータ分析の本質(1/2 ページ)

» 2019年10月21日 19時22分 公開
[村上万純ITmedia]

 「AutoML(などの自動化ツール)はデータサイエンスのプロセスの一部を効率化できますが、データサイエンティストの業務全体を置き換えることはあり得ないと思います」

 「よくAutoMLでデータサイエンティストの仕事がなくなるといわれますが、本当にそれで仕事がなくなら、もうなくなってるんじゃないでしょうか」

 10月17日に開催されたデータサイエンティスト協会のシンポジウムで、こんなやりとりがあった。登壇したのは、パナソニックの阪田隆司(ビジネスイノベーション本部 AIソリューションセンター)さんと、ディー・エヌ・エー(DeNA)の小野寺和樹さん。

左からパナソニックの阪田隆司(ビジネスイノベーション本部 AIソリューションセンター)さんと、ディー・エヌ・エー(DeNA)の小野寺和樹さん。2人ともKaggleの最高位「Grandmaster」の称号を持つ

 2人は、データ分析や機械学習のコンペに参加できるプラットフォーム「Kaggle」(カグル)で、最高位である「Grandmaster」の称号を持つ(注1)。Kaggleは全世界で300万人以上のAI研究者や技術者が参加するサービスで、Grandmasterは日本では10人ほどしかいないという。

注1:Grandmasterになるには、Kaggleのコンペで5つのゴールドメダルを獲得する必要がある。Kaggleはチームでも取り組めるが、5つのうち1つはソロゴールド(1人参加)でなければならない

 数少ないGrandmasterの2人は、Kaggleと業務におけるデータ分析をどう結び付けているのか。Kaggleの魅力や、Grandmasterになって見えた景色などについて語った。モデレーターは、日本経済新聞でデータサイエンティストを務める「Kaggle Master」の石原祥太郎さん(デジタル事業情報サービスユニット)。

Kaggleの仕組み

「機械学習の初心者」からGrandmasterに

 小野寺さんは大学で経済学を専攻し、阪田さんは大学院で航空宇宙工学を専攻していた。両者とも機械学習とKaggleは社会人になってから触れたという。チームでコンペに臨むことが多いという小野寺さんは、「数学的なバックグラウンドがないので、数学が詳しいメンバーに助けてもらっています。私は特徴量エンジニアリング(注2)が得意のようです」と役割分担について語った。

注2:機械学習モデルの精度向上に向けて、追加の変数(特徴量)を作ってデータセットに追加すること

日本経済新聞でデータサイエンティストを務める「Kaggle Master」の石原祥太郎さん

 大学と大学院で機械学習を学んでいた石原さんは、「大学ではSVM(サポートベクターマシン)など有名な手法を学びますが、それがKaggleの文脈では必ずしも使われないことがあり、理論と実践の両方で良い勉強になっています」と話す。阪田さんも「理論を知っているだけじゃKaggleでは良い順位を取れません。実際に手を動かして、体系化しにくいノウハウを実体験に基づいて学べるのがKaggleの良い所です」と続ける。

 正解がない課題に取り組み、試行錯誤しながら答えを探していく姿勢は、業務でも大事だ。Kaggleは順位がはっきりと出るため、「他のユーザーに負けたくない」という気持ちに火がつくと、ついついKaggleに夢中になってしまうのは石原さん含め、三者共通だという。

 Grandmasterになったことで、何か反響はあったのだろうか。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.