一般社団法人 人工知能応用センター(AIAPセンター)
Artificial Intelligence Application Center

企業の非技術系一般社員でも機械学習を利用できるようにするH2O.aiのDriverless AI

 上記表題は、TecCrunchが2017年7月に記載させた記事の表題です。(記事冒頭をページの最後に添付)

インフォメーションでも記載しましたが、2018年6月6日にIBM社とH2O社は「DriverlessAI」で戦略的パートナシップ契約を結びました。IBM社が商用ベースで利用する価値があると判断した結果です。

 日本ではあまり知られていませんが、海外では多くの科学者、企業等がH2OのAIを利用しています。色々な形でプロダクトを利用できますが、特質すべきは、データを準備すれば、ノンプログラミングでディープラーニングを利用できることです。

 TensorFlow(Google)、MXNet(ワシントン大学とカーネギーメロン大学)、Caffe(UC Berkeley)等多くの機械学習システムはプログラミングが必要であり、プログラムの専門家でないと利用することができません。また、機能を使いこなすにはデータサイエンティストの能力が必要となります。

 日本のAIベンダー、研究者も同じく、プログラムを作ることを前提としていますが、機械学習、ディープラーニング技術を広く企業内で利用してもらうには、別のアプローチが必要となってきます。

すなわち、プログラムの専門家でも、データサイエンティストでもない非技術系一般社員が容易に利用するアプローチが重要であり、システムが自動で学習モデルを作成してくれることが求められています。

gatner report

Gartner Report 2018年2⽉22⽇に公開(抜粋)

データサイエンスと機械学習プラットフォームにより、組織はデータサイエンスモデルの構築と展開にエンドツーエンドのアプローチを取ることができます。このマジック・クアドラントは、16のベンダーを評価し、組織のニーズに適したベンダーを特定するのを⽀援します。

H2Oの強み

技術リーダーとして、deep-learning能⼒、⾃動化機能、ハイブリッドクラウドサポート(どこにでも展開)、オープンソースの統合などのカテゴリーで⾼い評価を得ています。H2O Deep Waterは、TensorFlow、MXNet、Caffeのようなバックエンドの詳細の多くを抽象化するdeep-learningフロントエンドを提供します。そのマシン学習⾃動化機能(Driverless AIと呼ばれる)は印象的であり、まだ開発中ですが、同社の顕著なビジョンを⽰しています。リファレンス・カスタマは、柔軟性とスケーラビリティの観点から、H2O.aiをファースト・クラスとみなしました。それは最⾼のスパークインテグレーションの1つを持ち、グラフィックスプロセッシングユニットの統合作業において、他のすべてのマジッククアドラントベンダーに先んじています。

数値データをノンプログラミングで分析

 現在、ディープラーニングは、数値解析、画像認識、音声認識で多くの成果を出しています。

画像認識も音声認識も数値化し分析されますが、画像認識、音声認識に適したフィルター、ニューラルネット等が研究されています。

 今回は、企業内で需要が多い数値解析に焦点を当てて説明します。さらなる効率化、競争力の向上のため日々発生するデータを分析し、予測を作り業務改善を行われていることと思います。例えば、今日、需要予測、購買予測、天気予報、問題分析等、各種データより熟練の経験を持った社員が予測を行ったり、データマイニング、統計解析等のシステムで分析が行われています。

 これまでは、統計解析、データマイニング、機械学習とデータ解析技術が進んできましたが、システムを使いこなすこと、システムをチューニングする技術が必要で、一部の大手企業のみが利用している状況でした。

 現在は、機械学習、ディープラーニング技術を利用したシステムが出てきており、特に、ノンプログラミングでブラウザからデータを投入し、パラメータを設定するシステムが次々と発表されています。

代表的なシステムとして、米DataRobot社が開発した「DataRobot」、米H2O社が開発した「DriverlessAI」「H2OオープンソースAI」です。

1:「DataRobot」は、データを投入するだけでほぼ自動で、複数の機械学習モデルを作成し、最適なモデルを提案してくれます。優秀なデータサイエンティストが行う方法をシステムに取り入れ、ほぼ自動で最適なモデルを作成します。ちなみに、DataRobotにはH2Oのモジュールも利用されています。

2:DriverlessAIも同じく優秀なデータサイエンティストが参加して、AIパイプラインによる自動化を行っており、データを投入するだけで、最適なモデルを構築します。このたび、IBM社と戦略的パートナシップを結びました。

3:「H2OオープンソースAI」は、前2製品のように完全な自動化はまだまだですが、パラメータを設定することでディープラーニング技術を利用できる数少ないオープンソースです。オープンソースでの提供であり、コストパフォーマンスは前2製品に比べる必要もない高パフォーマンスとなります。オープンソースでありながら、学習したモデルはREST APIで利用することができ、既存のシステムの「意思決定モジュール」として利用することが出来ます。

 

DataRobot 米DataRobot

DataRobotは、機械学習のための自動化プラットフォームとして、TensorFlow、Decision tree(決定木)、ナイーブベイズ、SVMなど100以上の機械学習アルゴリズムが用意されている。最適なモデリング手法はデータによって異なるため、DataRobotでは複数のアルゴリズムの適用を試し、精度の高い順にモデルを提示する。

NSSOL、リクルート、大阪カス、パナソニック、電通、博報堂等が導入
DataRobot
 

Driverless AI H2O.ai

アメリカのH2O.ai社が提供するディープラーニングを行うAIツールです。本ツールは、専門的な知識が無くてもデータを準備するだけで、ディープラーニングを実行することができます。モデルを準備するときに必要なパラメータの設定等の決定の多くを自動化してくれるため、企業内の非技術系の社員である営業や人事など、データ分析とは無縁だった分野でも利用できることをコンセプトに設計されています。IBM社と戦略的パートナシップを締結。

DriverlessAI
 

H2Oオープンソース H2O.ai

H2OはオープンソースのAIプラットフォームです。世界中の10万人以上のデータサイエンティストと10,000以上の組織によって利用されています。
2011年に公開されて以降、スケーラビリティに優れた機械学習をオープンソースとして誰もがアクセスできるようにしてきました。R、Python、Java、Scala、JSON、FlowのGUI、REST APIから機械学習のモデルを試すことができます。現在も頻繁にバージョンアップを行われています。

H2Oオープンソース

H2OオープンソースAIの導入支援を行っています。

 当センターは、AIの利活用を推進することを目的として活動を行っています。

研究開発は当然重要ですが、研究開発と同じく技術の応用開発は社会へ直結するものであり、企業においてもビジネスチャンスを生み出します。

 しかし、新規技術の草創期は効果が見えないため、予算の獲得が難しいことが多く、計画書を作成しても経営陣に理解されないため、却下されることも多いと思います。

とりあえず、どのようなものが使ってみたい! 効果があるのかどうか調べたい!など、ディープラーニングを使ってみたい方には「H2OオープンソースAI」が最適なソリューションです。 

 また、少しの学習で非技術系の一般社員が利用できるように「H2Oの導入+機械学習入門編」をセットにしたソリューションの提供も始めています。

H2Oオープンソース

 H2Oは、世界をリードするオープンソースのディープ・ラーニングプラットフォームです。
  H2Oは世界中の8万人以上のデータ科学者と9,000以上の組織によって使用されています。各種分析モデルを装備し、FFNN(Feedforward neural network)によるディープラーニングをおこなうことが出来きるOSSです。
 ブラウザで起動することができ、パラメータの設定で実行することができます。企業内の非技術系の社員である営業や人事など、データ分析とは無縁だった分野でも、少し学習することで利用することができます。非技術系社員を再教育するコストを低く抑えることができます。
H2O機械学習機能

H2Oの統計的アルゴリズムには、K-meansクラスタリング、一般化線形モデル、分散ランダムフォレスト、勾配ブースティングマシン、ナイーブベイズ、主成分分析、一般化低ランクモデルが含まれます。


また、自動化の一つとしてモデルを自分で選択するのではなく、AutoMLという機能を利用することでトレーニングデータを読み込ませてやれば自動で複数のモデルで分析処理をかけてくれる機能もあります。



 H2OオープンソースAI導入支援ソリューション

 再度言いますが、当センターは、AIの利活用を推進することを目的として活動を行っています。

研究開発は当然重要ですが、研究開発と同じく技術の応用開発は社会へ直結するものであり、企業においてもビジネスチャンスを生み出します。

 しかし、新規技術の草創期は効果が見えないため、予算の獲得が難しいことが多く、計画書を作成しても経営陣に理解されないため、却下されることも多いと思います。

とりあえず、どのようなものが使ってみたい! 効果があるのかどうか調べたい!など、機械学習、ディープラーニングを使ってみたい方には「H2OオープンソースAI」が最適なソリューションです。 


 皆様の要望の応えるために、センターはオープンソース「H2O」の以下のセミナーを行っています。

先ずは、H2Oがどのようなものであるかをご紹介する「H2OオープンソースAIご紹介セミナー」です。H2Oの各シリーズ、機能概要、利用できるアルゴリズム、ブラウザ上で利用できるH2O-Flow、商用版Driverless AIとの違いをご紹介します。

次に、実際にH2Oを触っていただく「H2OオープンソースAIハンズオン・セミナー」です。H2Oのインストールからブラウザ上で利用できるH2O-Flowの使い方、実際のサンプル事例による演習を行っていただきます。

最後に、お客様の会社に導入するための特別のセミナーで「H2OオープンソースAI社内導入セミナー」です。営業職等データサイエンスの知識の無い社員の皆様にH2Oを利用していただくために、「H2Oの導入+機械学習入門編」をセットにしたセミナーです。





TecCrunch 2017.7.7 記事

企業の非技術系一般社員でも機械学習を利用できるようにするH2O.aiのDriverless AI

Driverless AIはH2O.aiの最新のプロダクトで、企業におけるデータサイエンスの活用の敷居を低くすることをねらっている。このツールは、非技術系の社員たちを助けて、データの準備、パラメータの調整、当面の問題に対する最適アルゴリズムの判断などのタスクを機械学習を利用して行う。
機械学習で解こうとする問題は、研究者のレベルでは複雑で予測不可能なものが多い。前例のないユースケースでGANや強化学習などの新しい技法を使っていくためには、高い技術力が必要だ。しかし企業が機械学習を使っていく場合は、比較的予測可能な問題が多い。たとえばサポートベクターマシンを使ってデフォルト率を評価するなど。
でも、そんな比較的簡単な問題でも非技術系の社員の手には負えないことがある。企業は営業や人事など、データ分析とは無縁だった分野でも最近ますますデータサイエンスを利用しようとしているが、そのために彼らを再教育するのはコスト的にたいへんすぎる。
H2O.aiのプロダクトはどれもAIを使いやすくしてくれるが、でもDriverless AI(運転者不要のAI)はさらに一歩進んで、モデルを準備するときに必要な難しい決定の多くを自動化する。Driverless AIは、feature engineering(特徴量工学、特徴量の選択・作成・変換)を自動化する。特徴量とは、いろんな変数/変量がある中で、モデルの構築に利用すべき重要な変数変量のことだ。

https://jp.techcrunch.com/2017/07/07/20170706h2o-ais-driverless-ai-automates-machine-learning-for-businesses/