Hivemall: Machine Learning Made Easy with SQL

Hivemall: Machine Learning Made Easy with SQL

E36:Hadoop/Hive | db tech showcase Tokyo 2015

Hivemall: Machine Learning Made Easy with SQL

Apache Hive上で動作するスケーラブルな機械学習ライブラリHivemallを紹介する。HivemallはHiveのユーザ定義関数として機械学習の一連の機能を提供しており、SQLライクなクエリによって機械学習の一連のプロセスを実行できるという特徴がある。本セッションでは、Treasure DataのクラウドサービスにおいてHivemallを使用して機械学習を実行する上での知見を述べる。具体的には、機械学習の学習処理をバッチ処理に適したHadoop上で行い、そこで構築された学習モデルを利用して、関係データベース上でリアルタイムの予測処理を行う手法を紹介する。

油井 誠

トレジャーデータ株式会社 – リサーチエンジニア