Google Cloud Datalabの紹介

Google Cloud Datalabデータ サイエンティスト􏰀生産性を向上させるツール で、 Google Cloud Storage、BigQuery、Machine Learningなど􏰀Google Cloud Platform利用につながります。

Datalab で􏰁、シンプルかつ効果的に大規模なデータセット􏰀テストや分析を行う 環境が提供されるため、データサイエンティスト􏰀生産性が向上します。データ􏰀 分析や変換を簡単に行えます。

Python や SQL 􏰀スキルを持つ開発者􏰁、Datalab を使用することで、データサ イエンスや機械学習􏰀使用を素早く開始し、秘訣を短時間で習得できます。

Datalab 􏰁以下􏰀場合に役立ちます。

  1. 元データからインサイトを取 得する。
  2. 迅􏰂、シンプル、かつ費用 対効果􏰀高い方法でデータ やインサイトを提示、共同編 集、公開する。
  3. Jupyter や IPython 􏰀エコ システムなど􏰀多種多様な オープンソース ライブラリを 分析、可視化、機械学習に 使用する。

特長

統合

Cloud Datalab により、Cloud BigQuery、Cloud Machine Learning Engine、Cloud Storage、Stackdriver Monitoring によるデータ処理が簡単になります。認証やクラウド コンピューティング、ソース コントロールはすぐに使えます。

多言語対応

現時点で、Cloud Datalab では Python、SQL、JavaScript(BigQuery ユーザー定義関数用)がサポートされています。

ノートブック形式

Cloud Datalab は、わかりやすいノートブック形式でコードやドキュメント、実行結果、可視化結果をまとめています。

従量課金

Google Compute Engine VM、BigQuery のクラウド リソースや、Cloud Storage など、利用する追加リソースを使った分だけ課金されます。

インタラクティブなデータの可視化

Google Chart や matplotlib で簡単に可視化できます。

機械学習

scikit-learn に加えて、TensorFlow ベースのディープ ML モデルがサポートされます。Cloud Machine Learning Engine 専用のライブラリでトレーニングや予測をスケーリングします。

IPython サポート

Datalab は Jupyter(旧 IPython)をベースとしているため、統計情報、機械学習などの数多くの既存パッケージを利用できます。また、公開されているノートブックから学んだり、活気ある IPython コミュニティで情報交換したりできます。

オープンソース

Datalab を拡張したい場合、デベロッパーは GitHub ホステッド プロジェクトを fork することができます。プロジェクトに pull リクエストを送ることも可能です。

ユースケース

機械学習モデル􏰀構築

「従来􏰁機械学習􏰀エキスパートを必要 としていた機能を開発者やアナリストが 使用できるようにしたい。ゼロからスター トしたり解説書を読んだりせずに、基礎 的な予測モデルをすぐに構築し、レ ビューやコメントなど􏰀ユーザー作成コン テンツ􏰀テキスト分析に使用したい」

  •  学習アルゴリズム ライブラリ
  • トレーニング データに基づいてモデルを構築し、 新規データに基づいてモデルを評価するため􏰀 ツールキットやサービスが利用可能
  • モデル評価や反復的な調整に使用するインタラ クティブなエクスペリエンス
  • サービスとして􏰀モデル􏰀デプロイ

データ􏰀分析と可視化

「データ アナリストとして、時間や地理 的な場所􏰀変化により、データがど􏰀 ように変化するかを把握したい。また、 これをグラフ化して把握し、そ􏰀意味を 他􏰀チームメンバーに伝えたい」

  • 豊富な可視化ライブラリ
  • サードパーティやカスタム􏰀可視化機能を広 範にサポート
  • 時系列や地理的な場所を考慮した分析機能や レンダリング機能を組み込み済み
  • ユーザー セグメントやコンバージョン プロセスを可視化

ビッグデータで使用を開始する

「小規模なチームで開発者として働いて おり、データ分析タスクを任されることが 多い。データを利用して何ができるか や、分析􏰀実装まで􏰀ロードマップを簡 単に把握できるようにしてほしい。ツール やサービスを連携させて興味深い結果 が得られる􏰀なら􏰃、より高度なデータ パイプラインを反復的に構築できる。 データ アナリストやデータ サイエンティス ト􏰀役割を担当することが可能になり、 新しいスキルを習得しながら自社に貢献 することもできる」

  • 一般的な各種プラグアンドプレイ方式で􏰀分析 や可視化
  • クラウド プロジェクト􏰀統合 – ノートブックや認証 􏰀使用を簡単に開始できる
  • Google Cloud Storage、BigQuery、DataStore、Cloud SQL 􏰀コネクタでデータを ノートブックに移動
  • エンドツーエンド􏰀ツールやサービスにより、ロ グやそ􏰀他􏰀半構􏰄化データから構􏰄化デー タ􏰀分析や可視化までが可能

Datalab を活用する 3 つ􏰀方法

ローカルで Docker を実行自身􏰀 CPU を使用 ディスクにノートブックを保存

 

Compute Engine で Docker を実行GCP で処理を実行
GCE ディスクにノートブックを保存

Docker + ゲートウェイ
GCP で処理を実行
ローカル ディスクにノートブッ クを保存

Datalab 􏰀料金

Datalab を使用しても、Datalab を実行した際に使用したGoogle Cloud Platform リソース分 以外􏰀料金􏰁まったく発生しません。
無償でご利用いただけます。

 

弊社はGoogle Cloud Platform (GCP)のパートナーとして、製品導入やクラウドに移行、アーキテクチャ設計、システム開発などのサービスを提供しております。