えんじにあのじゆうちょう

勉強したことを中心にアウトプットしていきます。

Kubeflowで機械学習パイプラインを試してみる(MiniKFインストール編)

はじめに

2月は会社のブログ活動&E資格受験があって、しばらく間が空いてしまいました(言い訳)
さて、今回からは機械学習パイプラインの構築に向けての検証として、Kubeflowを試してみようと思います。

ちょっと前にmlflowのtrackingだけ試しました(以下記事参照)
t.marufeuille.dev

そのときに概ねmlflowのできることは確認したのですが、今回期待するのはApache Airflow的なワークフローエンジンのところが個人的には主な目的だったりはします。

が、順を追ってまずはローカルのMacBookにkubeflowをMiniKFを利用してインストールするところから見ていこうと思います。

MiniKFの導入

仮想マシンの用意

公式ドキュメント(以下)によると、MiniKFはVagrantのbox化されているので、かんたんに導入ができるようです。
www.kubeflow.org

私のPCでは既にVirtualboxもVagrantもインストール済みだったので、以下コマンドを打てばboxが起動します。

vagrant init arrikto/minikf
vagrant up

唯一、私が引っかかったのはまさかのディスク容量で確かに50GBと書いてありますが、まさか自分のローカルがそんなに空き容量がないと思わなくて途中で大量の警告に見舞われ、とにかく重たいアプリやファイルを削除しまくるというイベントが発生しました笑

MiniKFのsetup

ドキュメントはここで終わっていますが、ここからブラウザでアクセスしてちょっと設定があります。

アクセス先IPはupが終わった画面で表示されます。

f:id:marufeuillex:20200307155309p:plain

通常10.10.10.10のようですね。

f:id:marufeuillex:20200307155438p:plain

アクセスしてみると、なんかコマンドラインベースっぽい雰囲気を漂わせたsetup画面になります。
普通にOKだったりを押して進めていけば大丈夫です。

f:id:marufeuillex:20200307155731p:plain

少し時間がかかりますが、完了するとこんな画面になります。
まぁ、パスワードが見えたところで外からアクセスするすべもないのですが、一応隠してみました。

Kubeflowへのアクセス

再掲みたいな感じになりますが、先程の画面でしたの方にある「Connect to Kubeflow」を押せばkubeflowへ、「Connect to Rok」を押せばRokの管理画面に移動できます。
f:id:marufeuillex:20200307160215p:plain

どちらの場合もuser名 / パスワードはこの画面に表示されているものです。

f:id:marufeuillex:20200307160405p:plain

おお、kubeflowへアクセスできました!!

終わりに

今回は少し物足りないですが、とりあえずMiniKFを動かすところまで書いておきました。
次回以降はkubeflowのいろいろなところを試していった結果を書こうと思います。