Docker

Docker インテグレーション

W&B は、コードが実行された Docker イメージへのポインタを保存できます。これにより、以前の実験を実行時と全く同じ環境で復元することが可能になります。 wandbライブラリは、この状態を永続化するために WANDB_DOCKER 環境変数を確認します。この状態を自動的に設定するためのヘルパーをいくつか提供しています。

ローカル開発

wandb docker は、 dockerコンテナを起動し、 wandb 環境変数を渡し、コードをマウントし、 wandb がインストールされていることを確認するコマンドです。デフォルトでは、このコマンドは TensorFlow、PyTorch、Keras、Jupyter がインストールされた Docker イメージを使用します。独自の Docker イメージを開始するために同じコマンドを使用することもできます： wandb docker my/image:latest 。このコマンドは現在のディレクトリーをコンテナの “/app” ディレクトリーにマウントします。これは “—dir” フラグで変更可能です。

プロダクション

プロダクションのワークロード向けに wandb docker-run コマンドが提供されています。これは nvidia-docker のドロップインリプレイスメントとして機能することを意図しています。これは docker run コマンドのシンプルなラッパーであり、資格情報と WANDB_DOCKER 環境変数を呼び出しに追加します。 “—runtime” フラグを渡さず、かつマシン上で nvidia-docker が利用可能な場合、ランタイムが nvidia に設定されることも保証します。

Kubernetes

トレーニングワークロードを Kubernetes で実行しており、k8s API がポッドに公開されている場合（デフォルト設定）、 wandb は API に Docker イメージのダイジェストを問い合わせ、 WANDB_DOCKER 環境変数を自動的に設定します。

復元（Restoring）

Run が WANDB_DOCKER 環境変数とともに計測されていた場合、 wandb restore username/project:run_id を呼び出すと、コードを復元する新しいブランチをチェックアウトし、トレーニングで使用されたのと全く同じ Docker イメージを、元のコマンドが入力された状態でローンンチします。

Guides

Integrations

Tutorials

Reference

Docker インテグレーション

ローカル開発

プロダクション

Kubernetes

復元（Restoring）

Guides

Integrations

Tutorials

Reference

​Docker インテグレーション

​ローカル開発

​プロダクション

​Kubernetes

​復元（Restoring）

Docker インテグレーション

ローカル開発

プロダクション

Kubernetes

復元（Restoring）