Kubeflow Pipelines (kfp)

Kubeflow Pipelines (kfp) は、 Docker コンテナベースでポータブルかつスケーラブルな機械学習 (ML) ワークフローを構築・デプロイするためのプラットフォームです。このインテグレーションを使用すると、 kfp の Python 関数コンポーネントにデコレータを適用するだけで、パラメータやアーティファクトを W&B に自動的にログ記録できます。この機能は wandb==0.12.11 から有効になっており、 kfp<2.0.0 が必要です。

サインアップと APIキーの作成

APIキーは、お使いのマシンを W&B に対して認証するために使用されます。 APIキーはユーザープロフィールから生成できます。

For a more streamlined approach, create an API key by going directly to User Settings. Copy the newly created API key immediately and save it in a secure location such as a password manager.

右上隅にあるユーザープロフィールアイコンをクリックします。
User Settings を選択し、 API Keys セクションまでスクロールします。

`wandb` ライブラリのインストールとログイン

ローカル環境に wandb ライブラリをインストールしてログインするには：

Command Line
Python
Python notebook

WANDB_API_KEY 環境変数に APIキーを設定します。
```
export WANDB_API_KEY=<your_api_key>
```
wandb ライブラリをインストールしてログインします。
```
pip install wandb

wandb login
```

pip install wandb

import wandb
wandb.login()

!pip install wandb

import wandb
wandb.login()

コンポーネントへのデコレータ追加

@wandb_log デコレータを追加し、通常通りコンポーネントを作成します。これにより、パイプラインを実行するたびに、入力/出力パラメータとアーティファクトが W&B に自動的にログ記録されます。

from kfp import components
from wandb.integration.kfp import wandb_log


@wandb_log
def add(a: float, b: float) -> float:
    return a + b


add = components.create_component_from_func(add)

コンテナへの環境変数の受け渡し

コンテナに対して明示的に環境変数を渡す必要がある場合があります。双方向のリンクを有効にするには、 WANDB_KUBEFLOW_URL 環境変数に Kubeflow Pipelines インスタンスのベース URL（例: https://kubeflow.mysite.com）を設定してください。

import os
from kubernetes.client.models import V1EnvVar


def add_wandb_env_variables(op):
    env = {
        "WANDB_API_KEY": os.getenv("WANDB_API_KEY"),
        "WANDB_BASE_URL": os.getenv("WANDB_BASE_URL"),
    }

    for name, value in env.items():
        op = op.add_env_variable(V1EnvVar(name, value))
    return op


@dsl.pipeline(name="example-pipeline")
def example_pipeline(param1: str, param2: int):
    conf = dsl.get_pipeline_conf()
    conf.add_op_transformer(add_wandb_env_variables)

プログラムによるデータへのアクセス

Kubeflow Pipelines UI 経由

W&B でログ記録された Kubeflow Pipelines UI 上の任意の Run をクリックします。

入出力の詳細は、 Input/Output タブおよび ML Metadata タブで確認できます。
Visualizations タブから W&B ウェブアプリを表示できます。

ウェブアプリ UI 経由

ウェブアプリ UI には、 Kubeflow Pipelines の Visualizations タブと同じ内容が表示されますが、より広い画面で操作できます。ウェブアプリ UI についての詳細はこちらをご覧ください。

Public API 経由（プログラムによるアクセス）

プログラムによるアクセスについては、 Public API ドキュメントを参照してください。

Kubeflow Pipelines から W&B へのコンセプトマッピング

Kubeflow Pipelines のコンセプトと W&B の対応表は以下の通りです。

Kubeflow Pipelines	W&B	W&B内での場所
Input Scalar	`config`	Overviewタブ
Output Scalar	`summary`	Overviewタブ
Input Artifact	Input Artifact	Artifactsタブ
Output Artifact	Output Artifact	Artifactsタブ

きめ細かなログ記録

ログ記録をより詳細に制御したい場合は、コンポーネント内で wandb.log や wandb.log_artifact を呼び出すことができます。

明示的な `wandb.log_artifacts` の呼び出し

以下の例では、モデルをトレーニングしています。 @wandb_log デコレータは関連する入出力を自動的に追跡します。トレーニングプロセスをログ記録したい場合は、次のように明示的にログを追加できます：

@wandb_log
def train_model(
    train_dataloader_path: components.InputPath("dataloader"),
    test_dataloader_path: components.InputPath("dataloader"),
    model_path: components.OutputPath("pytorch_model"),
):
    with wandb.init() as run:
        ...
        for epoch in epochs:
            for batch_idx, (data, target) in enumerate(train_dataloader):
                ...
                if batch_idx % log_interval == 0:
                    run.log(
                        {"epoch": epoch, "step": batch_idx * len(data), "loss": loss.item()}
                    )
            ...
            run.log_artifact(model_artifact)

暗黙的な wandb インテグレーションの使用

サポートされているフレームワークインテグレーションを使用している場合は、コールバックを直接渡すことも可能です。

@wandb_log
def train_model(
    train_dataloader_path: components.InputPath("dataloader"),
    test_dataloader_path: components.InputPath("dataloader"),
    model_path: components.OutputPath("pytorch_model"),
):
    from pytorch_lightning.loggers import WandbLogger
    from pytorch_lightning import Trainer

    trainer = Trainer(logger=WandbLogger())
    ...  # トレーニングを実行

Guides

Integrations

Tutorials

Reference

サインアップと APIキーの作成

`wandb` ライブラリのインストールとログイン

コンポーネントへのデコレータ追加

コンテナへの環境変数の受け渡し

プログラムによるデータへのアクセス

Kubeflow Pipelines UI 経由

ウェブアプリ UI 経由

Public API 経由（プログラムによるアクセス）

Kubeflow Pipelines から W&B へのコンセプトマッピング

きめ細かなログ記録

明示的な `wandb.log_artifacts` の呼び出し

暗黙的な wandb インテグレーションの使用

Guides

Integrations

Tutorials

Reference

​サインアップと APIキー の作成

​wandb ライブラリのインストールとログイン

​コンポーネントへのデコレータ追加

​コンテナへの環境変数の受け渡し

​プログラムによるデータへのアクセス

​Kubeflow Pipelines UI 経由

​ウェブアプリ UI 経由

​Public API 経由（プログラムによるアクセス）

​Kubeflow Pipelines から W&B へのコンセプトマッピング

​きめ細かなログ記録

​明示的な wandb.log_artifacts の呼び出し

​暗黙的な wandb インテグレーションの使用

サインアップと APIキーの作成

`wandb` ライブラリのインストールとログイン

コンポーネントへのデコレータ追加

コンテナへの環境変数の受け渡し

プログラムによるデータへのアクセス

Kubeflow Pipelines UI 経由

ウェブアプリ UI 経由

Public API 経由（プログラムによるアクセス）

Kubeflow Pipelines から W&B へのコンセプトマッピング

きめ細かなログ記録

明示的な `wandb.log_artifacts` の呼び出し

暗黙的な wandb インテグレーションの使用