- 評価メトリクスの経時的な追跡
- プログラムシグネチャの進化を記録する W&B Tables
- MIPROv2 などの DSPy オプティマイザーとの連携
Note
wandb==0.21.2 および weave==0.52.5 以降、W&B と併用すると Weave は自動的に初期化されます。weaveをインポートした後にwandb.init()を呼び出した場合(スクリプトの場合)wandb.init()を呼び出した後にweaveをインポートした場合(ノートブック / Jupyter の場合)
weave.init(...) の呼び出しは不要です。インストールと認証
必要なライブラリをインストールし、W&B で認証を行います。- Command Line
- Python
- Notebook
-
必要なライブラリをインストールします:
-
WANDB_API_KEY環境変数を設定してログインします:
プログラム最適化の追跡 (experimental)
dspy.Evaluate を使用する DSPy オプティマイザー(MIPROv2 など)では、WandbDSPyCallback を使用して評価メトリクスを時系列でログに記録し、プログラムシグネチャの進化を W&B Tables で追跡できます。
WandbDSPyCallback に run オブジェクトが渡されない場合は、グローバルな run オブジェクトが使用されます。

W&B Tables への予測のログ
詳細な予測ログを有効にすると、最適化中の個々の例を詳細に確認できます。コールバックは各評価ステップに対して W&B Tables を作成し、特定の成功例や失敗例の分析を容易にします。予測データへのアクセス
最適化後、W&B で予測データを確認できます:- Run の Overview ページに移動します。
predictions_0、predictions_1のようなパターンで命名された Table パネルを探します。is_correctでフィルタリングして、失敗例を分析します。- プロジェクトの Workspace で、Run 間のテーブルを比較します。
example: 入力データprediction: モデルの出力is_correct: 評価結果