メインコンテンツへスキップ
spaCy は、高速で正確なモデルを最小限の手間で利用できる、人気の「実用レベル(industrial-strength)」の NLP ライブラリです。 spaCy v3 以降、 spacy train を使用して W&B で spaCy モデルのトレーニングメトリクスを追跡したり、モデルやデータセットの保存とバージョン管理を行ったりできるようになりました。 設定ファイルに数行追加するだけで準備は完了です。

サインアップと APIキー の作成

APIキー は、お使いのマシンを W&B に認証するために使用されます。 ユーザープロフィールから APIキー を生成できます。
For a more streamlined approach, create an API key by going directly to User Settings. Copy the newly created API key immediately and save it in a secure location such as a password manager.
  1. 右上隅にあるユーザープロフィールアイコンをクリックします。
  2. User Settings を選択し、 API Keys セクションまでスクロールします。

wandb ライブラリのインストールとログイン

ローカル環境に wandb ライブラリをインストールしてログインするには:
  1. WANDB_API_KEY 環境変数 に APIキー を設定します。
    export WANDB_API_KEY=<your_api_key>
    
  2. wandb ライブラリをインストールしてログインします。
    pip install wandb
    
    wandb login
    

spaCy 設定ファイルへの WandbLogger の追加

spaCy の設定ファイルは、ロギングだけでなく、 GPU 割り当て、 オプティマイザー の選択、 データセット のパスなど、トレーニングのあらゆる側面を指定するために使用されます。 最小限の設定として、 [training.logger] の下に、キー @loggers と値 "spacy.WandbLogger.v3" 、および project_name を指定する必要があります。
spaCy のトレーニング設定ファイルの仕組みや、トレーニングをカスタマイズするために渡せるその他のオプションの詳細については、 spaCy のドキュメント を参照してください。
[training.logger]
@loggers = "spacy.WandbLogger.v3"
project_name = "my_spacy_project"
remove_config_values = ["paths.train", "paths.dev", "corpora.train.path", "corpora.dev.path"]
log_dataset_dir = "./corpus"
model_log_interval = 1000
名前説明
project_namestr 。 W&B の Projects の名前。プロジェクトが存在しない場合は自動的に作成されます。
remove_config_valuesList[str] 。 W&B にアップロードされる前に設定から除外する値のリスト。デフォルトは [] です。
model_log_intervalOptional int 。 デフォルトは None 。設定すると、 Artifacts による モデルのバージョン管理 が有効になります。モデルの チェックポイント をログに記録する間隔(ステップ数)を渡します。
log_dataset_dirOptional str 。 パスが渡されると、トレーニング開始時に データセット が アーティファクト としてアップロードされます。デフォルトは None です。
entityOptional str 。 指定した場合、指定された Entities 内に Run が作成されます。
run_nameOptional str 。 指定した場合、指定された名前で Run が作成されます。

トレーニングの開始

spaCy のトレーニング設定に WandbLogger を追加したら、通常通り spacy train を実行できます。
python -m spacy train \
    config.cfg \
    --output ./output \
    --paths.train ./train \
    --paths.dev ./dev
トレーニングが開始されると、トレーニング Run の W&B ページ へのリンクが出力されます。このリンクから、 W&B ウェブ UI 上の該当する Run の 実験管理 ダッシュボード にアクセスできます。