spacy train を使用して W&B で spaCy モデルのトレーニングメトリクスを追跡したり、モデルやデータセットの保存とバージョン管理を行ったりできるようになりました。 設定ファイルに数行追加するだけで準備は完了です。
サインアップと APIキー の作成
APIキー は、お使いのマシンを W&B に認証するために使用されます。 ユーザープロフィールから APIキー を生成できます。For a more streamlined approach, create an API key by going directly to User Settings. Copy the newly created API key immediately and save it in a secure location such as a password manager.
- 右上隅にあるユーザープロフィールアイコンをクリックします。
- User Settings を選択し、 API Keys セクションまでスクロールします。
wandb ライブラリのインストールとログイン
ローカル環境に wandb ライブラリをインストールしてログインするには:
- コマンドライン
- Python
- Python notebook
-
WANDB_API_KEY環境変数 に APIキー を設定します。 -
wandbライブラリをインストールしてログインします。
spaCy 設定ファイルへの WandbLogger の追加
spaCy の設定ファイルは、ロギングだけでなく、 GPU 割り当て、 オプティマイザー の選択、 データセット のパスなど、トレーニングのあらゆる側面を指定するために使用されます。 最小限の設定として、 [training.logger] の下に、キー @loggers と値 "spacy.WandbLogger.v3" 、および project_name を指定する必要があります。
spaCy のトレーニング設定ファイルの仕組みや、トレーニングをカスタマイズするために渡せるその他のオプションの詳細については、 spaCy のドキュメント を参照してください。
| 名前 | 説明 |
|---|---|
project_name | str 。 W&B の Projects の名前。プロジェクトが存在しない場合は自動的に作成されます。 |
remove_config_values | List[str] 。 W&B にアップロードされる前に設定から除外する値のリスト。デフォルトは [] です。 |
model_log_interval | Optional int 。 デフォルトは None 。設定すると、 Artifacts による モデルのバージョン管理 が有効になります。モデルの チェックポイント をログに記録する間隔(ステップ数)を渡します。 |
log_dataset_dir | Optional str 。 パスが渡されると、トレーニング開始時に データセット が アーティファクト としてアップロードされます。デフォルトは None です。 |
entity | Optional str 。 指定した場合、指定された Entities 内に Run が作成されます。 |
run_name | Optional str 。 指定した場合、指定された名前で Run が作成されます。 |
トレーニングの開始
spaCy のトレーニング設定にWandbLogger を追加したら、通常通り spacy train を実行できます。
- コマンドライン
- Python
- Python notebook