メインコンテンツへスキップ
Prodigy は、機械学習 モデル のトレーニングおよび評価用の データ 作成、エラー 分析 、データの検査とクリーニングのためのアノテーション ツール です。W&B Tables を使用すると、W&B 内で Datasets の ログ 記録、可視化 、分析 、共有などを行うことができます。 W&B と Prodigy のインテグレーション を使用すると、Prodigy でアノテーションした データセット を W&B に直接アップロードして Tables で利用するための、シンプルで使いやすい機能が追加されます。 次のような数行の コード を実行するだけで:
import wandb
from wandb.integration.prodigy import upload_dataset

# "prodigy" という名前のプロジェクトで run を初期化
with wandb.init(project="prodigy"):
    # Prodigy のデータセット "news_headlines_ner" をアップロード
    upload_dataset("news_headlines_ner")
次のような、視覚的でインタラクティブな共有可能な テーブル を作成できます:
Prodigy annotation table

クイックスタート

wandb.integration.prodigy.upload_dataset を使用して、アノテーション済みの Prodigy データセットをローカルの Prodigy データベースから W&B の Table 形式で直接アップロードします。インストールやセットアップを含む Prodigy の詳細については、Prodigy documentation を参照してください。 W&B は、画像や名前付きエンティティ(NER)フィールドを、それぞれ wandb.Imagewandb.Html に自動的に変換しようと試みます。これらの 可視化 を含めるために、生成される テーブル に追加の列が加わることがあります。

詳細な例を確認する

W&B と Prodigy の インテグレーション によって生成された 可視化 の例については、Visualizing Prodigy Datasets Using W&B Tables をご覧ください。

spaCy もお使いですか?

W&B は spaCy との インテグレーション も提供しています。 ドキュメントはこちら をご覧ください。