はじめに
すでに TensorBoard を使用している場合、wandb との連携は非常に簡単です。カスタムメトリクスのログ記録
TensorBoard にログ出力されていない追加のカスタムメトリクスを記録する必要がある場合は、コード内でrun.log() を呼び出すことができます:run.log({"custom": 0.8})
TensorBoard を同期している場合、run.log() の step 引数の設定は無効になります。別のステップ数を設定したい場合は、以下のようにステップメトリクスとともにメトリクスをログに記録できます:
TensorFlow Estimators hook
ログの内容をより詳細に制御したい場合、wandb は TensorFlow Estimators 用の hook も提供しています。これにより、グラフ内のすべてのtf.summary の値をログに記録します。
手動でのログ記録
TensorFlow でメトリクスを記録する最もシンプルな方法は、TensorFlow ロガーを使用してtf.summary をログ出力することです:
tf.GradientTape を使用することです。詳細は TensorFlow カスタムトレーニングのウォークスルー を参照してください。カスタム TensorFlow トレーニングループに wandb を組み込んでメトリクスをログに記録するには、以下のスニペットを参考にしてください:
W&B は TensorBoard とどう違うのですか?
W&B の共同創業者たちが開発を始めたとき、彼らは OpenAI で TensorBoard に不満を感じていた ユーザー のための ツール を構築したいと考えていました。私たちが改善に注力した点は以下の通りです。- モデルの再現: W&B は 実験管理 、探索、そして後のモデル再現に優れています。メトリクスだけでなく、ハイパーパラメーター や コード の バージョン も取得し、プロジェクトが再現可能になるよう バージョン 管理ステータスや モデル の チェックポイント を保存できます。
- 自動整理: コラボレーターから プロジェクト を引き継ぐとき、休暇から戻ったとき、あるいは古い プロジェクト を再開するときでも、W&B を使えば試行されたすべての モデル を簡単に確認できるため、誰も 実験 の再実行に時間や GPU サイクル、電力を浪費することはありません。
- 高速で柔軟なインテグレーション: W&B は 5 分で プロジェクト に追加できます。無料のオープンソース Python パッケージをインストールし、コードに数行追加するだけで、モデル を実行するたびに適切にログに記録されたメトリクスと記録が得られます。
- 永続的で中央集約されたダッシュボード: ローカルマシン、共有ラボの クラスター 、クラウド のスポットインスタンスなど、どこで モデル をトレーニングしても、結果は同じ中央集約された ダッシュボード に共有されます。異なるマシンから TensorBoard ファイルをコピーして整理する手間は不要です。
- 強力な Tables: 異なる モデル の 結果 を検索、フィルタリング、ソート、グループ化できます。数千の モデル バージョン を見渡し、異なるタスクに対して最高のパフォーマンスを発揮する モデル を見つけるのが簡単です。TensorBoard は大規模な プロジェクト でうまく動作するように構築されていません。
- コラボレーションのためのツール: 複雑な 機械学習 プロジェクト の整理に W&B を活用してください。W&B へのリンクを共有するのは簡単で、プライベートな Teams を使用して全員が共有 プロジェクト に 結果 を送信できます。また、Reports を通じたコラボレーションもサポートしており、インタラクティブな 可視化 を追加し、Markdown で作業内容を説明できます。これは、作業ログの保持、指導者への 学び の共有、ラボやチームへの 結果 発表に最適な方法です。
サンプル
インテグレーション の仕組みを確認できるサンプルをいくつか用意しました。- Github の例: TensorFlow Estimators を使用した MNIST の例
- Github の例: 生の TensorFlow を使用した Fashion MNIST の例
- Wandb ダッシュボード: W&B 上で 結果 を表示
- TensorFlow 2 でのトレーニングループのカスタマイズ - 記事 | ダッシュボード