これはインタラクティブなノートブックです。ローカルで実行するか、以下のリンクを使用してください。
preprocess_model_input を使用した Evaluations での HuggingFace Datasets の利用
注意:これは一時的なワークアラウンドです
このガイドでは、Weave の Evaluations で HuggingFace Datasets を使用するためのワークアラウンドを紹介します。
現在、このプロセスを簡素化するための、よりシームレスな インテグレーション を積極的に開発中です。
このアプローチは現在有効ですが、近い将来、外部の Datasets との連携をより簡単にする改善やアップデートが予定されています。
セットアップとインポート
まず、Weave を初期化し、実験を追跡するために Weights & Biases に接続します。HuggingFace dataset の読み込みと準備
- HuggingFace dataset を読み込みます。
- データセットの行を参照するためのインデックスマッピングを作成します。
- このインデックスによるアプローチにより、元のデータセットへの参照を維持することができます。
注意:
インデックスには、各行が一意の識別子を持つように、hf_idと共にhf_hub_nameを含めています。
このユニークなダイジェスト値は、Evaluations 中に特定のデータセットエントリを追跡し参照するために使用されます。
プロセッシングと評価関数の定義
プロセッシングパイプライン
preprocess_example: インデックス参照を、評価に必要な実際のデータに変換します。hf_eval: モデルの出力をどのようにスコアリングするかを定義します。function_to_evaluate: 実際に評価される関数または モデル です。
Evaluation の作成と実行
hf_index内の各インデックスに対して:preprocess_exampleが HF データセットから対応するデータを取得します。- プリプロセッシングされたデータが
function_to_evaluateに渡されます。 - 出力が
hf_evalを使ってスコアリングされます。 - 結果は Weave で追跡されます。