weave.scorers.default_models で確認できます。
これらの scorer が返すオブジェクトには、入力テキストが安全か、または高品質かを示す passed ブール属性と、モデルからの生のスコアなどの詳細情報を含む metadata 属性が含まれています。
local scorers は CPU でも実行できますが、最高のパフォーマンスを得るためには GPU の使用を推奨します。
local scorers は Weave Python SDK でのみ利用可能です。Weave TypeScript SDK ではまだ利用できません。TypeScript で Weave scorer を使用するには、function-based scorers を参照してください。
前提条件
Weave local scorers を使用する前に、追加の依存関係をインストールしてください:Scorer の選択
以下の local scorers が利用可能です。ユースケースに合わせて scorer を選択してください。| Scorer | シナリオ |
|---|---|
| WeaveToxicityScorerV1 | ヘイトスピーチや脅迫など、AI システムの入力および出力に含まれる有害または毒性のあるコンテンツを特定します。 |
| WeaveBiasScorerV1 | AI システムの入力および出力に含まれるバイアスやステレオタイプなコンテンツを検出します。生成されたテキストにおける有害なバイアスの低減に理想的です。 |
| WeaveHallucinationScorerV1 | 提供された入力とコンテキストに基づいて、RAG システムが出力にハルシネーションを生成しているかどうかを特定します。 |
| WeaveContextRelevanceScorerV1 | AI システムの出力が、提供された入力とコンテキストに関連しているかどうかを測定します。 |
| WeaveCoherenceScorerV1 | AI システムの出力の一貫性と論理的構造を評価します。 |
| WeaveFluencyScorerV1 | AI システムの出力が流暢であるかどうかを測定します。 |
| WeaveTrustScorerV1 | toxicity、hallucination、context relevance、fluency、coherence の各 scorer を活用する統合型 scorer です。 |
| PresidioScorer | Microsoft の Presidio ライブラリを使用して、AI システムの入力および出力に含まれる個人識別情報 (PII) を検出します。 |
WeaveBiasScorerV1
この scorer は、性別および人種/出身に関するバイアスを 2 つの側面から評価します。
- 人種と出身:人種差別、特定の国や地域に対するバイアス、移民ステータス、民族性など。
- 性別とセクシュアリティ:性差別、ミソジニー、ホモフォビア、トランスフォビア、セクシャルハラスメントなど。
WeaveBiasScorerV1 は、ファインチューン された deberta-small-long-nli モデルを使用しています。モデル、データセット、およびキャリブレーションプロセスの詳細については、WeaveBiasScorerV1 W&B Report を参照してください。
使用上の注意
scoreメソッドは、outputパラメータに文字列が渡されることを想定しています。- スコアが高いほど、テキスト内にバイアスが含まれているという予測が強いことを意味します。
thresholdパラメータは設定済みですが、初期化時に上書きすることも可能です。
使用例
WeaveToxicityScorerV1
この scorer は、入力テキストの毒性を 5 つの側面から評価します。
- 人種と出身:人種差別、特定の国や地域に対するバイアス、移民ステータス、民族性など。
- 性別とセクシュアリティ:性差別、ミソジニー、ホモフォビア、トランスフォビア、セクシャルハラスメントなど。
- 宗教:誰かの宗教に対するバイアスやステレオタイプ。
- 能力:誰かの身体的、精神的、知的な能力や障害に関連するバイアス。
- 暴力と虐待:過度に生々しい暴力の描写、暴力の脅威、または暴力の扇動。
WeaveToxicityScorerV1 は、PleIAs によるオープンソースの Celadon モデルを使用しています。詳細については、WeaveToxicityScorerV1 W&B Report を参照してください。
使用上の注意
scoreメソッドは、outputパラメータに文字列が渡されることを想定しています。- モデルは、5 つの異なるカテゴリにわたって
0から3までのスコアを返します:- これらのスコアの合計が
total_threshold(デフォルト値5) を超える場合、入力は毒性があるとフラグが立てられます。 - いずれか 1 つのカテゴリのスコアが
category_threshold(デフォルト2) より高い場合、入力は毒性があるとフラグが立てられます。
- これらのスコアの合計が
- フィルタリングをより厳しくするには、初期化時に
category_thresholdまたはtotal_thresholdを上書きしてください。
使用例
WeaveHallucinationScorerV1
この scorer は、AI システムの出力に入力データに基づかないハルシネーション(幻覚)が含まれているかどうかを確認します。
WeaveHallucinationScorerV1 は、Vectara によるオープンソースの HHEM 2.1 モデル を使用しています。詳細については、WeaveHallucinationScorerV1 W&B Report を参照してください。
使用上の注意
scoreメソッドは、queryおよびoutputパラメータに値が渡されることを想定しています。- コンテキストは
outputパラメータに渡す必要があります(文字列または文字列のリスト)。 - 出力スコアが高いほど、出力にハルシネーションが含まれているという予測が強いことを意味します。
thresholdパラメータは設定済みですが、初期化時に上書き可能です。
使用例
WeaveContextRelevanceScorerV1
この scorer は、RAG システムを評価する際に使用するように設計されています。クエリに対するコンテキストの関連性をスコアリングします。
WeaveContextRelevanceScorerV1 は、tasksource による ファインチューン 済みの deberta-small-long-nli モデルを使用しています。詳細は WeaveContextRelevanceScorerV1 W&B Report を参照してください。
使用上の注意
scoreメソッドは、queryとoutputの値を想定しています。- コンテキストは
outputパラメータに渡す必要があります(文字列または文字列のリスト)。 - スコアが高いほど、コンテキストがクエリに関連しているという予測が強いことを意味します。
scoreメソッドにverbose=Trueを渡すと、チャンクごとのスコアを取得できます。
使用例
WeaveCoherenceScorerV1
この scorer は、入力テキストが一貫しているかどうかを確認します。
WeaveCoherenceScorerV1 は、tasksource による ファインチューン 済みの deberta-small-long-nli モデルを使用しています。詳細については WeaveCoherenceScorerV1 W&B Report を参照してください。
使用上の注意
scoreメソッドは、queryおよびoutputパラメータにテキストが渡されることを想定しています。- 出力スコアが高いほど、一貫性があるという予測が強いことを意味します。
使用例
WeaveFluencyScorerV1
この scorer は、入力テキストが流暢であるか、つまり自然な人間の言語のように読みやすく理解しやすいかを確認します。文法、構文、および全体的な読みやすさを評価します。
WeaveFluencyScorerV1 は、AnswerDotAI による ファインチューン 済みの ModernBERT-base モデルを使用しています。詳細については WeaveFluencyScorerV1 W&B Report を参照してください。
使用上の注意
scoreメソッドは、outputパラメータにテキストが渡されることを想定しています。- 出力スコアが高いほど、流暢さが高いことを示します。
使用例
WeaveTrustScorerV1
WeaveTrustScorerV1 は、他の scorer を「Critical (重要)」と「Advisory (推奨)」の 2 つのカテゴリにグループ化することで、モデル出力の信頼性を評価する RAG システム向けの複合型 scorer です。複合スコアに基づいて、信頼レベルを返します:
high: 問題は検出されませんでしたmedium: Advisory の問題のみ検出されましたlow: Critical の問題が検出されたか、入力が空です
low の信頼レベルになります。Advisory な scorer で失敗した場合は medium になります。
-
Critical:
WeaveToxicityScorerV1WeaveHallucinationScorerV1WeaveContextRelevanceScorerV1
-
Advisory:
WeaveFluencyScorerV1WeaveCoherenceScorerV1
使用上の注意
- この scorer は、RAG パイプラインの評価用に設計されています。
- 正しくスコアリングするために、
query、context、outputキーが必要です。
使用例
PresidioScorer
この scorer は Presidio ライブラリ を使用して、AI システムの入力および出力に含まれる個人識別情報 (PII) を検出します。
使用上の注意
- メールアドレスや電話番号など特定のエンティティタイプを指定するには、Presidio エンティティのリストを
selected_entitiesパラメータに渡します。指定しない場合、Presidio はデフォルトのエンティティリストにあるすべてのエンティティタイプを検出します。 - メールや電話番号などの特定のエンティティタイプを検出するには、
selected_entitiesパラメータにリストを渡してください。 custom_recognizersパラメータを介して、presidio.EntityRecognizerインスタンスのリストとしてカスタム認識器を渡すことができます。- 英語以外の入力を処理するには、
languageパラメータを使用して言語を指定します。