Local Models

多くの開発者が Llama-3、Mixtral、Gemma、Phi などのオープンソースモデルをローカルでダウンロードして実行しています。これらのモデルをローカルで実行する方法は数多くありますが、Weave は OpenAI SDK 互換をサポートしているものであれば、そのうちのいくつかを標準でサポートしています。

ローカルモデルの関数を `@weave.op()` でラップする

weave.init('<your-project-name>') で Weave を初期化し、LLM への呼び出しを weave.op() でラップするだけで、任意の LLM を簡単に Weave と統合できます。詳細については、トレーシングのガイドを参照してください。

OpenAI SDK コードをローカルモデル用に更新する

OpenAI SDK 互換をサポートするすべてのフレームワークやサービスにおいて、いくつかの軽微な変更が必要になります。最も重要かつ最初に行うべきことは、openai.OpenAI() の初期化時における base_url の変更です。

client = openai.OpenAI(
    # ベースURLをローカルサーバーのアドレスに変更します
    base_url="http://localhost:1234",
)

ローカルモデルの場合、api_key は任意の文字列を指定できますが、必ず上書きする必要があります。そうしないと、OpenAI SDK は環境変数からキーを取得しようとしてエラーを表示することがあります。

OpenAI SDK をサポートするローカルモデルランナー

以下は、Hugging Face からモデルをダウンロードしてコンピュータ上で実行でき、OpenAI SDK 互換をサポートしているアプリのリストです。

Nomic GPT4All - 設定内の Local Server 経由でサポート (FAQ)
LMStudio - Local Server による OpenAI SDK サポートドキュメント
Ollama - OpenAI SDK の実験的サポート
llama.cpp - llama-cpp-python Python パッケージ経由
llamafile - Llamafile 実行時に http://localhost:8080/v1 で自動的に OpenAI SDK をサポート

Get Started

Guides

Cookbooks

Reference

Open Source

Community

Local models

Local Models

ローカルモデルの関数を `@weave.op()` でラップする

OpenAI SDK コードをローカルモデル用に更新する

OpenAI SDK をサポートするローカルモデルランナー

Get Started

Guides

Cookbooks

Reference

Open Source

Community

​Local Models

​ローカルモデルの関数を @weave.op() でラップする

​OpenAI SDK コードをローカルモデル用に更新する

​OpenAI SDK をサポートするローカルモデルランナー

Local Models

ローカルモデルの関数を `@weave.op()` でラップする

OpenAI SDK コードをローカルモデル用に更新する

OpenAI SDK をサポートするローカルモデルランナー