監控費用、用量和其他指標

監控 AI 功能的費用、用量和其他指標,是執行正式版應用程式的重要環節。您需要瞭解應用程式的正常用量模式,並確保用量維持在您重視的門檻內。

本頁面說明在 FirebaseGoogle Cloud 控制台中,監控費用、用量和其他指標的建議選項。

監控費用

Firebase 控制台的用量和帳單資訊主頁中,您可以查看專案呼叫 Vertex AI Gemini APIGemini Developer API 的費用 (前提是您採用 Blaze 定價方案)。

資訊主頁上顯示的費用「不一定」是使用 Firebase AI Logic 用戶端 SDK 呼叫時產生的費用。顯示的費用與「Gemini API」的任何呼叫相關聯,無論是使用 Firebase AI Logic 用戶端 SDK、Google GenAI 伺服器 SDK、GenkitFirebase Extensions (適用於 Gemini API)、REST 呼叫、AI Studio 之一,或其他 API 用戶端。

進一步瞭解與使用 Firebase AI Logic 相關聯產品的定價

設定快訊功能

為避免產生意外費用,請務必在採用 Blaze 定價方案時設定預算快訊

請注意,預算快訊並非預算上限。當您即將達到或超過設定的門檻時,系統會傳送快訊通知,方便您在應用程式或專案中採取行動。

Firebase 控制台中查看 AI 功能的使用情況

只有在 Vertex AI Gemini API 是 API 供應商時,才能使用這項功能。

您可以在 Firebase 控制台的「Firebase AI Logic」頁面啟用 AI 監控功能,觀察各種應用程式層級的指標和用量,全面掌握來自 Firebase AI Logic 用戶端 SDK 的要求。這些資訊主頁比呼叫 Count Tokens API 取得的基本權杖計數更深入。

Firebase 控制台的 AI 監控主要功能包括:

  • 查看量化指標,例如每個應用程式的要求量、延遲時間、錯誤和每種模式的權杖用量。

  • 檢查追蹤記錄,查看要求屬性、輸入內容和輸出內容,有助於偵錯和提升品質。

  • 依要求狀態、最短延遲時間、模型名稱等維度分割資料。

所有這些功能都是使用 Google Cloud Observability Suite 建構而成 (詳情請參閱下方的產品資訊)。

啟用 AI monitoring

在控制台中啟用 AI 監控的方式如下:Firebase

啟用及使用 AI 監控功能的需求條件:

  • 您必須是專案擁有者、編輯者或 Firebase Vertex AI 管理員。

  • Firebase 專案必須採用即付即用 Blaze 定價方案 (請參閱下方的產品詳細資訊)。

  • 您必須使用 Vertex AI Gemini API 做為 API 供應商 (我們即將支援 Gemini Developer API!)。

  • 應用程式至少須使用下列 Firebase 程式庫版本:
    iOS+:11.13.0 以上版本 | Android:16.0.0 以上版本 (BoM:33.14.0 以上版本) | 網頁:11.8.0 以上版本 | Flutter:2.0.0 以上版本 (BoM:3.11.0 以上版本) | Unity:12.9.0 以上版本

  • 應用程式必須啟用「選擇加入資料收集」功能 (預設為啟用)。

應用程式符合這些規定,且您在管理中心啟用 AI 監控功能後,應用程式或管理中心就不需要進行任何其他操作,即可開始在「AI 監控」Firebase AI Logic分頁的資訊主頁中查看資料。要求中的遙測資料可能需要稍微延遲 (有時最多 5 分鐘),才會顯示在 Firebase 控制台中。

進階用法

本節說明取樣率設定,以及查看及處理資料的不同選項。

取樣率

如果您要提出大量要求,建議您善用取樣率設定。取樣率會按比例呈現已收集到多少要求的追蹤記錄詳細資料

Firebase 控制台的「設定」Firebase AI Logic分頁中,您可以將專案的取樣率設為 1 到 100% 的值,其中 100% 表示 AI 監控功能會收集所有流量的追蹤記錄。預設值為 100%。收集的追蹤記錄越少,費用就越低,但可監控的追蹤記錄數量也會減少。請注意,無論取樣率為何,監控資訊主頁中顯示的圖表一律會反映實際流量。

Firebase 控制台以外的其他選項

除了 Firebase 控制台提供的 AI 監控功能,您也可以考慮下列選項:

  • 探索 Vertex AI Model Garden
    這些資訊主頁會提供受管理模型的延遲和輸送量趨勢深入分析資料,補充您在 Firebase 控制台中透過 AI 監控取得的深入分析資料。

  • 使用 Google Cloud Observability Suite
    探索及使用資料: 由於 AI 監控的遙測資料會儲存在與專案相關聯的 Google Cloud Observability Suite 中,因此您可以在資料的資訊主頁中探索資料,包括 Trace ExplorerLogs Explorer,這些資訊主頁會在您檢查 Firebase 控制台中的個別追蹤記錄時連結。您也可以使用資料建立自訂資訊主頁、設定快訊等。

用於 AI 監控的產品詳細資訊

AI 監控功能會將遙測資料儲存在 Google Cloud Observability Suite 中提供的各種產品,包括 Cloud MonitoringCloud TraceCloud Logging

  • Cloud Monitoring:儲存指標,包括要求數量、成功率和要求延遲時間。

  • Cloud Trace:儲存每項要求的追蹤記錄,方便您個別查看詳細資料,而非查看匯總資料。追蹤記錄通常會與記錄檔相關聯,方便您檢查每次互動的內容和時間。

  • Cloud Logging:擷取輸入、輸出和設定中繼資料,提供 AI 要求各部分的詳細資訊。

由於遙測資料會儲存在這些產品中,因此您可以在各產品中直接指定保留和存取設定 (詳情請參閱 Cloud MonitoringCloud TraceCloud Logging 的說明文件)。請注意,每個取樣要求的實際提示和產生的輸出內容都會與指標一併儲存。

定價

Google Cloud Observability Suite 是付費服務,因此 Firebase 專案必須採用即付即用 Blaze 定價方案。不過,每項產品都有相當寬裕的免付費用量。詳情請參閱Google Cloud Observability Suite定價說明文件

Google Cloud 控制台中查看專案層級的 API 指標

您可以在 Google Cloud 控制台中查看每個 API 的專案層級指標,例如用量。

請注意,本節所述的 Google Cloud 控制台頁面包含要求和回應內容以及權杖計數等資訊。如要監控這類資訊,建議使用 Firebase 控制台中的 AI 監控功能 (請參閱上一節)。

  1. Google Cloud 控制台中,前往要查看的 API 的「指標」頁面:

    • Vertex AI API: 查看與傳送至 Vertex AI Gemini API任何要求相關聯的用量。

      • 包括使用Firebase AI Logic用戶端 SDK、Google GenAI 伺服器 SDK、GenkitFirebase ExtensionsGemini API REST API、Vertex AI Studio 等提出的要求。
    • Gemini Developer API: 查看與對 Gemini Developer API 提出的任何要求相關聯的用量。

      • 包括使用 Firebase AI Logic 用戶端 SDK、Google GenAI 伺服器 SDK、GenkitFirebase Extensions Gemini API、REST API、Google AI Studio 等提出的要求。
      • 這個 API 在 Google Cloud 控制台中的顯示名稱為「Generative Language API」。

    如果系統將您帶往 API 的「總覽頁面」,請按一下「管理」,然後點選「指標」分頁。

  2. 使用下拉式選單查看感興趣的指標,例如依回應代碼分類的流量、依 API 方法分類的錯誤、整體延遲時間,以及依 API 方法分類的延遲時間。