監控費用、用量和其他指標

監控 AI 功能的成本、用量和其他指標,是執行正式版應用程式的重要環節。您必須瞭解應用程式的正常使用模式,並確保維持在您重視的門檻範圍內。

本頁說明在 Firebase 控制台和 Google Cloud 控制台中監控費用、用量和其他指標的建議選項。

監控費用

Firebase 主控台的用量和帳單資訊主頁中,您可以查看專案呼叫 Vertex AI Gemini APIGemini Developer API 的費用 (如果您採用 Blaze 定價方案)。

資訊主頁上顯示的費用不一定是使用 Firebase AI Logic 用戶端 SDK 的呼叫所產生。顯示的費用與任何對這些「Gemini API」的呼叫相關,無論是使用 Firebase AI Logic 用戶端 SDK、Google GenAI 伺服器 SDK、GenkitGemini APIFirebase Extensions、REST 呼叫、AI 工作室之一或其他 API 用戶端。

進一步瞭解與 Firebase AI Logic 使用情形相關的產品定價

設定快訊功能

為避免產生意外的帳單,請務必在使用 Blaze 定價方案時設定預算快訊

請注意,預算快訊不是預算上限。當您即將或已超過所設定的門檻時,系統會傳送快訊,讓您在應用程式或專案中採取行動。

Firebase 控制台中查看 AI 功能的使用情形

僅限使用 Vertex AI Gemini API 做為 API 供應商時使用。

您可以在 Firebase 主控台的 Firebase AI Logic 頁面中啟用 AI 監控功能,這樣就能觀察各種應用程式層級指標和用量,全面掌握 Firebase AI Logic 用戶端 SDK 的請求。這些資訊主頁比透過 Count Tokens API 呼叫取得的基本符記計數更深入。

Firebase 主控台 AI 監控功能的特色包括:

  • 查看每個應用程式的數量指標,例如要求量、延遲時間、錯誤和每種模式的權杖用量。

  • 檢查追蹤記錄,查看要求的屬性、輸入內容和輸出內容,有助於進行偵錯和改善品質。

  • 依據要求狀態、最短延遲時間、模型名稱等維度切片資料。

所有這些功能都是使用 Google Cloud Observability Suite 建構而成 (請參閱下方的詳細產品資訊)。

啟用 AI monitoring

以下是您可以在 Firebase 主控台啟用 AI Monitoring 的方式:

啟用及使用 AI monitoring 的必要條件:

  • 您必須是專案擁有者、編輯者或 Firebase Vertex AI 管理員。

  • Firebase 專案必須採用即付即用 Blaze 定價方案 (請參閱下方的詳細產品資訊)。

  • 您必須使用 Vertex AI Gemini API 做為 API 供應器 (支援 Gemini Developer API 的功能即將推出)。

  • 您的應用程式必須使用至少以下 Firebase 程式庫版本:
    iOS+:11.13.0 以上版本 | Android:16.0.0 以上版本 (BoM:33.14.0 以上版本) | Web:11.8.0 以上版本 | Flutter:2.0.0 以上版本 (BoM:3.11.0 以上版本) | Unity:12.9.0 以上版本

  • 您的應用程式必須已啟用選擇加入資料收集功能 (預設為啟用)。

在應用程式符合這些規定,並在控制台中啟用 AI 監控功能後,您無須在應用程式或控制台中執行其他操作,即可開始在 Firebase AI Logic「AI 監控」分頁中填入資訊主頁的資料。在 Firebase 控制台顯示要求的遙測資料之前,可能會有輕微延遲 (有時最多 5 分鐘)。

進階用法

本節將說明取樣率設定,以及查看及處理資料的不同選項。

取樣率

如果您提出大量要求,建議您善用取樣率設定。取樣率會以百分比呈現已收集到多少要求的資料,

Firebase 控制台的 Firebase AI Logic「設定」分頁中,您可以將專案的取樣率設為 1% 到 100% 之間的值,其中 100% 會將所有流量傳送至 AI 監控。預設值為 100%。傳送更多流量可提高指標準確度,但也會增加監控成本。請注意,監控資訊主頁中顯示的圖表是以取樣率為依據,因此如果取樣率為 50%,請將要求數量、符記使用量等數量加倍,以便預估實際數量。

Firebase 控制台以外的其他選項

除了 Firebase 控制台提供的 AI 監控功能,您還可以考慮下列選項:

  • 探索 Vertex AI Model Garden
    這些資訊主頁可進一步分析代管模型的延遲時間和傳輸量趨勢,補充您在 Firebase 控制台中透過 AI 監控功能取得的洞察資料。

  • 使用 Google Cloud Observability Suite
    探索及使用資料 AI 監控的遙測資料會儲存在與專案相關聯的 Google Cloud Observability Suite 中,因此您可以在資訊主頁中探索資料,包括 Trace ExplorerLogs Explorer,這些資料會在您在 Firebase 主控台中檢查個別追蹤記錄時連結。您也可以使用資料建立自訂資訊主頁、設定快訊等。

用於 AI Monitoring 的產品詳細資訊

AI 監控會將遙測資料儲存在 Google Cloud Observability Suite 提供的各種產品中,包括 Cloud MonitoringCloud TraceCloud Logging

  • Cloud Monitoring:儲存指標,包括要求次數、成功率和要求延遲時間。

  • Cloud Trace:儲存每個要求的追蹤記錄,方便您個別查看詳細資料,而非匯總資料。追蹤記錄通常會與記錄相關聯,方便您檢查每項互動的內容和時間。

  • Cloud Logging:擷取輸入、輸出和設定中繼資料,以便提供 AI 要求的各個部分詳細資料。

由於遙測資料會儲存在這些產品中,您可以直接在各產品中指定保留和存取設定 (詳情請參閱 Cloud MonitoringCloud TraceCloud Logging 的說明文件)。請注意,每個取樣要求的實際提示和產生的輸出內容會與指標一併儲存。

定價

Google Cloud Observability Suite 是付費服務,因此 Firebase 專案必須採用即付即用 Blaze 定價方案。不過,每項產品都提供免付費用的等級。詳情請參閱 Google Cloud Observability Suite 定價說明文件

Google Cloud 控制台查看專案層級的 API 指標

您可以在 Google Cloud 主控台查看每個 API 的專案層級指標,例如用量。

請注意,本節所述的 Google Cloud 管理中心頁面不包含要求和回應內容、權杖計數等資訊。如要監控這類資訊,建議您使用 Firebase 控制台中的 AI 監控功能 (請參閱上一節)。

  1. Google Cloud 控制台中,前往所需 API 的「Metrics」頁面:

    • Vertex AI API:查看與 Vertex AI Gemini API任何要求相關聯的使用情形。

      • 包括使用 Firebase AI Logic 用戶端 SDK、Google GenAI 伺服器 SDK、GenkitGemini APIFirebase Extensions、REST API、Vertex AI Studio 等的請求。
    • Gemini Developer API:查看與 Gemini Developer API 的「任何」要求相關聯的用量。

      • 包括使用 Firebase AI Logic 用戶端 SDK、Google GenAI 伺服器 SDK、GenkitGemini APIFirebase Extensions、REST API、Google AI Studio 等的請求。
      • 這個 API 在 Google Cloud 控制台中的顯示名稱為「Generative Language API」。

    如果您位於 API 的「總覽頁面」,請依序點選「管理」和「指標」分頁。

  2. 使用下拉式選單查看您感興趣的指標,例如依回應代碼分類的流量、依 API 方法分類的錯誤、整體延遲時間,以及依 API 方法分類的延遲時間。