監控 AI 功能的成本、用量和其他指標,是執行正式版應用程式的重要環節。您必須瞭解應用程式的正常使用模式,並確保維持在您重視的門檻範圍內。
本頁說明在 Firebase 控制台和 Google Cloud 控制台中監控費用、用量和其他指標的建議選項。
監控費用
在 Firebase 主控台的用量和帳單資訊主頁中,您可以查看專案呼叫 Vertex AI Gemini API 和 Gemini Developer API 的費用 (如果您採用 Blaze 定價方案)。
資訊主頁上顯示的費用不一定是使用 Firebase AI Logic 用戶端 SDK 的呼叫所產生。顯示的費用與任何對這些「Gemini API」的呼叫相關,無論是使用 Firebase AI Logic 用戶端 SDK、Google GenAI 伺服器 SDK、Genkit、Gemini API 的 Firebase Extensions、REST 呼叫、AI 工作室之一或其他 API 用戶端。
進一步瞭解與 Firebase AI Logic 使用情形相關的產品定價。
設定快訊功能
為避免產生意外的帳單,請務必在使用 Blaze 定價方案時設定預算快訊。
請注意,預算快訊不是預算上限。當您即將或已超過所設定的門檻時,系統會傳送快訊,讓您在應用程式或專案中採取行動。
在 Firebase 控制台中查看 AI 功能的使用情形
僅限使用 Vertex AI Gemini API 做為 API 供應商時使用。 |
您可以在 Firebase 主控台的 Firebase AI Logic 頁面中啟用 AI 監控功能,這樣就能觀察各種應用程式層級指標和用量,全面掌握 Firebase AI Logic 用戶端 SDK 的請求。這些資訊主頁比透過 Count Tokens API 呼叫取得的基本符記計數更深入。
Firebase 主控台 AI 監控功能的特色包括:
查看每個應用程式的數量指標,例如要求量、延遲時間、錯誤和每種模式的權杖用量。
檢查追蹤記錄,查看要求的屬性、輸入內容和輸出內容,有助於進行偵錯和改善品質。
依據要求狀態、最短延遲時間、模型名稱等維度切片資料。
所有這些功能都是使用 Google Cloud Observability Suite 建構而成 (請參閱下方的詳細產品資訊)。
啟用 AI monitoring
以下是您可以在 Firebase 主控台啟用 AI Monitoring 的方式:
透過 Firebase AI Logic 頁面完成初始引導設定流程時
您隨時可以前往 Firebase AI Logic「設定」分頁
啟用及使用 AI monitoring 的必要條件:
您必須是專案擁有者、編輯者或 Firebase Vertex AI 管理員。
Firebase 專案必須採用即付即用 Blaze 定價方案 (請參閱下方的詳細產品資訊)。
您必須使用 Vertex AI Gemini API 做為 API 供應器 (支援 Gemini Developer API 的功能即將推出)。
您的應用程式必須使用至少以下 Firebase 程式庫版本:
iOS+:11.13.0 以上版本 | Android:16.0.0 以上版本 (BoM:33.14.0 以上版本) | Web:11.8.0 以上版本 | Flutter:2.0.0 以上版本 (BoM:3.11.0 以上版本) | Unity:12.9.0 以上版本您的應用程式必須已啟用選擇加入資料收集功能 (預設為啟用)。
在應用程式符合這些規定,並在控制台中啟用 AI 監控功能後,您無須在應用程式或控制台中執行其他操作,即可開始在 Firebase AI Logic「AI 監控」分頁中填入資訊主頁的資料。在 Firebase 控制台顯示要求的遙測資料之前,可能會有輕微延遲 (有時最多 5 分鐘)。
進階用法
本節將說明取樣率設定,以及查看及處理資料的不同選項。
取樣率
如果您提出大量要求,建議您善用取樣率設定。取樣率會以百分比呈現已收集到多少要求的資料,
在 Firebase 控制台的 Firebase AI Logic「設定」分頁中,您可以將專案的取樣率設為 1% 到 100% 之間的值,其中 100% 會將所有流量傳送至 AI 監控。預設值為 100%。傳送更多流量可提高指標準確度,但也會增加監控成本。請注意,監控資訊主頁中顯示的圖表是以取樣率為依據,因此如果取樣率為 50%,請將要求數量、符記使用量等數量加倍,以便預估實際數量。
Firebase 控制台以外的其他選項
除了 Firebase 控制台提供的 AI 監控功能,您還可以考慮下列選項:
探索 Vertex AI Model Garden。
這些資訊主頁可進一步分析代管模型的延遲時間和傳輸量趨勢,補充您在 Firebase 控制台中透過 AI 監控功能取得的洞察資料。使用 Google Cloud Observability Suite
探索及使用資料 AI 監控的遙測資料會儲存在與專案相關聯的 Google Cloud Observability Suite 中,因此您可以在資訊主頁中探索資料,包括 Trace Explorer 和 Logs Explorer,這些資料會在您在 Firebase 主控台中檢查個別追蹤記錄時連結。您也可以使用資料建立自訂資訊主頁、設定快訊等。
用於 AI Monitoring 的產品詳細資訊
AI 監控會將遙測資料儲存在 Google Cloud Observability Suite 提供的各種產品中,包括 Cloud Monitoring、Cloud Trace 和 Cloud Logging。
Cloud Monitoring:儲存指標,包括要求次數、成功率和要求延遲時間。
Cloud Trace:儲存每個要求的追蹤記錄,方便您個別查看詳細資料,而非匯總資料。追蹤記錄通常會與記錄相關聯,方便您檢查每項互動的內容和時間。
Cloud Logging:擷取輸入、輸出和設定中繼資料,以便提供 AI 要求的各個部分詳細資料。
由於遙測資料會儲存在這些產品中,您可以直接在各產品中指定保留和存取設定 (詳情請參閱 Cloud Monitoring、Cloud Trace 和 Cloud Logging 的說明文件)。請注意,每個取樣要求的實際提示和產生的輸出內容會與指標一併儲存。
定價
Google Cloud Observability Suite 是付費服務,因此 Firebase 專案必須採用即付即用 Blaze 定價方案。不過,每項產品都提供免付費用的等級。詳情請參閱 Google Cloud Observability Suite 定價說明文件。
在 Google Cloud 控制台查看專案層級的 API 指標
您可以在 Google Cloud 主控台查看每個 API 的專案層級指標,例如用量。
請注意,本節所述的 Google Cloud 管理中心頁面不包含要求和回應內容、權杖計數等資訊。如要監控這類資訊,建議您使用 Firebase 控制台中的 AI 監控功能 (請參閱上一節)。
在 Google Cloud 控制台中,前往所需 API 的「Metrics」頁面:
Vertex AI API:查看與 Vertex AI Gemini API 的任何要求相關聯的使用情形。
- 包括使用 Firebase AI Logic 用戶端 SDK、Google GenAI 伺服器 SDK、Genkit、Gemini API 的 Firebase Extensions、REST API、Vertex AI Studio 等的請求。
Gemini Developer API:查看與 Gemini Developer API 的「任何」要求相關聯的用量。
- 包括使用 Firebase AI Logic 用戶端 SDK、Google GenAI 伺服器 SDK、Genkit、Gemini API 的 Firebase Extensions、REST API、Google AI Studio 等的請求。
- 這個 API 在 Google Cloud 控制台中的顯示名稱為「Generative Language API」。
如果您位於 API 的「總覽頁面」,請依序點選「管理」和「指標」分頁。
使用下拉式選單查看您感興趣的指標,例如依回應代碼分類的流量、依 API 方法分類的錯誤、整體延遲時間,以及依 API 方法分類的延遲時間。