Việc theo dõi chi phí, mức sử dụng và các chỉ số khác của các tính năng AI là một phần quan trọng trong việc chạy ứng dụng chính thức. Bạn cần biết mô hình sử dụng thông thường của ứng dụng và đảm bảo rằng bạn đang ở trong ngưỡng quan trọng đối với mình.
Trang này mô tả một số tuỳ chọn được đề xuất để theo dõi chi phí, mức sử dụng và các chỉ số khác trong cả bảng điều khiển Firebase và bảng điều khiển Google Cloud.
Theo dõi chi phí
Trong trang tổng quan Sử dụng và thanh toán của bảng điều khiển Firebase, bạn có thể xem chi phí của dự án để gọi Vertex AI Gemini API và Gemini Developer API (khi bạn sử dụng gói giá Blaze).
Chi phí hiển thị trên trang tổng quan không nhất thiết chỉ dành cho các lệnh gọi sử dụng SDK ứng dụng Firebase AI Logic. Chi phí hiển thị được liên kết với mọi lệnh gọi đến "API Gemini" đó, cho dù các lệnh gọi đó có sử dụng SDK ứng dụng Firebase AI Logic, SDK máy chủ Google GenAI, Genkit, Firebase Extensions cho Gemini API, lệnh gọi REST, một trong các AI Studios hoặc ứng dụng API khác.
Tìm hiểu thêm về mức giá cho các sản phẩm liên kết với việc bạn sử dụng Firebase AI Logic.
Thiết lập tính năng cảnh báo
Để tránh bị tính phí bất ngờ, hãy nhớ thiết lập cảnh báo về ngân sách khi bạn sử dụng gói giá Blaze.
Xin lưu ý rằng cảnh báo ngân sách không phải là giới hạn ngân sách. Cảnh báo sẽ gửi cho bạn thông báo khi bạn sắp đạt đến hoặc đã vượt quá ngưỡng đã định cấu hình để bạn có thể hành động trong ứng dụng hoặc dự án của mình.
Quan sát mức sử dụng các tính năng AI trong bảng điều khiển Firebase
Chỉ có sẵn khi bạn sử dụng Vertex AI Gemini API làm trình cung cấp API. |
Bạn có thể bật tính năng giám sát AI trong trang Firebase AI Logic của bảng điều khiển Firebase để có thể quan sát nhiều chỉ số và mức sử dụng ở cấp ứng dụng nhằm nắm được thông tin toàn diện về các yêu cầu của bạn từ SDK ứng dụng Firebase AI Logic. Các trang tổng quan này cung cấp thông tin chi tiết hơn so với số lượng mã thông báo cơ bản mà bạn nhận được từ lệnh gọi đến Count Tokens API.
Các tính năng chính của tính năng giám sát AI trong bảng điều khiển Firebase bao gồm:
Xem các chỉ số định lượng như số lượng yêu cầu, độ trễ, lỗi và mức sử dụng mã thông báo theo phương thức cho từng ứng dụng.
Kiểm tra dấu vết để xem các thuộc tính, dữ liệu đầu vào và đầu ra của yêu cầu, điều này có thể giúp gỡ lỗi và cải thiện chất lượng.
Cắt dữ liệu theo các phương diện như trạng thái yêu cầu, độ trễ tối thiểu, tên mô hình, v.v.
Tất cả các tính năng này đều được tạo bằng Google Cloud Observability Suite (xem thông tin chi tiết về sản phẩm bên dưới).
Bật tính năng giám sát AI
Sau đây là các cách bạn có thể bật tính năng giám sát AI trong bảng điều khiển Firebase:
Khi bạn thực hiện quy trình thiết lập ban đầu theo hướng dẫn trên trang Firebase AI Logic
Bất cứ lúc nào trong thẻ Firebase AI Logic Cài đặt
Yêu cầu để bật và sử dụng tính năng giám sát bằng AI:
Bạn phải là Chủ sở hữu, Người chỉnh sửa hoặc Quản trị viên Vertex AI trong Firebase.
Dự án Firebase của bạn phải sử dụng gói giá linh hoạt (trả tiền theo mức dùng) của Blaze (xem thông tin chi tiết về sản phẩm bên dưới).
Bạn phải sử dụng Vertex AI Gemini API làm nhà cung cấp API (sẽ sớm hỗ trợ Gemini Developer API!).
Ứng dụng của bạn phải sử dụng ít nhất các phiên bản thư viện Firebase sau:
iOS+: v11.13.0+ | Android: v16.0.0+ (BoM: v33.14.0+) | Web: v11.8.0+ | Flutter: v2.0.0+ (BoM: v3.11.0+) | Unity: v12.9.0+Ứng dụng của bạn phải bật tính năng thu thập dữ liệu chọn tham gia (tính năng này được bật theo mặc định).
Sau khi ứng dụng của bạn đáp ứng các yêu cầu này và bạn bật tính năng giám sát AI trong bảng điều khiển, bạn không cần làm gì khác trong ứng dụng hoặc bảng điều khiển để bắt đầu thấy dữ liệu điền vào trang tổng quan trong thẻ Firebase AI Logic Giám sát AI. Có thể có một chút độ trễ (đôi khi lên đến 5 phút) trước khi dữ liệu đo từ xa từ một yêu cầu xuất hiện trong bảng điều khiển Firebase.
Cách sử dụng nâng cao
Phần này mô tả cấu hình tốc độ lấy mẫu, cũng như các tuỳ chọn khác nhau để xem và xử lý dữ liệu.
Tốc độ lấy mẫu
Nếu đang gửi một số lượng lớn yêu cầu, bạn nên tận dụng cấu hình tốc độ lấy mẫu. Tốc độ lấy mẫu cho biết tỷ lệ phần trăm số yêu cầu mà dữ liệu thực sự được thu thập.
Trong thẻ Firebase AI Logic Cài đặt của bảng điều khiển Firebase, bạn có thể định cấu hình tốc độ lấy mẫu cho dự án của mình thành một giá trị từ 1 đến 100%, trong đó 100% sẽ gửi tất cả lưu lượng truy cập của bạn đến tính năng giám sát AI. Theo mặc định, tỷ lệ này là 100%. Việc gửi nhiều lưu lượng truy cập hơn sẽ làm tăng độ chính xác của các chỉ số; tuy nhiên, điều này cũng sẽ làm tăng chi phí giám sát. Xin lưu ý rằng các biểu đồ hiển thị trong trang tổng quan về hoạt động giám sát dựa trên tốc độ lấy mẫu. Vì vậy, nếu tốc độ lấy mẫu là 50%, bạn nên tăng gấp đôi số lượng yêu cầu, mức sử dụng mã thông báo, v.v. để ước tính số lượng thực tế.
Các tuỳ chọn bổ sung bên ngoài bảng điều khiển Firebase
Ngoài tính năng giám sát AI có trong bảng điều khiển Firebase, hãy cân nhắc các tuỳ chọn sau:
Khám phá Vertex AI Model Garden.
Các trang tổng quan này cung cấp thêm thông tin chi tiết về xu hướng về độ trễ và thông lượng cho các mô hình được quản lý, bổ sung thông tin chi tiết từ tính năng giám sát AI trong bảng điều khiển Firebase.Khám phá và sử dụng dữ liệu bằng Google Cloud Observability Suite
Vì dữ liệu đo từ xa để giám sát AI được lưu trữ trong Google Cloud Observability Suite liên kết với dự án của bạn, nên bạn có thể khám phá dữ liệu trong trang tổng quan của dự án, bao gồm cả Trace Explorer và Logs Explorer. Các trang tổng quan này được liên kết với thời điểm bạn kiểm tra từng dấu vết trong bảng điều khiển Firebase. Bạn cũng có thể sử dụng dữ liệu của mình để tạo trang tổng quan tuỳ chỉnh, thiết lập cảnh báo và làm nhiều việc khác.
Thông tin chi tiết về các sản phẩm dùng để giám sát AI
Tính năng giám sát bằng AI lưu trữ dữ liệu đo từ xa của bạn trong nhiều sản phẩm có trong Google Cloud Observability Suite, bao gồm Cloud Monitoring, Cloud Trace và Cloud Logging.
Cloud Monitoring: Lưu trữ các chỉ số, bao gồm số lượng yêu cầu, tỷ lệ thành công và độ trễ yêu cầu.
Cloud Trace: Lưu trữ dấu vết cho từng yêu cầu để bạn có thể xem chi tiết riêng lẻ thay vì tổng hợp. Dấu vết thường được liên kết với nhật ký để bạn có thể kiểm tra nội dung và thời gian của từng lượt tương tác.
Cloud Logging: Ghi lại siêu dữ liệu đầu vào, đầu ra và cấu hình để cung cấp thông tin chi tiết phong phú về từng phần của yêu cầu AI.
Vì dữ liệu đo từ xa của bạn được lưu trữ trong các sản phẩm này, nên bạn có thể chỉ định chế độ cài đặt truy cập và giữ lại ngay trong từng sản phẩm (tìm hiểu thêm trong tài liệu về Cloud Monitoring, Cloud Trace và Cloud Logging). Xin lưu ý rằng lời nhắc thực tế và kết quả được tạo từ mỗi yêu cầu được lấy mẫu sẽ được lưu trữ cùng với các chỉ số.
Giá
Google Cloud Observability Suite là một dịch vụ có tính phí, vì vậy, dự án Firebase của bạn phải sử dụng gói giá linh hoạt (trả tiền theo mức dùng) Blaze. Tuy nhiên, mỗi sản phẩm đều có các cấp miễn phí hào phóng. Tìm hiểu thêm trong tài liệu về giá của Google Cloud Observability Suite.
Xem các chỉ số API cấp dự án trong bảng điều khiển Google Cloud
Đối với mỗi API, bạn có thể xem các chỉ số cấp dự án, chẳng hạn như mức sử dụng, trong bảng điều khiển Google Cloud.
Xin lưu ý rằng các trang bảng điều khiển Google Cloud được mô tả trong phần này không chứa thông tin như nội dung yêu cầu và phản hồi cũng như số lượng mã thông báo. Để theo dõi loại thông tin đó, hãy cân nhắc sử dụng tính năng giám sát AI trong bảng điều khiển Firebase (xem phần trước).
Trong bảng điều khiển Google Cloud, hãy chuyển đến trang Chỉ số của API bạn muốn xem:
API Vertex AI: Xem mức sử dụng liên quan đến mọi yêu cầu đến Vertex AI Gemini API.
- Bao gồm các yêu cầu sử dụng SDK ứng dụng Firebase AI Logic, SDK máy chủ Google GenAI, Genkit, Firebase Extensions cho Gemini API, API REST, Vertex AI Studio, v.v.
Gemini Developer API: Xem mức sử dụng liên kết với mọi yêu cầu đến Gemini Developer API.
- Bao gồm các yêu cầu sử dụng SDK ứng dụng Firebase AI Logic, SDK máy chủ Google GenAI, Genkit, Firebase Extensions cho Gemini API, API REST, Google AI Studio, v.v.
- Tên hiển thị của API này trong bảng điều khiển Google Cloud là "Generative Language API" (API ngôn ngữ tạo sinh).
Nếu bạn đang ở "trang tổng quan" của API, hãy nhấp vào Quản lý, sau đó nhấp vào thẻ Chỉ số.
Sử dụng trình đơn thả xuống để xem các chỉ số mà bạn quan tâm, chẳng hạn như lưu lượng truy cập theo mã phản hồi, lỗi theo phương thức API, độ trễ tổng thể và độ trễ theo phương thức API.