Giám sát chi phí, mức sử dụng và các chỉ số khác

Việc theo dõi chi phí, mức sử dụng và các chỉ số khác của các tính năng AI là một phần quan trọng trong việc chạy một ứng dụng phát hành công khai. Bạn cần biết mô hình sử dụng thông thường của ứng dụng và đảm bảo rằng bạn vẫn nằm trong ngưỡng quan trọng đối với mình.

Trang này mô tả một số lựa chọn được đề xuất để theo dõi chi phí, mức sử dụng và các chỉ số khác trong cả bảng điều khiển Firebase và bảng điều khiển Google Cloud.

Giám sát chi phí

Trong trang tổng quan Mức sử dụng và thanh toán của bảng điều khiển Firebase, bạn có thể xem chi phí của dự án khi gọi Vertex AI Gemini APIGemini Developer API (khi bạn sử dụng gói giá Blaze).

Chi phí xuất hiện trên trang tổng quan không nhất thiết phải dành riêng cho các lệnh gọi bằng cách sử dụng SDK Firebase AI Logic. Chi phí hiển thị được liên kết với bất kỳ lệnh gọi nào đến "Gemini API", cho dù lệnh gọi đó sử dụng SDK Firebase AI Logic, SDK máy chủ Google GenAI Genkit, Firebase Extensions cho Gemini API, lệnh gọi REST, một trong các AI Studio hay các ứng dụng API khác.

Tìm hiểu thêm về giá của các sản phẩm liên quan đến việc bạn sử dụng Firebase AI Logic.

Thiết lập cảnh báo

Để tránh bị tính phí ngoài dự kiến, hãy nhớ thiết lập cảnh báo về ngân sách khi bạn sử dụng gói giá Blaze.

Xin lưu ý rằng cảnh báo ngân sách không phải là hạn mức ngân sách. Cảnh báo sẽ gửi cho bạn thông tin liên lạc khi bạn sắp đạt đến hoặc vượt quá ngưỡng đã định cấu hình để bạn có thể thực hiện hành động trong ứng dụng hoặc dự án của mình.

Theo dõi mức sử dụng các tính năng AI trong bảng điều khiển Firebase

Chỉ có khi bạn dùng Vertex AI Gemini API làm trình cung cấp API.

Bạn có thể bật tính năng giám sát bằng AI trong trang Firebase AI Logic của bảng điều khiển Firebase để theo dõi nhiều chỉ số và mức sử dụng ở cấp ứng dụng nhằm nắm được thông tin toàn diện về các yêu cầu của bạn từ SDK Firebase AI Logic. Những trang tổng quan này chi tiết hơn so với số lượng mã thông báo cơ bản mà bạn nhận được từ một lệnh gọi đến Count Tokens API (API Đếm mã thông báo).

Các chức năng chính của tính năng giám sát dựa trên AI trong bảng điều khiển Firebase bao gồm:

  • Xem các chỉ số định lượng như số lượng yêu cầu, độ trễ, lỗi và mức sử dụng mã thông báo theo phương thức cho từng ứng dụng của bạn.

  • Kiểm tra dấu vết để xem các thuộc tính, đầu vào và đầu ra của yêu cầu. Việc này có thể giúp gỡ lỗi và cải thiện chất lượng.

  • Phân chia dữ liệu theo các phương diện như trạng thái yêu cầu, độ trễ tối thiểu, tên mô hình, v.v.

Tất cả các tính năng này đều được xây dựng bằng Google Cloud Observability Suite (xem thông tin chi tiết về sản phẩm bên dưới).

Bật tính năng giám sát AI

Sau đây là những cách bạn có thể bật tính năng giám sát bằng AI trong bảng điều khiển Firebase:

Các yêu cầu để bật và sử dụng tính năng giám sát bằng AI:

  • Bạn phải là Chủ sở hữu dự án, Người chỉnh sửa hoặc Quản trị viên Vertex AI của Firebase.

  • Dự án Firebase của bạn phải sử dụng gói giá linh hoạt (trả tiền theo mức dùng) (xem thông tin chi tiết về sản phẩm bên dưới).

  • Bạn phải sử dụng Vertex AI Gemini API làm trình cung cấp API (chúng tôi sẽ sớm hỗ trợ Gemini Developer API!).

  • Ứng dụng của bạn phải sử dụng tối thiểu các phiên bản thư viện Firebase sau:
    iOS+: phiên bản 11.13.0 trở lên | Android: phiên bản 16.0.0 trở lên (BoM: phiên bản 33.14.0 trở lên) | Web: phiên bản 11.8.0 trở lên | Flutter: phiên bản 2.0.0 trở lên (BoM: phiên bản 3.11.0 trở lên) | Unity: phiên bản 12.9.0 trở lên

  • Ứng dụng của bạn phải bật tính năng thu thập dữ liệu có sự đồng ý (theo mặc định, tính năng này sẽ được bật).

Sau khi ứng dụng của bạn đáp ứng các yêu cầu này và bạn bật tính năng giám sát bằng AI trong bảng điều khiển, bạn không cần làm gì khác trong ứng dụng hoặc bảng điều khiển để bắt đầu thấy dữ liệu xuất hiện trên các trang tổng quan trong thẻ Firebase AI Logic Giám sát bằng AI. Có thể có một chút chậm trễ (đôi khi lên đến 5 phút) trước khi dữ liệu đo từ xa của một yêu cầu xuất hiện trong bảng điều khiển Firebase.

Cách sử dụng nâng cao

Phần này mô tả cấu hình tốc độ lấy mẫu, cũng như các lựa chọn khác nhau để xem và xử lý dữ liệu của bạn.

Tốc độ lấy mẫu

Nếu đang thực hiện một số lượng lớn yêu cầu, bạn nên tận dụng cấu hình tỷ lệ lấy mẫu. Tỷ lệ lấy mẫu cho biết tỷ lệ yêu cầu mà thông tin chi tiết về dấu vết thực sự được thu thập.

Trong thẻ Firebase AI Logic Settings (Cài đặt) của bảng điều khiển Firebase, bạn có thể định cấu hình tốc độ lấy mẫu cho dự án của mình thành một giá trị từ 1 đến 100%, trong đó 100% có nghĩa là tính năng giám sát bằng AI sẽ thu thập dấu vết từ tất cả lưu lượng truy cập của bạn. Giá trị mặc định là 100%. Việc thu thập ít dấu vết hơn sẽ giúp giảm chi phí, nhưng cũng làm giảm số lượng dấu vết mà bạn có thể giám sát. Xin lưu ý rằng bất kể tỷ lệ lấy mẫu của bạn là bao nhiêu, các biểu đồ xuất hiện trong trang tổng quan giám sát sẽ luôn phản ánh lưu lượng truy cập thực tế.

Các lựa chọn khác bên ngoài bảng điều khiển Firebase

Ngoài tính năng giám sát AI có trong bảng điều khiển Firebase, hãy cân nhắc những lựa chọn sau:

  • Khám phá Vertex AI Model Garden.
    Các trang tổng quan này cung cấp thêm thông tin chi tiết về xu hướng liên quan đến độ trễ và thông lượng cho các mô hình được quản lý, bổ sung cho thông tin chi tiết của bạn từ hoạt động giám sát AI trong bảng điều khiển Firebase.

  • Khám phá và sử dụng dữ liệu của bạn bằng Google Cloud Observability Suite
    Vì dữ liệu đo từ xa để giám sát AI được lưu trữ trong Google Cloud Observability Suite liên kết với dự án của bạn, nên bạn có thể khám phá dữ liệu của mình trong các trang tổng quan, bao gồm cả Trace ExplorerLogs Explorer. Các trang tổng quan này được liên kết khi bạn kiểm tra các dấu vết riêng lẻ trong bảng điều khiển Firebase. Bạn cũng có thể sử dụng dữ liệu của mình để tạo trang tổng quan tuỳ chỉnh, thiết lập cảnh báo và làm nhiều việc khác.

Thông tin chi tiết về các sản phẩm được dùng để giám sát AI

Tính năng giám sát bằng AI lưu trữ dữ liệu đo từ xa của bạn trong nhiều sản phẩm có sẵn trong Google Cloud Observability Suite, bao gồm Cloud Monitoring, Cloud TraceCloud Logging.

  • Cloud Monitoring: Lưu trữ các chỉ số, bao gồm số lượng yêu cầu, tỷ lệ thành công và độ trễ của yêu cầu.

  • Cloud Trace: Lưu trữ dấu vết cho từng yêu cầu của bạn để bạn có thể xem chi tiết riêng lẻ thay vì xem tổng hợp. Dấu vết thường được liên kết với nhật ký để bạn có thể kiểm tra nội dung và thời gian của từng lượt tương tác.

  • Cloud Logging: Ghi lại siêu dữ liệu đầu vào, đầu ra và cấu hình để cung cấp thông tin chi tiết về từng phần trong yêu cầu của bạn đối với AI.

Vì dữ liệu đo từ xa của bạn được lưu trữ trong các sản phẩm này, nên bạn có thể chỉ định chế độ cài đặt về việc lưu giữ và truy cập ngay trong từng sản phẩm (tìm hiểu thêm trong tài liệu về Cloud Monitoring, Cloud TraceCloud Logging). Xin lưu ý rằng lời nhắc thực tế và đầu ra được tạo từ mỗi yêu cầu được lấy mẫu sẽ được lưu trữ cùng với các chỉ số.

Giá

Google Cloud Observability Suite là một dịch vụ có tính phí, vì vậy dự án Firebase của bạn phải sử dụng gói giá linh hoạt (trả tiền theo mức dùng). Tuy nhiên, mỗi sản phẩm đều có các bậc miễn phí hào phóng. Tìm hiểu thêm trong Google Cloud Observability Suite tài liệu về giá.

Xem các chỉ số API ở cấp dự án trong bảng điều khiển Google Cloud

Đối với mỗi API, bạn có thể xem các chỉ số ở cấp dự án (chẳng hạn như mức sử dụng) trong bảng điều khiển Google Cloud.

Xin lưu ý rằng các trang trên bảng điều khiển Google Cloud được mô tả trong phần này không bao gồm những thông tin như nội dung yêu cầu và phản hồi cũng như số lượng mã thông báo. Để theo dõi loại thông tin đó, hãy cân nhắc sử dụng hoạt động giám sát AI trong bảng điều khiển Firebase (xem phần trước).

  1. Trong bảng điều khiển Google Cloud, hãy chuyển đến trang Chỉ số của API mà bạn muốn xem:

    • Vertex AI API: Xem mức sử dụng liên quan đến mọi yêu cầu gửi đến Vertex AI Gemini API.

      • Bao gồm các yêu cầu sử dụng SDK Firebase AI Logicphía máy khách, SDK máy chủ GenAI của Google, Genkit, Firebase Extensions cho Gemini API, REST API, Vertex AI Studio, v.v.
    • Gemini Developer API: Xem mức sử dụng liên quan đến mọi yêu cầu đối với Gemini Developer API.

      • Bao gồm các yêu cầu sử dụng SDK Firebase AI Logic của ứng dụng, SDK Genkit của máy chủ GenAI của Google, Firebase Extensions cho Gemini API, REST API, Google AI Studio, v.v.
      • Tên hiển thị của API này trong bảng điều khiển Google Cloud là "Generative Language API".

    Nếu bạn thấy mình đang ở trên "trang tổng quan" cho API, hãy nhấp vào Quản lý, rồi nhấp vào thẻ Chỉ số.

  2. Sử dụng trình đơn thả xuống để xem các chỉ số bạn quan tâm, chẳng hạn như lưu lượng truy cập theo mã phản hồi, lỗi theo phương thức API, độ trễ tổng thể và độ trễ theo phương thức API.