Google Vertex AI
Google Vertex AI zapewnia dostęp do rodziny modeli Gemini - zaawansowanych modeli multimodalnych obsługujących tekst, obrazy, dźwięk i wideo. Modele Gemini wyróżniają się dużym oknem kontekstu, sięgającym w niektórych wersjach nawet 2 mln tokenów, a także wysoką wydajnością i konkurencyjnym modelem cenowym.
Kiedy wybrać Google Vertex AI
Duże dokumenty i długi kontekst:
- analiza wielostronicowychdokumentów,
- przetwarzanie długich konwersacji i rozbudowanej historii,
- praca na kontekście obejmującym całe bazy wiedzy.
Przetwarzanie multimedialne:
- analiza obrazów i wykrywanie obiektów,
- Transkrypcja oraz analiza dźwięku,
- przetwarzanie materiałów wideo.
Optymalizacja kosztów:
- Modele Gemini Flash oferują bardzo dobry stosunek ceny do wydajności,
- niższe koszty przy dużych wolumenach zapytań.
Integracja z GCP:
- korzystasz z Google Cloud Platform,
- potrzebujesz funkcji RAG opartych na Vertex AI Search.
Wymagania
- konto Google Cloud Platform (GCP),
- projekt w GCP z włączonym Vertex AI API,
- Service Account Key w formacie JSON,
- bucket Google Cloud Storage do przetwarzania plików.
Krok 1: Przygotowanie środowiska w Google Cloud
1. Utwórz Service Account
- Przejdź do Google Cloud Console.
- Wybierz istniejący projekt lub utwórz nowy.
- Przejdź do IAM & Admin > Service Accounts.
- Kliknij Create Service Account
- Nadaj nazwę, np.
aiproxy-vertex. - Przypisz następujące role:
Vertex AI User,Storage Object Admin(dla bucket).
- Kliknij Create key > JSON, a następnie pobierz plik.
2. Włącz wymagane API
- Przejdź do APIs & Services > Library.
- Włącz następujące interfejsy API:
- Vertex AI API,
- Cloud Storage API.
3. Utwórz Storage Bucket
- Przejdź do Cloud Storage > Buckets.
- Kliknij Create bucket.
- Nadaj nazwę, np.
aiproxy-files. - Wybierz region, np.
us-central1. - Kliknij Create.
informacja
Bucket w Cloud Storage jest niezbędny do przetwarzania plików, takich jak obrazy, nagrania audio i dokumenty, przez modele Gemini.