Najgorętszy decyzyjny w architekturze RAG. Cztery opcje dominują w 2026: Pinecone (managed SaaS), Weaviate (open-source + cloud), pgvector (PostgreSQL extension), Azure AI Search.
Pinecone wygrywa dla MVP i małej skali — najprostszy setup, dobre API, świetny developer experience. Cena rośnie szybko: dla 5M embeddings to ~1500-2500 USD/m-c (zależnie od pod tier). Powyżej tej skali nieefektywny ekonomicznie.
Weaviate self-hosted wygrywa dla średniej skali — pełna kontrola, niskie koszty operacyjne (głównie hosting GPU/CPU), pełne hybrid search out-of-the-box. Wymaga DevOps capacity. Typowe TCO dla 50M embeddings: 1000-2500 USD/m-c.
pgvector wygrywa, gdy macie już PostgreSQL — najprostsza operational story (jedna baza, jeden backup, jeden monitoring). Performance lepsze niż się wydaje (do 50M wektorów działa świetnie). Nie ma wszystkich features Pinecone/Weaviate, ale dla większości use case'ów wystarczy.
Azure AI Search wygrywa dla Microsoft ecosystem — natywne integracje z Azure OpenAI, Microsoft Entra ID, SharePoint connectorami. Premium pricing, ale zwykle organizacje już mają Azure subscription.