מסד נתונים וקטורי (Vector Database)
מסד נתונים מיוחד לאחסון וחיפוש מהיר של embeddings — בסיס ל-RAG ולמערכות חיפוש סמנטיות.
מה זה Vector Database
Vector Database (מסד נתונים וקטורי) הוא DB מיוחד שאוחסן embeddings — וקטורים בני מאות עד אלפי מימדים — ומסוגל לחפש בהם במהירות באלגוריתמים מתמטיים מתקדמים (HNSW, IVF, ScaNN).
החיפוש לא מחפש "התאמה מדויקת" אלא "הקרוב ביותר" — בהינתן וקטור שאילתה, מי K הוקטורים הקרובים אליו במרחב? זוהי פעולה שדרשה שעות בעבר וכיום רצה תוך מילישניות גם על מאות מיליוני וקטורים.
הספקים המובילים ב-2026
- Pinecone — הוותיק והגדול. פשוט להפעלה, יקר יחסית. מחיר מתחיל ב-$70/חודש לאינדקס בסיסי.
- Qdrant — open source או cloud managed. ביצועים מצוינים, מחיר נמוך משמעותית.
- Weaviate — open source עם תמיכה ב-multimodal native (טקסט+תמונות יחד).
- Milvus — open source enterprise-grade. אופציה טובה ל-self-hosting בקנה מידה.
- pgvector — תוסף ל-PostgreSQL. ב-Supabase זה מובנה. למקרים עד עשרות מיליוני וקטורים — מספיק לחלוטין ובחינם.
- Chroma — embedded, נוח לפרוטוטיפים מקומיים.
- MongoDB Atlas Vector Search — אם כבר משתמשים ב-MongoDB.
- Turbopuffer — חדש ב-2026, אופטימיזציה לעלות נמוכה במיוחד.
איך לבחור
- עד 100K וקטורים — pgvector מספיק. בחינם, פשוט.
- 100K-10M וקטורים — Qdrant Cloud או pgvector על Supabase Pro. עלות $25-200/חודש.
- 10M+ וקטורים, latency נמוך קריטי — Pinecone או Turbopuffer.
- Multimodal (תמונות+טקסט) — Weaviate.
תכונות מתקדמות
- Hybrid search — שילוב של חיפוש סמנטי (וקטור) עם חיפוש מילות מפתח (BM25). משפר דיוק בעשרות אחוזים.
- Metadata filtering — לחפש רק בקבוצת מסמכים מסוימת (למשל, רק מסמכים פנימיים של משתמש X).
- Reranking — שכבה שנייה של ranking על הטופ-100 הראשוני, לדיוק עוד יותר גבוה.
- Multi-tenancy — חלוקה לוגית בין לקוחות שונים בארגון SaaS.
שימוש מעשי בעסק
ב-99% מהמקרים העסקיים שראינו, vector DB משמש כחלק ממערכת RAG — חיפוש על מסמכי החברה, באקסיגב הידע הפנימי, או בנתוני לקוחות. למקרים פשוטים בקנה מידה קטן, אנחנו ממליצים להתחיל עם pgvector ב-Supabase ולעבור לפלטפורמה מתקדמת רק כשיש צורך אמיתי.