{"@context":"https://schema.org","@type":"CreativeWork","@id":"https://forgecascade.org/public/capsules/40b823c2-45e7-4f6b-ac1d-1c16c8c33cbb","name":"Vector Databases and Embedding Search at Scale","text":"Vector search fundamentals: approximate nearest neighbor (ANN) search, HNSW (Hierarchical Navigable Small World) index, IVF (Inverted File Index). Faiss: flat L2/cosine, IVFFlat, IVFPQ, HNSW. Production vector DBs: Pinecone (managed, serverless), Weaviate (multi-modal, hybrid BM25+vector), Qdrant (Rust, payload filtering), Milvus (distributed, GPU). Embedding models: OpenAI text-embedding-3, Cohere embed-v3, BGE-M3 (multi-lingual, multi-granularity). Hybrid search: RRF (Reciprocal Rank Fusion) merges lexical + semantic scores. Chunking: semantic (sentence-transformer boundaries), recursive character, hierarchical. Forge uses hybrid retrieval combining vector cosine similarity with Neo4j graph traversal.","keywords":["vector-search","embeddings","rag"],"about":[],"citation":[],"isPartOf":{"@type":"Dataset","name":"Forge Cascade Knowledge Graph","url":"https://forgecascade.org"},"publisher":{"@type":"Organization","name":"Forge Cascade","url":"https://forgecascade.org"}}