Dense Retrieval

An information retrieval approach using dense vector representations (embeddings) to encode queries and documents. Unlike sparse methods like BM25, dense retrieval captures semantic meaning in continuous vector spaces, enabling neural search and forming the foundation of modern RAG systems.

Visit Website

Surveys

Loading more......

Information

Websiteen.wikipedia.org

PublishedMar 22, 2026

Tags

3 Items

#retrieval #embeddings #neural-search

Similar Products

Multi-Vector Embeddings

Embedding approach where documents/images are represented by multiple vectors (one per token/patch) rather than a single vector, enabling fine-grained semantic matching.

000

Asymmetric Search

A search paradigm where queries and documents are encoded differently, optimized for scenarios where queries are short and documents are long. Common in information retrieval and modern embedding models designed specifically for search.

000

Late Interaction

Retrieval paradigm where query and document tokens are encoded separately and interactions computed at search time, combining efficiency of bi-encoders with expressiveness of cross-encoders.

000

ColBERTv2

Advanced multi-vector retrieval model creating token-level embeddings with late interaction mechanism, featuring denoised supervision and improved memory efficiency over original ColBERT.

000

ColBERT

State-of-the-art late interaction retrieval model that produces multi-vector token-level representations, enabling efficient and effective passage search with rich contextual understanding.

000

ASMR Technique

Agentic Search and Memory Retrieval technique by Supermemory using parallel reader agents and search agents that achieved ~99% accuracy on LongMemEval benchmark.

000

Dense vs Sparse Retrieval

Dense Retrieval

Representation: Continuous vectors (e.g., 768 dimensions)

Method: Neural networks create embeddings

Similarity: Cosine similarity, dot product

Advantages: Semantic understanding, synonyms

Example: BERT embeddings, Sentence Transformers

Sparse Retrieval

Representation: High-dimensional sparse vectors

Method: Term frequency based (BM25, TF-IDF)

Similarity: Exact keyword overlap

Advantages: Interpretable, fast for exact matches

Example: BM25, Elasticsearch standard search

Modern Dense Retrieval Models

Bi-Encoders

Encode queries and documents independently

Fast retrieval (pre-compute document vectors)

Examples: Sentence-BERT, DPR, E5, BGE

Cross-Encoders

Encode query-document pairs jointly

Slower but more accurate

Used for reranking

Examples: BERT rerankers, Cohere rerank

Late Interaction

Multi-vector representations

Token-level interactions

Examples: ColBERT, ColPali

Training Approaches

Contrastive Learning

Positive pairs: similar query-document

Negative pairs: dissimilar items

Maximize similarity for positives

Minimize for negatives

Hard Negative Mining

Select challenging negative examples

Improves discriminative ability

Common in modern embedding models

Multi-Task Training

Train on diverse retrieval tasks

Better generalization

Examples: E5, GTE models

Dense Retrieval

Information

Categories

Tags

Similar Products

Connect with us

Stay Updated

Product

Clients

Company

Resources

Dense Retrieval

Information

Categories

Tags

Similar Products

Overview

Dense vs Sparse Retrieval

Dense Retrieval

Sparse Retrieval

Dense Passage Retrieval (DPR)

Modern Dense Retrieval Models

Bi-Encoders

Cross-Encoders

Late Interaction

Training Approaches

Contrastive Learning

Hard Negative Mining

Multi-Task Training

Applications

Implementation

Libraries

Vector Databases

Hybrid Dense+Sparse

Advantages

Challenges

Pricing