Product Quantization (PQ)

Name: Product Quantization (PQ)
Brand: Ever Works
Availability: InStock

Vector compression technique that splits high-dimensional vectors into subvectors and quantizes each independently, achieving significant memory reduction while enabling approximate similarity search.

🌐Visit Website

About this tool

Overview

Product Quantization (PQ) is a vector compression technique that splits high-dimensional vectors into subvectors and quantizes each subvector independently. This achieves significant memory reduction (often 32x or more) while enabling approximate similarity search.

How Product Quantization Works

Compression Process

Split: Divide each d-dimensional vector into m subvectors
Learn Codebooks: Train a codebook (lookup table) for each subvector using k-means
Quantize: Replace each subvector with its nearest codebook entry's index
Store: Store only the compact codes instead of full vectors

Search Process

Quantize query vector using same splitting
Pre-compute distances between query subvectors and all codebook entries
Approximate full vector distances using lookup table
Return top-k results

Memory Reduction

Typical compression:

Original: 768 dimensions × 4 bytes = 3,072 bytes per vector
PQ (m=96, k=256): 96 bytes per vector
Compression ratio: ~32x

Variants

IVF-PQ

Combines Inverted File clustering with Product Quantization for both speed and compression.

OPQ (Optimized Product Quantization)

Applies a learned rotation before quantization to reduce quantization error.

Additive Quantization

Uses sum of multiple codebook entries for better accuracy.

Trade-offs

Advantages:

Significant memory reduction
Faster similarity computation
Enables larger datasets in memory

Disadvantages:

Loss of accuracy (quantization error)
Requires training phase
Not suitable for exact search

Configuration Parameters

m: Number of subvectors (segments)
nbits: Bits per code (determines codebook size: k=2^nbits)

Use Cases

Large-scale vector search (billions of vectors)
Memory-constrained environments
When some accuracy loss is acceptable
Reducing infrastructure costs

Pricing

Implemented in open-source libraries (FAISS, ScaNN, etc.)

Surveys

Loading more......

Information

Websiteieeexplore.ieee.org

PublishedMar 13, 2026

Tags

3 Items

#Quantization #Compression #Optimization

Similar Products

6 result(s)

Locally-Adaptive Vector Quantization

Advanced quantization technique that applies per-vector normalization and scalar quantization, adapting the quantization bounds individually for each vector. Achieves four-fold reduction in vector size while maintaining search accuracy with 26-37% overall memory footprint reduction.

Binary Quantization

Extreme vector compression technique converting each dimension to a single bit (0 or 1), achieving 32x memory reduction and enabling ultra-fast Hamming distance calculations with acceptable accuracy trade-offs.

Scalar Quantization

Vector compression technique reducing precision of each vector component from 32-bit floats to 8-bit integers, achieving 4x memory reduction with minimal accuracy loss for vector search.

AWQ

Activation-aware Weight Quantization method that preserves model accuracy at 4-bit quantization by identifying and skipping important weights. Maintains 99%+ of original performance with moderate inference speed improvements.

GPTQ

Post-training quantization method for 4-bit weight compression that focuses on GPU inference performance. First quantization method to compress LLMs to 4-bit range while maintaining accuracy, minimizing mean squared error to weights.

BBQ Binary Quantization

Elasticsearch and Lucene's implementation of RaBitQ algorithm for 1-bit vector quantization, renamed as BBQ. Provides 32x compression with asymptotically optimal error bounds, enabling efficient vector search at massive scale with minimal accuracy loss.

Product Quantization (PQ)

🌐Visit Website

About this tool

Overview

How Product Quantization Works

Compression Process

Split: Divide each d-dimensional vector into m subvectors
Learn Codebooks: Train a codebook (lookup table) for each subvector using k-means
Quantize: Replace each subvector with its nearest codebook entry's index
Store: Store only the compact codes instead of full vectors

Search Process

Quantize query vector using same splitting
Pre-compute distances between query subvectors and all codebook entries
Approximate full vector distances using lookup table
Return top-k results

Memory Reduction

Typical compression:

Original: 768 dimensions × 4 bytes = 3,072 bytes per vector
PQ (m=96, k=256): 96 bytes per vector
Compression ratio: ~32x

Variants

IVF-PQ

Combines Inverted File clustering with Product Quantization for both speed and compression.

OPQ (Optimized Product Quantization)

Applies a learned rotation before quantization to reduce quantization error.

Additive Quantization

Uses sum of multiple codebook entries for better accuracy.

Trade-offs

Advantages:

Significant memory reduction
Faster similarity computation
Enables larger datasets in memory

Disadvantages:

Loss of accuracy (quantization error)
Requires training phase
Not suitable for exact search

Configuration Parameters

m: Number of subvectors (segments)
nbits: Bits per code (determines codebook size: k=2^nbits)

Use Cases

Large-scale vector search (billions of vectors)
Memory-constrained environments
When some accuracy loss is acceptable
Reducing infrastructure costs

Pricing

Implemented in open-source libraries (FAISS, ScaNN, etc.)

Surveys

Loading more......

Information

Websiteieeexplore.ieee.org

PublishedMar 13, 2026

Product Quantization (PQ)

About this tool

Overview

How Product Quantization Works

Compression Process

Search Process

Memory Reduction

Variants

IVF-PQ

OPQ (Optimized Product Quantization)

Additive Quantization

Trade-offs

Configuration Parameters

Use Cases

Pricing

Information

Categories

Tags

Similar Products

Product Quantization (PQ)

About this tool

Overview

How Product Quantization Works

Compression Process

Search Process

Memory Reduction

Variants

IVF-PQ

OPQ (Optimized Product Quantization)

Additive Quantization

Trade-offs

Configuration Parameters

Use Cases

Pricing

Information

Categories

Tags

Similar Products