ViDoRe

Visual Document Retrieval Benchmark defining standard evaluation protocols for vision-centric document and video retrieval with 26,000 pages and 3,099 queries across 6 languages from 12,000 man-hours of annotations.

🌐Visit Website

About this tool

Overview

ViDoRe (Visual Document Retrieval) Benchmarks define a standard suite of datasets and evaluation protocols for vision-centric document and video retrieval, supporting the assessment of retrieval-augmented generation (RAG) systems and embedding models over complex, multimodal, and multilingual corpora.

Purpose and Evolution

The ViDoRe suite was created to address the shortcomings of prior retrieval benchmarks—namely, their limited coverage of visual document types, saturation on synthetic/extractive queries, and neglect of multilingual and multi-hop scenarios. Evolving through three major releases (V1–V3 for documents; recent video retrieval adaptation).

Latest Version (V3)

ViDoRe V3 is a multilingual, human-annotated RAG benchmark that evaluates retrieval, final answer generation, and visual grounding on large industry-relevant document corpora.

Key Features:

26,000 pages and 3,099 queries
Translated into 6 languages
Built on 12,000 man-hours of human-created and verified annotations
10 challenging, real-world datasets spanning diverse industrial domains
8 publicly released datasets and 2 kept private

Coverage

The benchmark focuses on:

Modalities: Text, figures, infographics, tables
Domains: Medical, business, scientific, administrative
Languages: English, French, and others

Technical Approach

ViDoRe evaluates a novel concept and model architecture based on Vision Language Models (VLMs) to efficiently index documents purely from their visual features, allowing for subsequent fast query matching with late interaction mechanisms.

Pricing

Free to use - open benchmark.

Surveys

Loading more......

Information

Websitehuggingface.co

PublishedMar 13, 2026

Tags

3 Items

#Benchmark #Multimodal #Rag

Similar Products

6 result(s)

BigVectorBench

An innovative benchmark suite for thoroughly evaluating vector database performance on heterogeneous data embeddings and compound queries for real-world multimodal applications.

NVIDIA NeMo Retriever

Collection of industry-leading Nemotron RAG models delivering 50% better accuracy, 15x faster multimodal PDF extraction, and 35x better storage efficiency for building enterprise-grade retrieval-augmented generation pipelines.

Mastering Multimodal RAG

A course focused on mastering multimodal Retrieval Augmented Generation (RAG) and embeddings, which are fundamental components often stored and managed by vector databases.

MTEB Leaderboard

Featured

Massive Text Embedding Benchmark leaderboard covering 58 datasets across 112 languages and 8 embedding tasks. Industry-standard benchmark for comparing text embedding models.

MTEB (Massive Text Embedding Benchmark)

Comprehensive benchmark suite for evaluating embedding models across 58 datasets spanning 112 languages and eight task types including retrieval, clustering, and semantic similarity, the standard for comparing embedding quality.

MMTEB

Massive Multilingual Text Embedding Benchmark covering over 500 quality-controlled evaluation tasks across 250+ languages, representing the largest multilingual collection of embedding model evaluation tasks.

ViDoRe

🌐Visit Website

About this tool

Overview

Purpose and Evolution

Latest Version (V3)

ViDoRe V3 is a multilingual, human-annotated RAG benchmark that evaluates retrieval, final answer generation, and visual grounding on large industry-relevant document corpora.

Key Features:

26,000 pages and 3,099 queries
Translated into 6 languages
Built on 12,000 man-hours of human-created and verified annotations
10 challenging, real-world datasets spanning diverse industrial domains
8 publicly released datasets and 2 kept private

Coverage

The benchmark focuses on:

Modalities: Text, figures, infographics, tables
Domains: Medical, business, scientific, administrative
Languages: English, French, and others

Technical Approach

Pricing

Free to use - open benchmark.

Surveys

Loading more......

Information

Websitehuggingface.co

PublishedMar 13, 2026

ViDoRe

About this tool

Overview

Purpose and Evolution

Latest Version (V3)

Key Features:

Coverage

Technical Approach

Pricing

Information

Categories

Tags

Similar Products

Connect with us

Stay Updated

Product

Clients

Company

Resources

ViDoRe

About this tool

Overview

Purpose and Evolution

Latest Version (V3)

Key Features:

Coverage

Technical Approach

Pricing

Information

Categories

Tags

Similar Products

Connect with us

Stay Updated

Product

Clients

Company

Resources