gte-Qwen2-7B-instruct

A large-scale multilingual text embedding model from Alibaba's GTE series with 7 billion parameters. Built on Qwen2-7B, it achieved a score of 70.24 on MTEB, outperforming NV-Embed-v1 and supporting 100+ languages with up to 8192 token context.

Visit Website

Overview

gte-Qwen2-7B-instruct is the flagship model in Alibaba's GTE-Qwen2 series, featuring 7 billion parameters and achieving state-of-the-art performance on multilingual embedding benchmarks.

Performance

MTEB Benchmark: 70.24 score

Outperforms:

NV-Embed-v1: 69.32
gte-Qwen1.5-7B-instruct: 67.34

Technical Features

7 Billion Parameters: Larger model size enables richer representations
Bidirectional Attention: Enhanced contextual understanding
8192 Token Context: Process long documents
100+ Languages: Comprehensive multilingual support
Advanced Training: Weakly supervised and supervised data

Use Cases

Enterprise multilingual search
Long-document embedding
High-quality RAG systems
Cross-lingual retrieval
Academic and research applications

Availability

Hugging Face: Alibaba-NLP/gte-Qwen2-7B-instruct

Commercial API: Alibaba Cloud text-embedding-v3

Surveys

Loading more......

Information

Websitehuggingface.co

PublishedMar 20, 2026

Tags

4 Items

#embeddings #multilingual #instruction-based #large-model

Similar Products

gte-Qwen2-1.5B-instruct

A state-of-the-art multilingual text embedding model from Alibaba's GTE (General Text Embedding) series, built on the Qwen2-1.5B LLM. The model supports up to 8192 tokens and incorporates bidirectional attention mechanisms for enhanced contextual understanding across diverse domains.

000

Qwen3 Embedding

Multilingual embedding model supporting over 100 languages and ranking #1 on MTEB multilingual leaderboard. Offers flexible model sizes from 0.6B to 8B parameters with user-defined instructions.

000

MTEB

Massive Text Embedding Benchmark (MTEB) - a comprehensive benchmark for evaluating text embedding models across 8 embedding tasks and 58 datasets in 112 languages. Provides a standardized leaderboard for comparing embedding quality across classification, clustering, retrieval, reranking, semantic textual similarity, and summarization tasks.

000

Cohere Embed Multilingual v3

High-performance multilingual embedding model from Cohere supporting 100+ languages with 1024 dimensions, optimized for semantic search, RAG, and cross-lingual retrieval tasks.

000

Mistral Embed

State-of-the-art embedding model from Mistral AI that generates 1024-dimensional vectors for text, supporting semantic search, clustering, and retrieval-augmented generation applications.

000

BGE-M3

A versatile multilingual text embedding model from BAAI that supports 100+ languages and can handle inputs up to 8192 tokens. BGE-M3 is unique in supporting three retrieval methods simultaneously: dense retrieval, multi-vector retrieval, and sparse retrieval.

000

gte-Qwen2-7B-instruct

Overview

Performance

Technical Features

Use Cases

Availability

Information

Categories

Tags

Similar Products

Connect with us

Stay Updated

Product

Clients

Company

Resources

gte-Qwen2-7B-instruct

Overview

Performance

Technical Features

Use Cases

Availability

Information

Categories

Tags

Similar Products