GTE Embeddings

General Text Embeddings from Alibaba DAMO Academy trained on large-scale relevance pairs. Available in three sizes (large, base, small) with GTE-v1.5 supporting 8192 context length.

Visit Website

Surveys

Loading more......

Information

Websitehuggingface.co

PublishedMar 8, 2026

Tags

3 Items

#embeddings #open-source #multilingual

Similar Products

Qwen3 Embedding

Multilingual embedding model supporting over 100 languages and ranking #1 on MTEB multilingual leaderboard. Offers flexible model sizes from 0.6B to 8B parameters with user-defined instructions.

000

BGE-M3

A versatile multilingual text embedding model from BAAI that supports 100+ languages and can handle inputs up to 8192 tokens. BGE-M3 is unique in supporting three retrieval methods simultaneously: dense retrieval, multi-vector retrieval, and sparse retrieval.

000

gte-Qwen2-1.5B-instruct

A state-of-the-art multilingual text embedding model from Alibaba's GTE (General Text Embedding) series, built on the Qwen2-1.5B LLM. The model supports up to 8192 tokens and incorporates bidirectional attention mechanisms for enhanced contextual understanding across diverse domains.

000

Snowflake Arctic Embed

Suite of high-quality multilingual text embedding models optimized for retrieval performance, developed by Snowflake and available as open-source for commercial use.

000

FlagEmbedding

Open-source retrieval and RAG framework from BAAI featuring the BGE embedding model series. BGE-M3 supports multi-functionality (dense, sparse, multi-vector), multi-linguality (100+ languages), and multi-granularity (up to 8192 tokens).

000

jina-embeddings-v5

Jina AI's latest embedding model achieving the highest multilingual performance among models under 1B parameters with 71.7 average MTEB score and 67.7 MMTEB score.

000

Recent Developments

GTE-v1.5 Series

Upgraded GTE embeddings with:

Support for context length up to 8192 tokens

Enhanced model performance

Built upon transformer++ encoder backbone (BERT + RoPE + GLU)

GTE-Multilingual (mGTE) Series

Introduced by Alibaba's Tongyi Lab featuring:

High performance across languages

Long-context handling

Multilingual support

Elastic embedding capabilities

Significantly improved retrieval and ranking efficiency

Outstanding results across datasets

GTE Embeddings

Information

Categories

Tags

Similar Products

Connect with us

Stay Updated

Product

Clients

Company

Resources

GTE Embeddings

Information

Categories

Tags

Similar Products

Overview

Model Sizes

Benchmark Performance

Recent Developments

GTE-v1.5 Series

GTE-Multilingual (mGTE) Series

Applications

Technical Details

Availability

Evolution Path

Comparison with Competitors