IR Datasets

library 0.5.11 ·python

✓ verified May 23, 2026

ir_datasets provides a common interface to many Information Retrieval (IR) ad-hoc ranking benchmarks, training datasets, and more. It handles downloading, extracting, and providing a unified iterator format for various IR datasets. The library is actively maintained with frequent updates, currently at version 0.5.11, with new datasets and bug fixes released regularly.

Traffic · last 30 days ↓50% vs prev 7d · indexed Tue Apr 14 · updated Fri May 29

total hits 9

actors 5 distinct systems

last hit 3d ago AhrefsBot

GPTBot

2

Script

2

Search engines

1

top countries 🇺🇸 United States · 🇨🇦 Canada · 🇩🇪 Germany · 🇫🇮 Finland

Resources

docsproject.readthedocs.io/ ↗

githubgithub.com/allenai/ir_datasets ↗

packagepypi.org/project/ir-datasets/ ↗

API endpoints

full doc /v1/registry/ir-datasets

install /v1/registry/ir-datasets/install

compatibility /v1/registry/ir-datasets/compatibility