datasketch

library 1.9.0 ·python

✓ verified May 20, 2026 ✓ install

data vector-search ai-ml

datasketch is a Python library that provides probabilistic data structures for efficient similarity search and approximate nearest neighbor (ANN) computations on very large datasets. It currently stands at version 1.9.0 and maintains an active release cadence, with updates addressing features, fixes, and dependency management.

Traffic · last 30 days ↑650% vs prev 7d · indexed Wed Apr 08 · updated Sat May 23

total hits 27

actors 6 distinct systems

last hit 1d ago ByteDance

ByteDance

11

Script

4

GPTBot

2

Search engines

2

Humans

4

top countries 🇸🇬 Singapore · 🇺🇸 United States · 🇫🇮 Finland · 🇩🇪 Germany · 🇮🇳 India

Resources

docsekzhu.github.io/datasketch ↗

githubgithub.com/ekzhu/datasketch ↗

packagepypi.org/project/datasketch/ ↗

API endpoints

full doc /v1/registry/datasketch

install /v1/registry/datasketch/install

imports /v1/registry/datasketch/imports

compatibility /v1/registry/datasketch/compatibility

quickstart /v1/registry/datasketch/quickstart