{"slug":"Voodisss/Qwen3-Reranker-4B-GGUF-llama_cpp","title":"Qwen3 Reranker 4B GGUF","description":"A GGUF quantized version of the Qwen3 4B reranker model for efficient local inference via llama.cpp.","provider":"alibaba","model_type":"reranking","status":"active","context_window":40960,"max_output_tokens":40960,"pricing":{"currency":"USD","input_per_mtok":null,"output_per_mtok":null},"modalities":["text"],"capabilities":["streaming"],"knowledge_cutoff":null,"release_date":"2025-04-01T00:00:00.000Z","deprecation_date":null,"retirement_date":null,"aliases":[],"homepage":"https://huggingface.co/Voodisss/Qwen3-Reranker-4B-GGUF-llama_cpp","docs":null,"categories":["ai-ml"],"tags":[],"last_verified":"2026-06-10T00:00:00.000Z","next_check":"2026-09-08T00:00:00.000Z","created_at":"2026-06-09T19:33:41.354Z","updated_at":"2026-06-09T19:33:41.354Z"}