{"library":"nvidia-modelopt","type":"library","category":null,"description":"NVIDIA Model Optimizer (nvidia-modelopt) is an open toolkit designed to accelerate AI inference by applying state-of-the-art model optimization techniques such as quantization, pruning, and distillation. It primarily targets PyTorch and ONNX models, integrating directly into the training loop and enabling seamless deployment to NVIDIA's inference frameworks like TensorRT-LLM and TensorRT. The library is actively developed, with its current stable version being 0.42.0, and frequent pre-release candidates (e.g., 0.43.0rcX) indicating a rapid release cadence.","language":"python","status":"active","version":"0.42.0","tags":["AI","Machine Learning","Optimization","Quantization","Pruning","Distillation","PyTorch","ONNX","NVIDIA","GPU","Inference"],"install":[{"cmd":"pip install nvidia-modelopt","imports":["import modelopt","import modelopt_recipes"]},{"cmd":"pip install \"nvidia-modelopt[all]\" --extra-index-url https://pypi.nvidia.com","imports":[]}],"homepage":"https://developer.nvidia.com/tensorrt","github":"https://github.com/NVIDIA/Model-Optimizer","docs":null,"changelog":null,"pypi":"https://pypi.org/project/nvidia-modelopt/","npm":null,"openapi_spec":null,"status_page":null,"smithery":null,"compatibility":{"summary":{"python_range":"3.10–3.9","success_rate":25,"avg_install_s":66.7,"avg_import_s":null,"wheel_type":"sdist"},"url":"https://checklist.day/v1/registry/nvidia-modelopt/compatibility"},"provenance":{"verified_status":"passing","verified_at":"Tue Jun 30","last_verified":"Tue Jun 30","next_check":"Thu Jul 30","install_tag":null}}