ConvNeXt Large MLP CLIP LAION-2B

timm vision

image

ConvNeXt large model with MLP head trained with CLIP on LAION-2B, model soup averaged, then fine-tuned on ImageNet-12k and ImageNet-1k at 320x320 resolution.

Capabilities

vision

API

full doc /v1/models/timm/convnext_large_mlp.clip_laion2b_soup_ft_in12k_in1k_320