ViT-Small (Patch16, 224px, AugReg, IN21k → IN1k)

timm vision

image

A small Vision Transformer with patch size 16, pretrained on ImageNet-21k with AugReg and fine-tuned on ImageNet-1k for classification.

Capabilities

vision

Dates

releasedOct 2021

Resources

homepagehuggingface.co/timm/vit_small_patch16_224.augreg_in21k_ft_in1k ↗

docshuggingface.co/docs/timm/en/models/vit ↗

API

full doc /v1/models/timm/vit_small_patch16_224.augreg_in21k_ft_in1k