ViT-Base (Patch16, 224px, AugReg, IN21k)

timm vision

image

A Vision Transformer base model with patch size 16, pretrained on ImageNet-21k with AugReg for general-purpose image representation.

Capabilities

vision

Dates

releasedOct 2021

Resources

homepagehuggingface.co/timm/vit_base_patch16_224.augreg_in21k ↗

docshuggingface.co/docs/timm/en/models/vit ↗

API

full doc /v1/models/timm/vit_base_patch16_224.augreg_in21k