模型:
microsoft/resnet-18
ResNet模型在imagenet-1k上进行了训练。它在论文深度残差学习用于图像识别中首次提出,并首次在此代码库中发布。
声明:发布ResNet模型的团队没有为该模型编写模型卡片,因此此模型卡片由Hugging Face团队编写。
ResNet引入了残差连接,它们允许训练具有任意数量层次的网络(最多1000层)。ResNet赢得了2015年ILSVRC&COCO竞赛,这是深度计算机视觉的一个重要里程碑。
您可以使用原始模型进行图像分类。请查看模型中心以寻找您感兴趣的任务上的微调版本。
以下是使用此模型的方法:
>>> from transformers import AutoFeatureExtractor, ResNetForImageClassification >>> import torch >>> from datasets import load_dataset >>> dataset = load_dataset("huggingface/cats-image") >>> image = dataset["test"]["image"][0] >>> feature_extractor = AutoFeatureExtractor.from_pretrained("microsoft/resnet-18") >>> model = ResNetForImageClassification.from_pretrained("microsoft/resnet-18") >>> inputs = feature_extractor(image, return_tensors="pt") >>> with torch.no_grad(): ... logits = model(**inputs).logits >>> # model predicts one of the 1000 ImageNet classes >>> predicted_label = logits.argmax(-1).item() >>> print(model.config.id2label[predicted_label]) tiger cat
有关更多代码示例,请参阅文档。