当前位置：首页 > 文章列表 > 文章 > python教程 > PyTorch 中的 FiveCrop

PyTorch 中的 FiveCrop

来源：dev.to 2025-01-24 11:34:03 0浏览收藏

你在学习文章相关的知识吗？本文《PyTorch 中的 FiveCrop》，主要介绍的内容就涉及到，如果你想提升自己的开发能力，就不要错过这篇文章，大家要知道编程理论基础和实战操作都是不可或缺的哦！

请我喝杯咖啡☕

*备忘录：

我的帖子解释了 oxfordiiitpet()。

fivecrop() 可以将图像裁剪为 5 个部分（左上、右上、左下、右下和中心），如下所示：

*备忘录：

初始化的第一个参数是 size(required-type:int or tuple/list(int) or size()): *备注：
- 它是[高度，宽度]。
- 必须是 1 <= x。
- 元组/列表必须是具有 1 或 2 个元素的一维。
- 单个值（int 或 tuple/list(int) 表示 [size, size]。
第一个参数是img（必需类型：pil图像或张量（int））： *备注：
- 张量必须是一个或多个元素的 2d 或 3d。
- 不要使用img=。
v2建议按照v1还是v2使用？我应该使用哪一个？

from torchvision.datasets import OxfordIIITPet
from torchvision.transforms.v2 import FiveCrop

fivecrop = FiveCrop(size=100)

fivecrop
# FiveCrop(size=(100, 100))

fivecrop.size
# (100, 100)

origin_data = OxfordIIITPet(
    root="data",
    transform=None
)

p500p394origin_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=[500, 394])
    # transform=FiveCrop(size=[600])
    # transform=FiveCrop(size=[600, 600])
)

p300_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=300)
)

p200_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=200)
)

p100_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=100)
)

p50_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=50)
)

p10_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=10)
)

p200p300_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=[200, 300])
)

p300p200_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=[300, 200])
)

import matplotlib.pyplot as plt

def show_images1(fcims, main_title=None):
    plt.figure(figsize=(10, 5))
    plt.suptitle(t=main_title, y=0.8, fontsize=14)
    titles = ['Top-left', 'Top-right', 'bottom-left',
              'bottom-right', 'center']
    for i, fcim in zip(range(1, 6), fcims):
        plt.subplot(1, 5, i)
        plt.title(label=titles[i-1], fontsize=14)
        plt.imshow(X=fcim)
    plt.tight_layout()
    plt.show()

plt.figure(figsize=(7, 9))
plt.title(label="Origin_data", fontsize=14)
plt.imshow(X=origin_data[0][0])
show_images1(fcims=p500p394origin_data[0][0], main_title="p500p394origin_data")
show_images1(fcims=p300_data[0][0], main_title="p300_data")
show_images1(fcims=p200_data[0][0], main_title="p200_data")
show_images1(fcims=p100_data[0][0], main_title="p100_data")
show_images1(fcims=p50_data[0][0], main_title="p50_data")
show_images1(fcims=p10_data[0][0], main_title="p10_data")
show_images1(fcims=p200p300_data[0][0], main_title="p200p300_data")
show_images1(fcims=p300p200_data[0][0], main_title="p300p200_data")

# ↓ ↓ ↓ ↓ ↓ ↓ The code below is identical to the code above. ↓ ↓ ↓ ↓ ↓ ↓
def show_images2(im, main_title=None, s=None):
    plt.figure(figsize=(10, 5))
    plt.suptitle(t=main_title, y=0.8, fontsize=14)
    titles = ['Top-left', 'Top-right', 'bottom-left',
              'bottom-right', 'center']
    if not s:
        s = [im.size[1], im.size[0]] 
    fc = FiveCrop(size=s) # Here
    for i, fcim in zip(range(1, 6), fc(im)):
        plt.subplot(1, 5, i)
        plt.title(label=titles[i-1], fontsize=14)
        plt.imshow(X=fcim) # Here
    plt.tight_layout()
    plt.show()

plt.figure(figsize=(7, 9))
plt.title(label="Origin_data", fontsize=14)
plt.imshow(X=origin_data[0][0])
show_images2(im=origin_data[0][0], main_title="p500p394origin_data")
# show_images2(im=origin_data[0][0], main_title="p500p394origin_data",
#              s=[500, 394])
show_images2(im=origin_data[0][0], main_title="p300_data", s=300)
show_images2(im=origin_data[0][0], main_title="p200_data", s=200)
show_images2(im=origin_data[0][0], main_title="p100_data", s=100)
show_images2(im=origin_data[0][0], main_title="p50_data", s=50)
show_images2(im=origin_data[0][0], main_title="p10_data", s=10)
show_images2(im=origin_data[0][0], main_title="p200p300_data", s=[200, 300])
show_images2(im=origin_data[0][0], main_title="p300p200_data", s=[300, 200])

image description