香蕉视频首页,日日干天天,夜夜艹日日干

使用torch.utils.data.Dataset類(lèi) 處理圖片數(shù)據(jù)時(shí)，

1. 我們需要定義三個(gè)基本的函數(shù)，以下是基本流程

									class our_datasets(Data.Dataset):

									  def __init__(self,root,is_resize=False,is_transfrom=False):

									    #這里只是個(gè)參考。按自己需求寫(xiě)。

									    self.root=root

									    self.is_resize=is_resize

									    self.is_transfrom=is_transfrom

									    self.imgs_list=...#這里建議保存的是 圖片的路徑 而不是 圖片的數(shù)據(jù)

									    self.labs_list=...

									  def __getitem__(self, index):

									    img_path,lab=self.imgs_list[index],self.labs_list[index]

									    #這里使用PIL庫(kù)讀取圖片數(shù)據(jù).

									    img_data = Image.open(img_path).convert('RGB')

									    #這里看自己需要，可以不要

									    if self.is_resize:

									      img_data = img_data.resize((self.is_resize[0], self.is_resize[1]), Image.ANTIALIAS)

									    #但是數(shù)據(jù)轉(zhuǎn)換建議加上，很多時(shí)候都會(huì)用到

									    if self.is_transfrom:

									      img_data=self.is_transfrom(img_data)

									    return img_data,lab

									  def __len__(self):

									    return len(self.imgs_list)

這里，我將讀取圖片的步驟放到 __getitem__ ，是因?yàn)?這樣放的話，對(duì)內(nèi)存的要求會(huì)降低很多，我們只是將數(shù)據(jù)的路徑導(dǎo)入了內(nèi)存中，當(dāng)需要讀取這個(gè)圖片數(shù)據(jù)時(shí)，再讀取，這樣更像是隨用隨取。如果將這部分放到 __init__ 里面，會(huì)一次將圖片數(shù)據(jù)都加載到內(nèi)存中，如果數(shù)據(jù)量太大，會(huì)直接卡死。

2.Dataset 類(lèi) 返回的數(shù)據(jù) 類(lèi)型是與你讀取時(shí)的類(lèi)型一致的。但是在 pytorch使用時(shí)，會(huì)提示