DataLoader.py

import glob
import os

import numpy as np
import torch.utils.data.dataset
from torch.utils.data import Dataset
from torch.utils.data import DataLoader
from torchvision import transforms
from PIL import Image

import ex4

IMG_SIZE = 100


class ImageDataset(Dataset):
    def __init__(self, image_dir, precision: np.float32 or np.float64):
        self.image_files = sorted(glob.glob(os.path.join(image_dir, "**", "*.jpg"), recursive=True))
        self.precision = precision

    def __getitem__(self, index):
        # Open image file, convert to numpy array and scale to [0, 1]
        target_image = Image.open(self.image_files[index])

        target_image = preprocess(target_image, self.precision)

        # calculate image with black grid
        doomed_image = ex4.ex4(target_image, (5, 5), (4, 4))

        # convert image to grayscale
        # target_image = rgb2gray(target_image)  # todo look if gray image makes sense

        return doomed_image[0], np.transpose(target_image, (2, 0, 1))

    def __len__(self):
        return len(self.image_files)


def preprocess(input: np.array, precision: np.float32 or np.float64) -> np.array:
    # image = np.array(Image.open(self.image_files[index]), dtype=np.float32) / 255
    resize_transforms = transforms.Compose([
        transforms.Resize(size=IMG_SIZE),
        transforms.CenterCrop(size=(IMG_SIZE, IMG_SIZE)),
    ])
    input = resize_transforms(input)

    # normalize image from 0-1
    target_image = np.array(input, dtype=precision) / 255.0

    # Perform normalization for each channel
    # image = (image - self.norm_mean) / self.norm_std

    return target_image


# postprecess should be the inverese function of preprocess!
def postprocess(input: np.array) -> np.array:
    target_image = (input * 255.0).astype(np.uint8)
    return target_image


def get_image_loader(path: str, precision: np.float32 or np.float64):
    image_dataset = ImageDataset(path, precision)
    totlen = len(image_dataset)

    test_set_size = .1
    trains, tests = torch.utils.data.dataset.random_split(image_dataset, lengths=(totlen - int(totlen * test_set_size),
                                                                                  int(totlen * test_set_size)),
                                                          generator=torch.Generator().manual_seed(0))

    train_loader = DataLoader(
        trains,
        shuffle=True,  # shuffle the order of our samples
        batch_size=25,  # stack 4 samples to a minibatch
        num_workers=4  # no background workers (see comment below)
    )

    test_loader = DataLoader(
        tests,
        shuffle=True,  # shuffle the order of our samples
        batch_size=5,  # stack 4 samples to a minibatch
        num_workers=0  # no background workers (see comment below)
    )

    return train_loader, test_loader
implement basic structure of project 2022-06-01 12:27:58 +02:00			`import glob`
			`import os`

			`import numpy as np`
implmente save/load, eval structure 2022-06-01 16:07:32 +02:00			`import torch.utils.data.dataset`
implement basic structure of project 2022-06-01 12:27:58 +02:00			`from torch.utils.data import Dataset`
			`from torch.utils.data import DataLoader`
basic training logic 2022-06-28 18:28:36 +02:00			`from torchvision import transforms`
			`from PIL import Image`

			`import ex4`

			`IMG_SIZE = 100`
implement basic structure of project 2022-06-01 12:27:58 +02:00

			`class ImageDataset(Dataset):`
saving of model 2022-07-01 15:35:12 +02:00			`def __init__(self, image_dir, precision: np.float32 or np.float64):`
implement basic structure of project 2022-06-01 12:27:58 +02:00			`self.image_files = sorted(glob.glob(os.path.join(image_dir, "*", ".jpg"), recursive=True))`
saving of model 2022-07-01 15:35:12 +02:00			`self.precision = precision`
implement basic structure of project 2022-06-01 12:27:58 +02:00
			`def __getitem__(self, index):`
			`# Open image file, convert to numpy array and scale to [0, 1]`
basic training logic 2022-06-28 18:28:36 +02:00			`target_image = Image.open(self.image_files[index])`
saving of model 2022-07-01 15:35:12 +02:00
			`target_image = preprocess(target_image, self.precision)`
basic training logic 2022-06-28 18:28:36 +02:00
			`# calculate image with black grid`
			`doomed_image = ex4.ex4(target_image, (5, 5), (4, 4))`

			`# convert image to grayscale`
			`# target_image = rgb2gray(target_image) # todo look if gray image makes sense`

			`return doomed_image[0], np.transpose(target_image, (2, 0, 1))`
implement basic structure of project 2022-06-01 12:27:58 +02:00
			`def __len__(self):`
			`return len(self.image_files)`


saving of model 2022-07-01 15:35:12 +02:00			`def preprocess(input: np.array, precision: np.float32 or np.float64) -> np.array:`
			`# image = np.array(Image.open(self.image_files[index]), dtype=np.float32) / 255`
			`resize_transforms = transforms.Compose([`
			`transforms.Resize(size=IMG_SIZE),`
			`transforms.CenterCrop(size=(IMG_SIZE, IMG_SIZE)),`
			`])`
			`input = resize_transforms(input)`

add lots of validation code and correct saving of pickle file 2022-06-29 17:20:16 +02:00			`# normalize image from 0-1`
saving of model 2022-07-01 15:35:12 +02:00			`target_image = np.array(input, dtype=precision) / 255.0`
add lots of validation code and correct saving of pickle file 2022-06-29 17:20:16 +02:00
			`# Perform normalization for each channel`
			`# image = (image - self.norm_mean) / self.norm_std`

			`return target_image`


			`# postprecess should be the inverese function of preprocess!`
			`def postprocess(input: np.array) -> np.array:`
			`target_image = (input * 255.0).astype(np.uint8)`
			`return target_image`


saving of model 2022-07-01 15:35:12 +02:00			`def get_image_loader(path: str, precision: np.float32 or np.float64):`
			`image_dataset = ImageDataset(path, precision)`
implmente save/load, eval structure 2022-06-01 16:07:32 +02:00			`totlen = len(image_dataset)`
add lots of validation code and correct saving of pickle file 2022-06-29 17:20:16 +02:00
saving of model 2022-07-01 15:35:12 +02:00			`test_set_size = .1`
add lots of validation code and correct saving of pickle file 2022-06-29 17:20:16 +02:00			`trains, tests = torch.utils.data.dataset.random_split(image_dataset, lengths=(totlen - int(totlen * test_set_size),`
			`int(totlen * test_set_size)),`
saving of model 2022-07-01 15:35:12 +02:00			`generator=torch.Generator().manual_seed(0))`
implmente save/load, eval structure 2022-06-01 16:07:32 +02:00
			`train_loader = DataLoader(`
			`trains,`
			`shuffle=True, # shuffle the order of our samples`
saving of model 2022-07-01 15:35:12 +02:00			`batch_size=25, # stack 4 samples to a minibatch`
add lots of validation code and correct saving of pickle file 2022-06-29 17:20:16 +02:00			`num_workers=4 # no background workers (see comment below)`
implmente save/load, eval structure 2022-06-01 16:07:32 +02:00			`)`

			`test_loader = DataLoader(`
basic training logic 2022-06-28 18:28:36 +02:00			`tests,`
implmente save/load, eval structure 2022-06-01 16:07:32 +02:00			`shuffle=True, # shuffle the order of our samples`
saving of model 2022-07-01 15:35:12 +02:00			`batch_size=5, # stack 4 samples to a minibatch`
implmente save/load, eval structure 2022-06-01 16:07:32 +02:00			`num_workers=0 # no background workers (see comment below)`
			`)`

			`return train_loader, test_loader`