Thiết kế website giá rẻ

Question

I am a beginner in python machine learning, and I am making a program that makes a image noisy and then my program outputs a reconstructed image. I am using additive white gaussian noise and using a Feed Forward Neural Network. I have my program display the true image, the noisy image, and the reconstructed image. These are the results I usually get.

Does anyone know how to fix such an issue? Here is my code:

app.py

from flask_cors import CORS
import gradio as gr
from mnist_denoising import train_model

app = Flask(__name__)
CORS(app)

@app.route('/train', methods=['POST'])
def train():
    try:
        data = request.get_json()
        dataset_name = data['dataset_name']
        noise_level = data['noise_level']
        model_type = "Feed Forward Neural Network"  # Since only one reconstruction model is available

        true_image, noisy_image, reconstructed_image = train_model(dataset_name, noise_level, model_type)
        return jsonify({
            "true_image": true_image,
            "noisy_image": noisy_image,
            "reconstructed_image": reconstructed_image
        })
    except Exception as e:
        return jsonify({"error": str(e)}), 400

def gradio_interface():
    def gradio_train_model(dataset_name, simulation, reconstruction_model, noise_level):
        true_image, noisy_image, reconstructed_image = train_model(dataset_name, noise_level, reconstruction_model)
        return true_image, noisy_image, reconstructed_image

    iface = gr.Interface(
        fn=gradio_train_model,
        inputs=[
            gr.Dropdown(choices=["MNIST", "CIFAR10", "PathMNIST", "DermaMNIST", "OrganAMNIST"], label="Dataset"),
            gr.Dropdown(choices=["AWGN"], label="Simulation Model"),
            gr.Dropdown(choices=["Feed Forward Neural Network"], label="Reconstruction Model"),
            gr.Slider(minimum=0.0, maximum=1.0, step=0.1, label="Noise Level")
        ],
        outputs=[gr.Image(label="True Image"), gr.Image(label="Noisy Image"), gr.Image(label="Reconstructed Image")]
    )

    iface.launch()

if __name__ == '__main__':
    gradio_interface()
    app.run(debug=True)

model.py

import torch
import torch.nn as nn
import torchvision.datasets as datasets
import torchvision.transforms as transforms
from medmnist import INFO, Evaluator
from medmnist.dataset import PathMNIST, DermaMNIST, OrganAMNIST

class DenseNet(nn.Module):
    def __init__(self, input_shape, output_shape, hidden_channels_list, activation='relu'):
        super(DenseNet, self).__init__()
        self.input_shape = input_shape
        self.output_shape = output_shape

        self.input_size = int(torch.prod(torch.tensor(input_shape)))
        self.output_size = int(torch.prod(torch.tensor(output_shape)))

        layers = []
        if isinstance(activation, str):
            activation = [activation] * len(hidden_channels_list)
        elif isinstance(activation, list) and len(activation) != len(hidden_channels_list):
            raise ValueError("Length of activation functions list must match the length of hidden_channels_list")

        in_size = self.input_size
        for out_size, act in zip(hidden_channels_list, activation):
            layers.append(nn.Linear(in_size, out_size))
            layers.append(nn.BatchNorm1d(out_size))
            layers.append(self.get_activation(act))
            in_size = out_size

        layers.append(nn.Linear(in_size, self.output_size))
        self.model = nn.Sequential(*layers)

    def forward(self, x):
        batch_shape = x.shape[:-len(self.input_shape)]
        batch_size = int(torch.prod(torch.tensor(batch_shape)))
        x = x.view(batch_size, self.input_size)  # Ensure the input is reshaped correctly

        for layer in self.model:
            if isinstance(layer, nn.BatchNorm1d) and batch_size == 1:
                continue  # Skip BatchNorm layers for batch size 1
            x = layer(x)

        x = x.view(*batch_shape, *self.output_shape)
        return x

    def get_activation(self, activation):
        if activation == 'relu':
            return nn.ReLU()
        elif activation == 'prelu':
            return nn.PReLU()
        elif activation == 'leaky_relu':
            return nn.LeakyReLU()
        elif activation == 'sigmoid':
            return nn.Sigmoid()
        elif activation == 'tanh':
            return nn.Tanh()
        else:
            raise ValueError(f"Unsupported activation function: {activation}")

def get_densenet_model(model_type, input_shape):
    if model_type == "DenseNetSmall":
        return DenseNet(input_shape=input_shape, output_shape=input_shape, hidden_channels_list=[1024])
    elif model_type == "DenseNetLarge":
        return DenseNet(input_shape=input_shape, output_shape=input_shape, hidden_channels_list=[1024, 2048, 1024])
    elif model_type == "Feed Forward Neural Network":
        return DenseNet(input_shape=input_shape, output_shape=input_shape, hidden_channels_list=[1024, 2048, 1024])
    else:
        raise ValueError("Unsupported model type")

def get_dataset(dataset_name):
    transform = transforms.Compose([transforms.ToTensor()])
    root_dir = 'data'
    
    if dataset_name == "MNIST":
        return datasets.MNIST(root=os.path.join(root_dir, 'mnist'), train=True, transform=transform, download=True)
    elif dataset_name == "CIFAR10":
        return datasets.CIFAR10(root=os.path.join(root_dir, 'cifar10'), train=True, transform=transform, download=True)
    elif dataset_name == "PathMNIST":
        dataset_dir = os.path.join(root_dir, 'pathmnist')
        os.makedirs(dataset_dir, exist_ok=True)
        return PathMNIST(root=dataset_dir, split='train', transform=transform, download=True)
    elif dataset_name == "DermaMNIST":
        dataset_dir = os.path.join(root_dir, 'dermamnist')
        os.makedirs(dataset_dir, exist_ok=True)
        return DermaMNIST(root=dataset_dir, split='train', transform=transform, download=True)
    elif dataset_name == "OrganAMNIST":
        dataset_dir = os.path.join(root_dir, 'organamnist')
        os.makedirs(dataset_dir, exist_ok=True)
        return OrganAMNIST(root=dataset_dir, split='train', transform=transform, download=True)
    else:
        raise ValueError("Unsupported dataset")

def add_awgn_noise(image, noise_level=0.1):
    noise = noise_level * torch.randn_like(image)
    noisy_image = image + noise
    return noisy_image

mnist_denoising.py

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader
from model import get_densenet_model, add_awgn_noise, get_dataset
import torchvision.transforms as transforms

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

def train_model(dataset_name, noise_level, model_type, epochs=300, batch_size=64, learning_rate=1e-4):
    dataset = get_dataset(dataset_name)
    dataloader = DataLoader(dataset, batch_size=batch_size, shuffle=True)

    if dataset_name == "MNIST":
        input_shape = (1, 28, 28)
    elif dataset_name == "CIFAR10":
        input_shape = (3, 32, 32)
    elif dataset_name in ["PathMNIST", "DermaMNIST", "OrganAMNIST"]:
        input_shape = (3, 28, 28)

    model = get_densenet_model(model_type, input_shape).to(device)  

    optimizer = optim.Adam(model.parameters(), lr=learning_rate)
    loss_fn = nn.MSELoss()

    for epoch in range(epochs):
        model.train()
        for images, _ in dataloader:
            images = images.to(device)
            noisy_images = add_awgn_noise(images, noise_level).to(device)

            outputs = model(noisy_images)
            loss = loss_fn(outputs, images)

            optimizer.zero_grad()
            loss.backward()
            optimizer.step()

        print(f'Epoch [{epoch + 1}/{epochs}], Loss: {loss.item():.4f}')

    # Get a sample image from the dataset
    sample_image, _ = dataset[0]
    noisy_sample_image = add_awgn_noise(sample_image.unsqueeze(0).to(device), noise_level)
    reconstructed_image = model(noisy_sample_image).detach().squeeze(0)

    # Transform the tensor to a displayable image format
    to_pil = transforms.ToPILImage()
    sample_image_pil = to_pil(sample_image)
    noisy_image_pil = to_pil(noisy_sample_image.cpu().squeeze(0))
    reconstructed_image_pil = to_pil(reconstructed_image.cpu())

    return sample_image_pil, noisy_image_pil, reconstructed_image_pil

Thiết kế website giá rẻ

Danh mục

Not getting desired reconstructed image with python image denoising