4.3. Implementação Concisa de Perceptrons Multicamadas¶

Open the notebook in Colab

Open the notebook in Colab

Open the notebook in Colab

Open the notebook in SageMaker Studio Lab

As you might expect, by relying on the high-level APIs, we can implement MLPs even more concisely.

from mxnet import gluon, init, npx
from mxnet.gluon import nn
from d2l import mxnet as d2l

npx.set_np()

import torch
from torch import nn
from d2l import torch as d2l

import tensorflow as tf
from d2l import tensorflow as d2l

4.3.1. Modelo¶

Em comparação com nossa implementação concisa de implementação de regressão softmax (Section 3.7), a única diferença é que adicionamos duas camadas totalmente conectadas (anteriormente, adicionamos uma). A primeira é nossa camada oculta, que contém 256 unidades ocultas e aplica a função de ativação ReLU. A segunda é nossa camada de saída.

mxnet pytorch tensorflow

net = nn.Sequential()
net.add(nn.Dense(256, activation='relu'),
        nn.Dense(10))
net.initialize(init.Normal(sigma=0.01))

net = nn.Sequential(nn.Flatten(),
                    nn.Linear(784, 256),
                    nn.ReLU(),
                    nn.Linear(256, 10))

def init_weights(m):
    if type(m) == nn.Linear:
        nn.init.normal_(m.weight, std=0.01)

net.apply(init_weights);

net = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(256, activation='relu'),
    tf.keras.layers.Dense(10)])

O loop de treinamento é exatamente o mesmo como quando implementamos a regressão softmax. Essa modularidade nos permite separar questões relativas à arquitetura do modelo a partir de considerações ortogonais.

mxnet pytorch tensorflow

batch_size, lr, num_epochs = 256, 0.1, 10
loss = gluon.loss.SoftmaxCrossEntropyLoss()
trainer = gluon.Trainer(net.collect_params(), 'sgd', {'learning_rate': lr})

train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)

../_images/output_mlp-concise_f87756_27_0.svg

batch_size, lr, num_epochs = 256, 0.1, 10
loss = nn.CrossEntropyLoss()
trainer = torch.optim.SGD(net.parameters(), lr=lr)

train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)

../_images/output_mlp-concise_f87756_30_0.svg

batch_size, lr, num_epochs = 256, 0.1, 10
loss = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)
trainer = tf.keras.optimizers.SGD(learning_rate=lr)

train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)

../_images/output_mlp-concise_f87756_33_0.svg

4.3.2. Resumo¶

Usando APIs de alto nível, podemos implementar MLPs de forma muito mais concisa.
Para o mesmo problema de classificação, a implementação de um MLP é a mesma da regressão softmax, exceto para camadas ocultas adicionais com funções de ativação.

4.3.3. Exercícios¶

Tente adicionar diferentes números de camadas ocultas (você também pode modificar a taxa de aprendizagem). Qual configuração funciona melhor?
Experimente diferentes funções de ativação. Qual funciona melhor?
Experimente diferentes esquemas para inicializar os pesos. Qual método funciona melhor?

mxnet pytorch tensorflow

Discussions

4.3. Implementação Concisa de Perceptrons Multicamadas¶ Colab [mxnet] Open the notebook in Colab Colab [pytorch] Open the notebook in Colab Colab [tensorflow] Open the notebook in Colab SageMaker Studio Lab Open the notebook in SageMaker Studio Lab

4.3.1. Modelo¶

4.3.2. Resumo¶

4.3.3. Exercícios¶

4.3. Implementação Concisa de Perceptrons Multicamadas¶

Open the notebook in Colab

Open the notebook in Colab

Open the notebook in Colab

Open the notebook in SageMaker Studio Lab