.. raw:: html

.. code:: python from mxnet import np, npx from mxnet.gluon import nn npx.set_np() def get_net(): net = nn.Sequential() net.add(nn.Dense(256, activation='relu')) net.add(nn.Dense(10)) return net net = get_net() .. raw:: html

.. raw:: html

.. code:: python import tensorflow as tf net = tf.keras.models.Sequential([ tf.keras.layers.Dense(256, activation=tf.nn.relu), tf.keras.layers.Dense(10), ]) .. raw:: html

.. raw:: html

mxnet tensorflow

.. raw:: html

.. code:: python print(net.collect_params) print(net.collect_params()) .. parsed-literal:: :class: output 256, Activation(relu)) (1): Dense(-1 -> 10, linear) )> sequential0_ ( Parameter dense0_weight (shape=(256, -1), dtype=float32) Parameter dense0_bias (shape=(256,), dtype=float32) Parameter dense1_weight (shape=(10, -1), dtype=float32) Parameter dense1_bias (shape=(10,), dtype=float32) ) Observe que, embora os objetos de parâmetro existam, a dimensão de entrada para cada camada é listada como -1. MXNet usa o valor especial -1 para indicar que a dimensão do parâmetro permanece desconhecida. Neste ponto, tenta acessar ``net [0].weight.data()`` desencadearia um erro de tempo de execução informando que a rede deve ser inicializado antes que os parâmetros possam ser acessados. Agora vamos ver o que acontece quando tentamos inicializar parâmetros por meio da função ``initialize``. .. code:: python net.initialize() net.collect_params() .. parsed-literal:: :class: output sequential0_ ( Parameter dense0_weight (shape=(256, -1), dtype=float32) Parameter dense0_bias (shape=(256,), dtype=float32) Parameter dense1_weight (shape=(10, -1), dtype=float32) Parameter dense1_bias (shape=(10,), dtype=float32) ) Como podemos ver, nada mudou. Quando as dimensões de entrada são desconhecidas, chamadas para inicializar não inicializam corretamente os parâmetros. Em vez disso, esta chamada se registra no MXNet que desejamos (e opcionalmente, de acordo com qual distribuição) para inicializar os parâmetros. .. raw:: html

.. raw:: html

.. code:: python [net.layers[i].get_weights() for i in range(len(net.layers))] .. parsed-literal:: :class: output [[], []] Observe que cada objeto de camada existe, mas os pesos estão vazios. Usar ``net.get_weights()`` geraria um erro, uma vez que os pesos ainda não foram inicializados. .. raw:: html

.. raw:: html

mxnet tensorflow

.. raw:: html

.. code:: python X = np.random.uniform(size=(2, 20)) net(X) net.collect_params() .. parsed-literal:: :class: output sequential0_ ( Parameter dense0_weight (shape=(256, 20), dtype=float32) Parameter dense0_bias (shape=(256,), dtype=float32) Parameter dense1_weight (shape=(10, 256), dtype=float32) Parameter dense1_bias (shape=(10,), dtype=float32) ) .. raw:: html

.. raw:: html

.. code:: python X = tf.random.uniform((2, 20)) net(X) [w.shape for w in net.get_weights()] .. parsed-literal:: :class: output [(20, 256), (256,), (256, 10), (10,)] .. raw:: html

.. raw:: html