.. _sec_ndarray: Manipulação de Dados ==================== Para fazer qualquer coisa, precisamos de alguma forma de armazenar e manipular dados. Geralmente, há duas coisas importantes que precisamos fazer com os dados: (i) adquirir eles; e (ii) processá-los assim que estiverem dentro do computador. Não há sentido em adquirir dados sem alguma forma de armazená-los, então vamos brincar com dados sintéticos. Para começar, apresentamos o *array* :math:`n`-dimensional, também chamado de *tensor*. Se você trabalhou com NumPy, o mais amplamente utilizado pacote de computação científica em Python, então você achará esta seção familiar. Não importa qual estrutura você usa, sua *classe de tensor* (``ndarray`` em MXNet, ``Tensor`` em PyTorch e TensorFlow) é semelhante ao\ ``ndarray`` do NumPy com alguns recursos interessantes. Primeiro, a GPU é bem suportada para acelerar a computação enquanto o NumPy suporta apenas computação de CPU. Em segundo lugar, a classe tensor suporta diferenciação automática. Essas propriedades tornam a classe tensor adequada para aprendizado profundo. Ao longo do livro, quando dizemos tensores, estamos nos referindo a instâncias da classe tensorial, a menos que seja declarado de outra forma. Iniciando --------- Nesta seção, nosso objetivo é colocá-lo em funcionamento, equipando você com as ferramentas básicas de matemática e computação numérica que você desenvolverá conforme progride no livro. Não se preocupe se você lutar para grocar alguns dos os conceitos matemáticos ou funções de biblioteca. As seções a seguir revisitarão este material no contexto de exemplos práticos e irá afundar. Por outro lado, se você já tem alguma experiência e quiser se aprofundar no conteúdo matemático, basta pular esta seção. .. raw:: html

.. raw:: html

Para começar, importamos o ``np`` (``numpy``) e Módulos ``npx`` (``numpy_extension``) da MXNet. Aqui, o módulo ``np`` inclui funções suportadas por NumPy, enquanto o módulo ``npx`` contém um conjunto de extensões desenvolvido para capacitar o *Deep Learning* em um ambiente semelhante ao NumPy. Ao usar tensores, quase sempre invocamos a função ``set_np``: isso é para compatibilidade de processamento de tensor por outros componentes do MXNet. .. code:: python from mxnet import np, npx npx.set_np() .. raw:: html

.. raw:: html

Para começar, importamos ``torch``. Note que apesar de ser chamado PyTorch, devemos importar ``torch`` ao invés de ``pytorch``. .. code:: python import torch .. raw:: html

.. raw:: html

Importamos ``tensorflow``. Como o nome é longo, importamos abreviando ``tf``. .. code:: python import tensorflow as tf .. raw:: html

.. raw:: html

Um tensor representa uma matriz (possivelmente multidimensional) de valores numéricos. Com uma dimensão, um tensor corresponde (em matemática) a um *vetor*. Com duas dimensões, um tensor corresponde a uma \* matriz \*. Tensores com mais de dois eixos não possuem nomes matemáticos. Para começar, podemos usar ``arange`` para criar um vetor linha ``x`` contendo os primeiros 12 inteiros começando com 0, embora eles sejam criados como *float* por padrão. Cada um dos valores em um tensor é chamado de *elemento* do tensor. Por exemplo, existem 12 elementos no tensor ``x``. A menos que especificado de outra forma, um novo tensor será armazenado na memória principal e designado para computação baseada em CPU. .. raw:: html