13. Visão Computacional¶
Muitas aplicações na área de visão computacional estão intimamente relacionadas às nossas vidas diárias, agora e no futuro, sejam diagnósticos médicos, veículos sem motorista, monitoramento de câmeras ou filtros inteligentes. Nos últimos anos, a tecnologia de aprendizado profundo melhorou muito o desempenho dos sistemas de visão computacional. Pode-se dizer que as aplicações de visão computacional mais avançadas são quase inseparáveis do aprendizado profundo.
Introduzimos modelos de aprendizagem profunda comumente usados na área de visão computacional no capítulo “Redes Neurais Convolucionais” e praticamos tarefas simples de classificação de imagens. Neste capítulo, apresentaremos os métodos de aumento e ajuste fino de imagens e os aplicaremos à classificação de imagens. Em seguida, exploraremos vários métodos de detecção de objetos. Depois disso, aprenderemos como usar redes totalmente convolucionais para realizar segmentação semântica em imagens. Em seguida, explicamos como usar a tecnologia de transferência de estilo para gerar imagens que se parecem com a capa deste livro. Finalmente, realizaremos exercícios práticos em dois importantes conjuntos de dados de visão computacional para revisar o conteúdo deste capítulo e dos capítulos anteriores.
- 13.1. Aumento de Imagem
- 13.2. Ajustes
- 13.3. Detecção de Objetos e Caixas Delimitadoras
- 13.4. Caixas de Âncora
- 13.5. Detecção de Objetos Multiescala
- 13.6. O Dataset de Detecção de Objetos
- 13.7. Detecção Single Shot Multibox (SSD)
- 13.8. Region-based CNNs (R-CNNs)
- 13.9. Segmentação Semântica e o Dataset
- 13.10. Convolução Transposta
- 13.11. Redes Totalmente Convolucionais (Fully Convolutional Networks, FCN)
- 13.12. Transferência de Estilo Neural
- 13.13. Classificação de Imagens (CIFAR-10) no Kaggle
- 13.13.1. Obtendo e Organizando o Dataset
- 13.13.2. Aumento de Imagem
- 13.13.3. Lendo o Dataset
- 13.13.4. Definindo o Modelo
- 13.13.5. Definindo as Funções de Treinamento
- 13.13.6. Treinamento e Validação do Modelo
- 13.13.7. Classificando o Conjunto de Testes e Enviando Resultados no Kaggle
- 13.13.8. Resumo
- 13.13.9. Exercícios
- 13.14. Identificação de Raça de Cachorro (ImageNet Dogs) no Kaggle
- 13.14.1. Obtenção e organização do Dataset
- 13.14.2. Aumento de Imagem
- 13.14.3. Lendo o Dataset
- 13.14.4. Definindo o Modelo
- 13.14.5. Definindo as Funções de Treinamento
- 13.14.6. Treinamento e Validação do Modelo
- 13.14.7. Classificando o Conjunto de Testes e Enviando Resultados no Kaggle
- 13.14.8. Resumo
- 13.14.9. Exercícios