[신경망기초] 심층신경망개요jaypi Ko신경망의 층이 늘어났을 때 (즉 신경망이 깊어졌을 때), 학습의 어려움을 해소하기 위해 제시된 선행학습 관점에서 DBN과 AE를 소개합니다. 또한 다른 접근법으로 문제를 해소하여 뒤 늦게 심층 신경망으로 간주되고 있는 CNN을 소개합니다.
DBN에 사용된 RBM, AE는 GAN과 더블어 비교사학습 방법을 이끄는 삼두마차입니다. CNN은 영상학습 분야의 단연 절대강자입니다.
(Paper Review)Kernel predicting-convolutional-networks-for-denoising-monte-ca...MYEONGGYU LEEreview date: 2017/12/5 (by Meyong-Gyu.LEE @Soongsil Univ.)
Korean Paper review of 'Kernel Predicting Convolutional Networks for Denoising Monte Carlo Renderings'(Siggraph2017)
Deep Learning Into Advance - 1. Image, ConvNetHyojun Kim[본 자료는 AB180 사내 스터디의 일환으로 제작되었습니다.]
딥러닝에 대한 기초적인 이해 및 적용 예시를 알아보고, 인사이트를 공유하기 위해 만들었습니다. 첫번째로 딥러닝이 이미지 프로세싱에 적용된 방식 및, Convolutional Neural Network (ConvNet)의 기초에 대해 다루었습니다.
* 본 스터디 자료는 Stanford 강좌인 CS231n (http://cs231n.stanford.edu)의 내용을 참고했습니다.
Image net classification with deep convolutional neural networks Korea, Sejong University.Paper review : Image net classification with deep convolutional neural networks
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...태엽 김Progressive Growing of GANs for Improved Quality, Stability, and Variation
Karras, Tero
Aila, Timo
Laine, Samuli
Lehtinen, Jaakko
모두의 연구소 GAN찮아 논문 리뷰 발표 자료
[Paper Review] Image captioning with semantic attentionHyeongmin Lee이번 세미나에서는 Quanzeng You의 CVPR 논문인 [Image Captioning with Semantic Attention]에 대한 리뷰를 하려고 합니다. Image Captioning은 인공지능 학계의 거대한 두 흐름인 ‘Computer Vision(컴퓨터 비전)’과 ‘Natural Language Processing(자연어 처리)’를 연결하는, 매우 중요한 의의를 갖는 연구 분야입니다.
Image Captioning의 접근 방식은 크게 ‘Top-Down Approach’와 ‘Bottom-Up Approach’로 구분됩니다. Top-Down Approach에서는 이미지를 통째로 시스템에 통과 시켜서 얻은 ‘요점’을 언어로 변환하는 반면 Bottom-Up Approach에서는 이미지의 다양한 부분들로부터 단어들을 도출해내고, 이를 결합하여 문장을 얻어냅니다. 논문에서는 이러한 Top-Down Approach와 Bottom-Up Approach의 장점을 합해서 Image Captioning 성능을 올리고자 합니다. 이 때 사용되는 개념이 바로 Visual Attention입니다.
Visual Attention은 말 그대로 이미지의 특정 부분에 집중하는 것입니다. 사람이 이미지의 모든 내용을 전부 묘사하지 않는 것처럼, 컴퓨터도 이미지에서 특히 중요한 부분에 자원을 집중하는 형태의 노력이 필요합니다. Visual Attention을 통해서 컴퓨터는 이미지의 특히 중요한 부분에 집중하고, 더 자세히 묘사하게 됩니다. 본 세미나에서는 Visual Attention이 어떠한 방식으로 Image Captioning에 적용되는지 살펴보도록 하겠습니다.
[Paper] shuffle net an extremely efficient convolutional neural network for ...Susang Kim[Paper] shuffle net an extremely efficient convolutional neural network for mobile devices
[paper review] 손규빈 - Eye in the sky & 3D human pose estimation in video with ...Gyubin Son1. Eye in the Sky: Real-time Drone Surveillance System (DSS) for Violent Individuals Identification using ScatterNet Hybrid Deep Learning Network
https://arxiv.org/abs/1806.00746
2. 3D human pose estimation in video with temporal convolutions and semi-supervised training
https://arxiv.org/abs/1811.11742
More Related Content
Similar to [데이터 분석 소모임] Convolution Neural Network 김려린 (20)
Image net classification with deep convolutional neural networks Korea, Sejong University.Paper review : Image net classification with deep convolutional neural networks
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...태엽 김Progressive Growing of GANs for Improved Quality, Stability, and Variation
Karras, Tero
Aila, Timo
Laine, Samuli
Lehtinen, Jaakko
모두의 연구소 GAN찮아 논문 리뷰 발표 자료
[Paper Review] Image captioning with semantic attentionHyeongmin Lee이번 세미나에서는 Quanzeng You의 CVPR 논문인 [Image Captioning with Semantic Attention]에 대한 리뷰를 하려고 합니다. Image Captioning은 인공지능 학계의 거대한 두 흐름인 ‘Computer Vision(컴퓨터 비전)’과 ‘Natural Language Processing(자연어 처리)’를 연결하는, 매우 중요한 의의를 갖는 연구 분야입니다.
Image Captioning의 접근 방식은 크게 ‘Top-Down Approach’와 ‘Bottom-Up Approach’로 구분됩니다. Top-Down Approach에서는 이미지를 통째로 시스템에 통과 시켜서 얻은 ‘요점’을 언어로 변환하는 반면 Bottom-Up Approach에서는 이미지의 다양한 부분들로부터 단어들을 도출해내고, 이를 결합하여 문장을 얻어냅니다. 논문에서는 이러한 Top-Down Approach와 Bottom-Up Approach의 장점을 합해서 Image Captioning 성능을 올리고자 합니다. 이 때 사용되는 개념이 바로 Visual Attention입니다.
Visual Attention은 말 그대로 이미지의 특정 부분에 집중하는 것입니다. 사람이 이미지의 모든 내용을 전부 묘사하지 않는 것처럼, 컴퓨터도 이미지에서 특히 중요한 부분에 자원을 집중하는 형태의 노력이 필요합니다. Visual Attention을 통해서 컴퓨터는 이미지의 특히 중요한 부분에 집중하고, 더 자세히 묘사하게 됩니다. 본 세미나에서는 Visual Attention이 어떠한 방식으로 Image Captioning에 적용되는지 살펴보도록 하겠습니다.
[Paper] shuffle net an extremely efficient convolutional neural network for ...Susang Kim[Paper] shuffle net an extremely efficient convolutional neural network for mobile devices
[paper review] 손규빈 - Eye in the sky & 3D human pose estimation in video with ...Gyubin Son1. Eye in the Sky: Real-time Drone Surveillance System (DSS) for Violent Individuals Identification using ScatterNet Hybrid Deep Learning Network
https://arxiv.org/abs/1806.00746
2. 3D human pose estimation in video with temporal convolutions and semi-supervised training
https://arxiv.org/abs/1811.11742
3. 3
Deep Neural Network
DNN은 기존의 Neural Network와 다르게 은닉층이 여러 개 존재하여 비선형
관계를 학습하는데 적합함
01. 신경망
DNN이란? 입력층과 출력층 사이에 여러 개의 은닉층들로 이루어진 인공신경망
01. Input Layer 02. Hidden Layer 03. Output Layer
입력값 전달
• 입력값들을 받아
Hidden Layer에
전달하는 노드들로 구성된 Layer
비선형 관계 학습
• Input Layer와 Output Layer
사이에 존재하는 Layer
• 데이터의 패턴을 찾는 역할을 함
예측 결과 출력
• 예측 결과를 출력하는 노드들로
구성된 Layer
Output
Layer
Input
Layer
Hidden Layer
Deep Neural Network
4. 4
Convolution Neural Network
CNN이란 이미지 데이터를 처리할때 발생하는 문제점을 보완한 방법으로
Convolution Layer와 Fully Connected Layer로 이루어짐
02. CNN 설명
데이터 손실
DNN은 1차원 형태의 데이터를 사용하여
이미지 데이터가 손실이 생김
이미지특성감지
CNN의 Convolution Layer가 입력이미지에대한
특성을감지하기위해커널을 사용
DNN의 한계
01
CNN 구성
02
이미지가 무엇을 의미하는 데이터인지 분류
Flatten Layer, Softmax Layer로 구성
데이터의 특징을 추출하여 특징들의 패턴을 파악
Convolution Layer, Pooling Layer로 구성
Feature Learning
Classification
5. 5
Convolution Layer
합성곱 계층은 입력되는 이미지에 필터를 적용하여 출력 이미지를 생성하고,
풀링층에서 연산량을 줄여 새로운 값을 구성함
02. CNN 설명
• 하나의 합성곱 계층에는 입력되는 이미지의
채널 개수만큼 필터가 존재
01 Convolution Layer에 Filter 적용
• 입력 이미지의 가장자리에 특정 값으로 설정된
픽셀들을 추가함으로써 입력 이미지와 출력
이미지의 크기를 비슷하게 만듦
• 합성곱 계층을 거치면서 이미지의 가장자리에
위치한 픽셀들의 정보 사라지게 됨
02 Padding 적용
목적
• 이미지 크기를 그대로 유지한 채
Fully Connected Layer로 가게된다면
연산량이 기하급수적으로 증가함
특징
• Matrix에서 특정값을 가져와서
새롭게 구성
03 Pooling Layer
* =
filter
이미지에 대해 필터를 적용할 때는 필터의 이동량
Stride
• 각 채널에 할당된 필터를 적용함으로써
합성곱 계층의 출력 이미지 생성
Zero Padding
이미지 주위를 0으로
둘러싸주는 과정
10 21
6 8
Max Pooling
2x2에서 최대값
선택하여 Matrix 생성
이미지의 특징을 찾아내는 것
0 1 7 5
5 5 6 6
5 3 3 0
1 1 1 2
1 0 1
1 2 0
3 0 1
40 32
26 25
7 5 0 3
10 4 21 2
6 1 7 0
5 0 8 4
6. 6
Fully Connected Layer
Flatten Layer에서 1차원 데이터로 변경 후 Softmax Layer에서 일정한 값으
로 변환하여 Output Layer에서 값이 분류됨
02. CNN 설명
Flatten
Layer
Softmax
Layer
Output
Layer
2차원 데이터로 이루어져 있지만
분류를 위한 학습을 위해 1차원
데이터로 바꾸어 학습
Softmax layer
추출된 특징 값을
소프트맥스 함수를 통해
일정한 값으로 변환
변환된 값들의 합 1이 되어,
제일 높은 값이 분류 대상이 됨
데이터 평탄화함으로써,
다양한 층에서
학습 가능해짐
1 1 0
4 2 1
0 2 1
1
1
0
4
2
1
0
2
1
Flattening
DropOut Layer
랜덤하게 뉴런을 꺼내서 학습을
방해함으로써, 과적합 방지
Softmax
Function
DropOut
자동차
1
1
0
4
2
1
0
2
1
X
X
X
X
자전거
0.7
0.3
7. 7
CNN Code
Fashion MNIST Data 운동화, 셔츠, 샌들과 같은 작은 이미지들을 가지고
DNN, CNN 모델에 적용하여 Accuracy를 확인함
03. 구현
Fashion MNIST Data
운동화, 셔츠, 샌들과 같은
작은 이미지들의 모음
83
85
87
100
83.41
85.01
84.93
86.48
DNN 적용
3000
2000
1000
500
단위 : %
80
85
90
100
89.56
90.04
89.18 89.00
CNN 적용
3000
2400
1800
600
단위 : %