Adaboost를 이용한 face recognitionYoseop ShinAdaBoost를 이용한 Face Recognition
랩 세미나용이라 디테일하게 모든 정보가 들어있지는 않음.
참고논문
P.Viola & M.Jones, Rapid Object Detection using a Boosted Cascade of Simple Features, 2011 외 다수
시맨틱 소셜 네트워크 분석 사례 소개webscikoreaURI와 RDF에 기반한 분산 데이터의 연계는 기본적으로 그래프 구조를 가지게 된다. 최근에는 RDF 그래프의 생성과 질의 뿐 아니라, 그래프 마이닝에 대해 많은 관심과연구가 진행되고 있다. 본 발표에서는 소셜 네트워크를 RDF 그래프로 표현하고, 이를 마이닝, 추론 함으로, 어떻게 대용량 소셜 네트워크를 효과적 분석할 수있는지 설명한다. 특히, 휴대전화 통화에 기반한 모바일 소셜 네트워크와 e-mail 지식 네트워크 분석이 시맨틱 웹 표준하에 어떻게 구현 가능한지 그 사례 소개와시연을 보인다.
Large data with Scikit-learn - Boston Data Mining Meetup - Alex PerrierAlexis PerrierA presentation of adaptive classification and regression algorithms available in scikit-learn with a Focus on Stochastic Gradient Descent and KNN. Performance examples on 2 Large datasets are presented for SGD, Multinomial Naive Bayes, Perceptron and Passive Aggressive Algorithms.
실시간 빅데이터와 머신 데이터김 한도향후 빅데이터의 주된 소스는 머신데이터가 될 것이다. 머신데이터의 속성은 스트리밍, 실시간이라는 특징을 가진다. 향후 머신데이터는 실시간 빅데이터 솔루션을 통해 우리의 생활로 서서히 스며들 것이다. IoT와 같은 새로운 트렌드에 빅데이터가 어우러지기 위해서도 머신데이터 기반의 실시간 빅데이터 솔루션이 필요하며 이러한 연유로 더욱 각광을 받게 될 것이다.
상용 실시간 빅데이터 솔루션 중 최고의 성능을 자랑하는 로그프레소는 향후 실시간 빅데이터와 머신 데이터에 가장 적합한 솔루션이다.
이 슬라이드는 머신데이터와 로그프레소의 기술을 설명하고 있다.
TensorFlow - La IA detrás de GoogleIsrael BlancasThe document discusses machine learning and TensorFlow. It provides three ways to get started with machine learning of varying complexity: using cloud APIs, retraining existing models, or developing new models. It then discusses Google Cloud machine learning APIs for vision, natural language, speech and translation. It provides examples of using the vision API and mobile vision API. It introduces TensorFlow as an open source machine learning library for research and production with Python and C++ frontends.
실시간 빅데이터와 머신 데이터김 한도향후 빅데이터의 주된 소스는 머신데이터가 될 것이다. 머신데이터의 속성은 스트리밍, 실시간이라는 특징을 가진다. 향후 머신데이터는 실시간 빅데이터 솔루션을 통해 우리의 생활로 서서히 스며들 것이다. IoT와 같은 새로운 트렌드에 빅데이터가 어우러지기 위해서도 머신데이터 기반의 실시간 빅데이터 솔루션이 필요하며 이러한 연유로 더욱 각광을 받게 될 것이다.
상용 실시간 빅데이터 솔루션 중 최고의 성능을 자랑하는 로그프레소는 향후 실시간 빅데이터와 머신 데이터에 가장 적합한 솔루션이다.
이 슬라이드는 머신데이터와 로그프레소의 기술을 설명하고 있다.
TensorFlow - La IA detrás de GoogleIsrael BlancasThe document discusses machine learning and TensorFlow. It provides three ways to get started with machine learning of varying complexity: using cloud APIs, retraining existing models, or developing new models. It then discusses Google Cloud machine learning APIs for vision, natural language, speech and translation. It provides examples of using the vision API and mobile vision API. It introduces TensorFlow as an open source machine learning library for research and production with Python and C++ frontends.
4. 3
다층 인공신경망을 활용한 상품이미지 검색
다층 인공신경망을 활용한 11번가 의류상품 검색
박지민M 전혁준M
5. 4
11번가 의류상품 검색을 위한 중복영상 제거
나상일M
입력영상 라돈변환(sinogram) 이진화 중복 군집화
중복 영상 검출결과
필요성:
- 불필요한 이미지의 색인, 저장, 검색을 줄이기 위해
- 검색결과의 다양성 재고
6. 5
다층 인공신경망을 활용한 상품이미지 검색
다층 인공신경망을 활용한 11번가 의류상품 검색
박지민M 전혁준M
7. 6
다층 인공신경망을 활용한 상품이미지 검출
다층 인공신경망을 활용한 11번가 의류상품 검색
http://175.126.56.112:15002
http://175.126.56.112:15002
김문기M 박준영M
12개의 카테고리에 대한 의류 위치를 검출하기
- 대략 100만장을 학습 데이터로 사용
- 한대의 컴퓨터(gpu)에서 10일 소요
- 5 convolution + 2 fully-connected hidden
검출이란
이미지내에 어떤 물체(what)가
어느 위치(where)에 있는지 찾는
것
8. 7
다층 인공신경망을 활용한 상품이미지 검출
– 카테고리 분류를 위한 네트워크와
물체의 위치를 찾기 위한 네트워크가
CNN 네트워크를 공유하면서 동시에 학습을 수행
(a.k.a Multi-task learning)
다층 인공신경망을 활용한 11번가 의류상품 검색
김문기M 박준영M
CNN
카테고리분류
네트워크
위치검출
네트워크
Cross-entropy loss Regression loss
Gradient flow
Data flow
9. 8
다층 인공신경망을 활용한 상품이미지 검색
다층 인공신경망을 활용한 11번가 의류상품 검색
박지민M 전혁준M
10. 9
검출된 위치에서 해당 의류에 대한 특징추출 모듈 훈련
– 2개의 GPU를 통한 병렬학습수행
(a.k.a data-parallel synchronous stochastic gradient descent)
다층 인공신경망을 활용한 11번가 의류상품 검색
김문기M 박준영M
CNN
원본
data shard
CNN
복사본
data shard
GPU0 GPU1
11. 10
검출된 위치에서 해당 의류에 대한 특징추출 모듈 훈련
– 2개의 GPU를 통한 병렬학습수행
(a.k.a data-parallel synchronous stochastic gradient descent)
다층 인공신경망을 활용한 11번가 의류상품 검색
김문기M 박준영M
CNN
원본
data shard
CNN
복사본
data shard
GPU0 GPU1
12. 11
검출된 위치에서 해당 의류에 대한 특징추출 모듈 훈련
– 2개의 GPU를 통한 병렬학습수행
(a.k.a data-parallel synchronous stochastic gradient descent)
다층 인공신경망을 활용한 11번가 의류상품 검색
김문기M 박준영M
CNN
원본
data shard
CNN
복사본
data shard
GPU0 GPU1
13. 12
검출된 위치에서 해당 의류에 대한 특징추출 모듈 훈련
– 2개의 GPU를 통한 병렬학습수행
(a.k.a data-parallel synchronous stochastic gradient descent)
다층 인공신경망을 활용한 11번가 의류상품 검색
김문기M 박준영M
CNN
원본
data shard
CNN
복사본
data shard
GPU0 GPU1
Gradient 전송
14. 13
검출된 위치에서 해당 의류에 대한 특징추출 모듈 훈련
– 2개의 GPU를 통한 병렬학습수행
(a.k.a data-parallel synchronous stochastic gradient descent)
다층 인공신경망을 활용한 11번가 의류상품 검색
김문기M 박준영M
CNN
원본
data shard
CNN
복사본
data shard
GPU0 GPU1
Parameter 전송
15. 14
검출된 위치에서 해당 의류에 대한 특징추출 모듈 훈련
– 2개의 GPU를 통한 병렬학습수행
(a.k.a data-parallel synchronous stochastic gradient descent)
다층 인공신경망을 활용한 11번가 의류상품 검색
김문기M 박준영M
CNN
원본
data shard
CNN
복사본
data shard
GPU0 GPU1
NVIDIA NCCL
Universal Virtual Addressing(UVA)
NVIDIA GPUDirectTM
PCIe
NVIDIA, NVIDIA GPUDirect Technology
NCCL: Acdelerated Multi-GPU collective communication
16. 15
검출된 위치에서 해당 의류에 대한 특징추출 모듈 훈련
– 대략 100만건의 학습 데이터
– 2 gpu를 사용하여 병렬처리하여 대략 6일 소요
– 45 convolutions
추출된 특징추출 벡터에 대한 해싱 수행
– CNN 모델에서 학습한 bias vector를 활용하여 이진화를 수행
– 하나의 쿼리 벡터(9216 차원)에 대해
100만 샘플을 검색하는데 걸리는 시간: 160ms
다층 인공신경망을 활용한 11번가 의류상품 검색