ݺߣ

ݺߣShare a Scribd company logo
ADVANCINGUNIVERSITY,SERVINGUNIVERSITY
빅데이터 활용에 관한 모든것
빅데이터센터 신효정
실전 비즈니스 전략 수립
2
3
4
아빠가 생각하는 나
5
나..아빠가 생각하는 나
강사 소개
6
신효정
shj@cmu.ac.kr
EXPERIENCE
현 창원문성대학교 빅데이터센터, 특임교수
전 카네기멜론대학교, 방문교수
전 삼성전자 메모리사업부, 선임
전 성균관대 정보 및 지능시스템 연구실, 연구원
PROJECTS
농가 데이터 분석 프로젝트
전문가 매칭 플랫폼 컨설팅
이륜 배송 자동 배차 알고리즘 개발
딥러닝 기반 경마데이터 분석
LECTURES
Elastic Stack 적용 방안 강의
엑셀을 활용한 데이터 분석 프로세스 실습 강의
데이터 분석
7
Data analysis is a process of inspecting,
cleaning, transforming, and modeling data with
the goal of discovering useful information,
suggesting conclusions, and supporting decision-
making.
- Wikipedia
데이터 분석
8
Data analysis is a process of inspecting,
cleaning, transforming, and modeling data with
the goal of discovering useful information,
suggesting conclusions, and supporting decision-
making.
- Wikipedia
Actionable Information
데이터 분석 VS 빅데이터 분석
9
Volume
(양)
Variety
(다양)
Velocity
(속도)
Big Data 3Vs
Terabytes
Records
Transactions
Tables, files
Structured
Unstructured
Semistructured
Batch
Near time
Real time
Streams
Value(가치)
Veracity(진실성)
+
데이터 분석 VS 빅데이터 분석
10
Data
데이터 분석 VS 빅데이터 분석
11
Data
Human Insight
2데이터 분석 VS 빅데이터 분석
12
Data
Human Insight Human-Based
Decision Making
데이터 분석 VS 빅데이터 분석
13
Velocity
Volume
Variety
Data
Human Insight Human-Based
Decision Making
데이터 분석 VS 빅데이터 분석
14
Velocity
Volume
Variety
Data
Human Insight Human-Based
Decision Making
데이터 분석 VS 빅데이터 분석
15
Velocity
Volume
Variety
Data
데이터 분석 VS 빅데이터 분석
16
Velocity
Volume
Variety
Data
Data Analysis
데이터 분석 VS 빅데이터 분석
17
Velocity
Volume
Variety
Data
Data Analysis Data-Based
Decision Making
데이터 분석 VS 빅데이터 분석
18
Yes!
데이터에 대한 이해 정도는?
데이터의 양은?
데이터 분석 목표는?
데이터 분석 방법은?
데이터를 모으고 있는가?
NO!
서비스의 특성은?
운영 중 발생하는 데이터는?
데이터 수집 방법은?
데이터 분석 VS 빅데이터 분석
19
Excel 97~2003 형식(*,xls)
65,536행/256열
Excel 2007~2013 (*.xlsx/xlsm)
1,048,576행x16,384열
데이터 분석 VS 빅데이터 분석
20
퀴즈
21
Company A
> Shopping cart analysis  Beer and Diapers
Company B
> Climate + Sales history  Tuesday + Rain = Wine A ↑
Actionable Information!!!!
데이터 분석 프로세스
22
What are the information needs?
What sources of data address the needs?
What analytic tasks identify the needed information in the
sources?
What types of analysis best match the analytic task
requirements?
How can the analysis be organized to generate the most
useful information first or generate greatest amount of
information in the least amount of time?
데이터 분석 프로세스
23
문제 정의
데이터
소스
정의
분석 항목
정의
방법론
정의
분석/검증
프로세스
정의
데이터 분석 프로세스
24
오늘의 메뉴
$9.5 $9.0 $9.8 $7.5 $9.5 $9.5
신효정 shj@cmu.ac.kr 010-8940-0728
데이터 분석 프로세스
25
식수 예측이 정확하지 않아
준비한 재료가 낭비 됨
1일 판매량, 가격 등
식수 예측 모델 구축
선형 회귀 분석
문제정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
평가지표 개발
신효정 shj@cmu.ac.kr 010-8940-0728
데이터 분석 프로세스
26
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
오늘의 메뉴 몇 인분 준비 해야 할까?
준비한 재료가 남으면?
준비한 재료가 모자라면?
고추장을 더 사야 할까? 보관할 곳이..
내일 몇 인분이 팔릴지 예측해보자!
신효정 shj@cmu.ac.kr 010-8940-0728
데이터 분석 프로세스
27
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
오늘의 메뉴 가격
오늘 날씨
오늘의 메뉴 판매한 수
오늘의 메뉴가 내일 얼마나 팔릴까?
신효정 shj@cmu.ac.kr 010-8940-0728
데이터 분석 프로세스
28
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
오늘의 메뉴가 내일 얼마나 팔릴지
예측하는 모델을 만들어보자!
신효정 shj@cmu.ac.kr 010-8940-0728
데이터 분석 프로세스
29
문제정의
데이터소스
정의
분석항목
방법론 정의
분석/검증
프로세스 정의
기존에 모은 데이터를 기반으로 예측
모델을 만들 수 있다
비개발자가 만들어야 한다
숫자를 예측해야 한다
엑셀 - 선형 회귀 분석
신효정 shj@cmu.ac.kr 010-8940-0728
데이터 분석 프로세스
30
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
데이터 수집은? 매일 포스기에서
분석 플랫폼은? 엑셀 활용
모델 구축 주기는? 매일
학습데이터는? 150일전~120일전
평가데이터는? 30일전
모델 평가 지표는? 오차율
데이터 분석 프로세스 실습
31
선형회귀 분석
데이터 분석 프로세스 실습
32
선형회귀 분석
오늘의 메뉴 가격
판매수
데이터 분석 프로세스 실습
33
선형회귀 분석
오늘의 메뉴 가격
판매수
데이터 분석 프로세스 실습
34
선형회귀 분석
오늘의 메뉴 가격
판매수
데이터 분석 프로세스 실습
35
선형회귀 분석
오늘의 메뉴 가격
판매수
데이터 분석 프로세스 실습
36
선형회귀 분석
오늘의 메뉴 가격
판매수
데이터 분석 프로세스 실습
37
선형회귀 분석
오늘의 메뉴 가격
판매수
데이터 분석 프로세스 실습
38
선형회귀 분석
오늘의 메뉴 가격
판매수
y = a*x + b
데이터 분석 프로세스 실습
39
선형회귀 분석
오늘의 메뉴 가격
판매수
y = a*x + b
데이터 분석 프로세스 실습
40
선형회귀 분석
오늘의 메뉴 가격
판매수
y = a*x + b
데이터 분석 프로세스 실습
41
선형회귀 분석
오늘의 메뉴 가격
판매수
y = a*x + b
신효정 shj@cmu.ac.kr 010-8940-0728
사례 : GPS 데이터 분석
42
신효정 shj@cmu.ac.kr 010-8940-0728
사례 : GPS 데이터 분석
43
신효정 shj@cmu.ac.kr 010-8940-0728
사례 : GPS 데이터 분석
44
신효정 shj@cmu.ac.kr 010-8940-0728
사례 : GPS 데이터 분석
45
문제정의 배차 알고리즘 필요
데이터소스
정의 운영 데이터
분석항목
정의 검색엔진 개발
방법론 정의 엘라스틱서치 활용
분석/검증
프로세스 정
의
평가지표 개발
신효정 shj@cmu.ac.kr 010-8940-0728
사례 : GPS 데이터 분석
46
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
31
기존배차 자동배차
운행 중 콜 선택
노하우 학습 필요
비효율적 배차
관리자비용 발생
안전 운행
진입 장벽 낮춤
효율적 배차
관리자비용 감소
신효정 shj@cmu.ac.kr 010-8940-0728
사례 : GPS 데이터 분석
47
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
이동하면서 발생시키는
GPS 데이터
신효정 shj@cmu.ac.kr 010-8940-0728
사례 : GPS 데이터 분석
48
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
해당 콜을 수행할 때 예상되는 소요시
간을 과거의 운행 기록에서 검색
5분
20분
22분
6분
35분
신효정 shj@cmu.ac.kr 010-8940-0728
사례 : GPS 데이터 분석
49
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
대량의 데이터에서 빠른 검색이
가능한 검색 엔진 개발 필요
엘라스틱서치 활용
신효정 shj@cmu.ac.kr 010-8940-0728
사례 : GPS 데이터 분석
50
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
데이터 수집은? GPS 수집기
분석 플랫폼은? 엘라스틱서치
모델 구축 주기는? GPS 데이터 수집시
학습데이터는? 1일전 모든 데이터
평가데이터는? 1일전 데이터
모델 평가 지표는? 오차율
신효정 shj@cmu.ac.kr 010-8940-0728
사례 : 대시보드 구축
51
문제정의 매일 엑셀로 리포트 생성
데이터소스
정의
운영 데이터베이스
분석항목
정의
대시보드 개발
방법론 정의 엘라스틱스택 활용
분석/검증
프로세스 정
의
사용자의 피드백
신효정 shj@cmu.ac.kr 010-8940-0728
사례 : 대시보드 구축
52
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
어제 총 수익은?
어제 총 판매량은?
어제 판매된 항목은?
매일 아침 9시 엑셀 취합 후 메일 공유
매일 30분 반복 작업
실시간 정보 공유 불가
신효정 shj@cmu.ac.kr 010-8940-0728
사례 : 대시보드 구축
53
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
기업에서 운영하는 데이터베이스
신효정 shj@cmu.ac.kr 010-8940-0728
사례 : 대시보드 구축
54
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
실시간 공유가 가능한 대시보드 구축
신효정 shj@cmu.ac.kr 010-8940-0728
사례 : 대시보드 구축
55
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
엘라스틱 스택 활용
신효정 shj@cmu.ac.kr 010-8940-0728
사례 : 대시보드 구축
56
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
대시보드를 활용하는 사람들의
피드백을 통해 업데이트 수행
57
감사합니다.
Q&A

More Related Content

Similar to 빅데이터 활용에 관한 모든것 (20)

Src슬라이드(3총괄1세부) 조성준
Src슬라이드(3총괄1세부) 조성준Src슬라이드(3총괄1세부) 조성준
Src슬라이드(3총괄1세부) 조성준
SRCDSC
데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdf데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdf
Yunjeong Susan Hong
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
Myungjin Lee
학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망
Open Cyber University of Korea
[Retail & CPG Day 2019] AWS기반의 Data 분석 플랫폼 구축, 고객사례 (GS SHOP) -김형일, AWS 솔루션즈 ...
[Retail & CPG Day 2019] AWS기반의 Data 분석 플랫폼 구축, 고객사례 (GS SHOP) -김형일, AWS 솔루션즈 ...[Retail & CPG Day 2019] AWS기반의 Data 분석 플랫폼 구축, 고객사례 (GS SHOP) -김형일, AWS 솔루션즈 ...
[Retail & CPG Day 2019] AWS기반의 Data 분석 플랫폼 구축, 고객사례 (GS SHOP) -김형일, AWS 솔루션즈 ...
Amazon Web Services Korea
[IBM Korea 김상훈] Watson Explorer
[IBM Korea 김상훈] Watson Explorer[IBM Korea 김상훈] Watson Explorer
[IBM Korea 김상훈] Watson Explorer
(Joe), Sanghun Kim
BS501 발표자료
BS501 발표자료BS501 발표자료
BS501 발표자료
Park Sungpil
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
JeongHeon Lee
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
JeongHeon Lee
IT Governance Case Study (ir52 presentation)
IT Governance Case Study (ir52 presentation)IT Governance Case Study (ir52 presentation)
IT Governance Case Study (ir52 presentation)
에스티이지 (STEG)
[비즈스프링] 웹분석컨설팅 서비스 : 스마트케어
[비즈스프링]  웹분석컨설팅 서비스 : 스마트케어[비즈스프링]  웹분석컨설팅 서비스 : 스마트케어
[비즈스프링] 웹분석컨설팅 서비스 : 스마트케어
BizSpring Inc.
2017 주요 기술 흐름 및 개요
2017 주요 기술 흐름 및 개요2017 주요 기술 흐름 및 개요
2017 주요 기술 흐름 및 개요
Hosung Lee
공간정보 대량맞춤화 정보지원체계 연구 소개
공간정보 대량맞춤화 정보지원체계 연구 소개공간정보 대량맞춤화 정보지원체계 연구 소개
공간정보 대량맞춤화 정보지원체계 연구 소개
SANGHEE SHIN
빅데이터의 활용
빅데이터의 활용빅데이터의 활용
빅데이터의 활용
SU BO KIM
Mrc based cdqa_Seoul chatbot
Mrc based cdqa_Seoul chatbotMrc based cdqa_Seoul chatbot
Mrc based cdqa_Seoul chatbot
Jun-Hyeong Lee
기계독해를 위한 BERT 언어처리 모델 활용
기계독해를 위한 BERT 언어처리 모델 활용기계독해를 위한 BERT 언어처리 모델 활용
기계독해를 위한 BERT 언어처리 모델 활용
Kenneth Jung
기계학습 현재와미래 Pdf
기계학습 현재와미래 Pdf기계학습 현재와미래 Pdf
기계학습 현재와미래 Pdf
효근 윤
머신러닝의 개념과 실습
머신러닝의 개념과 실습머신러닝의 개념과 실습
머신러닝의 개념과 실습
Byoung-Hee Kim
[팝콘 시즌1] 윤석진 : 조직의 데이터 드리븐 문화를 위해 극복해야하는 문제들
[팝콘 시즌1] 윤석진 : 조직의 데이터 드리븐 문화를 위해 극복해야하는 문제들[팝콘 시즌1] 윤석진 : 조직의 데이터 드리븐 문화를 위해 극복해야하는 문제들
[팝콘 시즌1] 윤석진 : 조직의 데이터 드리븐 문화를 위해 극복해야하는 문제들
PAP (Product Analytics Playground)
[BizSpring] Data Consulting_사례집.pdf
[BizSpring] Data Consulting_사례집.pdf[BizSpring] Data Consulting_사례집.pdf
[BizSpring] Data Consulting_사례집.pdf
BizSpring Inc.
Src슬라이드(3총괄1세부) 조성준
Src슬라이드(3총괄1세부) 조성준Src슬라이드(3총괄1세부) 조성준
Src슬라이드(3총괄1세부) 조성준
SRCDSC
데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdf데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdf
Yunjeong Susan Hong
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
Myungjin Lee
학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망
Open Cyber University of Korea
[Retail & CPG Day 2019] AWS기반의 Data 분석 플랫폼 구축, 고객사례 (GS SHOP) -김형일, AWS 솔루션즈 ...
[Retail & CPG Day 2019] AWS기반의 Data 분석 플랫폼 구축, 고객사례 (GS SHOP) -김형일, AWS 솔루션즈 ...[Retail & CPG Day 2019] AWS기반의 Data 분석 플랫폼 구축, 고객사례 (GS SHOP) -김형일, AWS 솔루션즈 ...
[Retail & CPG Day 2019] AWS기반의 Data 분석 플랫폼 구축, 고객사례 (GS SHOP) -김형일, AWS 솔루션즈 ...
Amazon Web Services Korea
[IBM Korea 김상훈] Watson Explorer
[IBM Korea 김상훈] Watson Explorer[IBM Korea 김상훈] Watson Explorer
[IBM Korea 김상훈] Watson Explorer
(Joe), Sanghun Kim
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
JeongHeon Lee
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
JeongHeon Lee
IT Governance Case Study (ir52 presentation)
IT Governance Case Study (ir52 presentation)IT Governance Case Study (ir52 presentation)
IT Governance Case Study (ir52 presentation)
에스티이지 (STEG)
[비즈스프링] 웹분석컨설팅 서비스 : 스마트케어
[비즈스프링]  웹분석컨설팅 서비스 : 스마트케어[비즈스프링]  웹분석컨설팅 서비스 : 스마트케어
[비즈스프링] 웹분석컨설팅 서비스 : 스마트케어
BizSpring Inc.
2017 주요 기술 흐름 및 개요
2017 주요 기술 흐름 및 개요2017 주요 기술 흐름 및 개요
2017 주요 기술 흐름 및 개요
Hosung Lee
공간정보 대량맞춤화 정보지원체계 연구 소개
공간정보 대량맞춤화 정보지원체계 연구 소개공간정보 대량맞춤화 정보지원체계 연구 소개
공간정보 대량맞춤화 정보지원체계 연구 소개
SANGHEE SHIN
빅데이터의 활용
빅데이터의 활용빅데이터의 활용
빅데이터의 활용
SU BO KIM
Mrc based cdqa_Seoul chatbot
Mrc based cdqa_Seoul chatbotMrc based cdqa_Seoul chatbot
Mrc based cdqa_Seoul chatbot
Jun-Hyeong Lee
기계독해를 위한 BERT 언어처리 모델 활용
기계독해를 위한 BERT 언어처리 모델 활용기계독해를 위한 BERT 언어처리 모델 활용
기계독해를 위한 BERT 언어처리 모델 활용
Kenneth Jung
기계학습 현재와미래 Pdf
기계학습 현재와미래 Pdf기계학습 현재와미래 Pdf
기계학습 현재와미래 Pdf
효근 윤
머신러닝의 개념과 실습
머신러닝의 개념과 실습머신러닝의 개념과 실습
머신러닝의 개념과 실습
Byoung-Hee Kim
[팝콘 시즌1] 윤석진 : 조직의 데이터 드리븐 문화를 위해 극복해야하는 문제들
[팝콘 시즌1] 윤석진 : 조직의 데이터 드리븐 문화를 위해 극복해야하는 문제들[팝콘 시즌1] 윤석진 : 조직의 데이터 드리븐 문화를 위해 극복해야하는 문제들
[팝콘 시즌1] 윤석진 : 조직의 데이터 드리븐 문화를 위해 극복해야하는 문제들
PAP (Product Analytics Playground)
[BizSpring] Data Consulting_사례집.pdf
[BizSpring] Data Consulting_사례집.pdf[BizSpring] Data Consulting_사례집.pdf
[BizSpring] Data Consulting_사례집.pdf
BizSpring Inc.

빅데이터 활용에 관한 모든것

  • 1. ADVANCINGUNIVERSITY,SERVINGUNIVERSITY 빅데이터 활용에 관한 모든것 빅데이터센터 신효정 실전 비즈니스 전략 수립
  • 2. 2
  • 3. 3
  • 6. 강사 소개 6 신효정 shj@cmu.ac.kr EXPERIENCE 현 창원문성대학교 빅데이터센터, 특임교수 전 카네기멜론대학교, 방문교수 전 삼성전자 메모리사업부, 선임 전 성균관대 정보 및 지능시스템 연구실, 연구원 PROJECTS 농가 데이터 분석 프로젝트 전문가 매칭 플랫폼 컨설팅 이륜 배송 자동 배차 알고리즘 개발 딥러닝 기반 경마데이터 분석 LECTURES Elastic Stack 적용 방안 강의 엑셀을 활용한 데이터 분석 프로세스 실습 강의
  • 7. 데이터 분석 7 Data analysis is a process of inspecting, cleaning, transforming, and modeling data with the goal of discovering useful information, suggesting conclusions, and supporting decision- making. - Wikipedia
  • 8. 데이터 분석 8 Data analysis is a process of inspecting, cleaning, transforming, and modeling data with the goal of discovering useful information, suggesting conclusions, and supporting decision- making. - Wikipedia Actionable Information
  • 9. 데이터 분석 VS 빅데이터 분석 9 Volume (양) Variety (다양) Velocity (속도) Big Data 3Vs Terabytes Records Transactions Tables, files Structured Unstructured Semistructured Batch Near time Real time Streams Value(가치) Veracity(진실성) +
  • 10. 데이터 분석 VS 빅데이터 분석 10 Data
  • 11. 데이터 분석 VS 빅데이터 분석 11 Data Human Insight
  • 12. 2데이터 분석 VS 빅데이터 분석 12 Data Human Insight Human-Based Decision Making
  • 13. 데이터 분석 VS 빅데이터 분석 13 Velocity Volume Variety Data Human Insight Human-Based Decision Making
  • 14. 데이터 분석 VS 빅데이터 분석 14 Velocity Volume Variety Data Human Insight Human-Based Decision Making
  • 15. 데이터 분석 VS 빅데이터 분석 15 Velocity Volume Variety Data
  • 16. 데이터 분석 VS 빅데이터 분석 16 Velocity Volume Variety Data Data Analysis
  • 17. 데이터 분석 VS 빅데이터 분석 17 Velocity Volume Variety Data Data Analysis Data-Based Decision Making
  • 18. 데이터 분석 VS 빅데이터 분석 18 Yes! 데이터에 대한 이해 정도는? 데이터의 양은? 데이터 분석 목표는? 데이터 분석 방법은? 데이터를 모으고 있는가? NO! 서비스의 특성은? 운영 중 발생하는 데이터는? 데이터 수집 방법은?
  • 19. 데이터 분석 VS 빅데이터 분석 19 Excel 97~2003 형식(*,xls) 65,536행/256열 Excel 2007~2013 (*.xlsx/xlsm) 1,048,576행x16,384열
  • 20. 데이터 분석 VS 빅데이터 분석 20
  • 21. 퀴즈 21 Company A > Shopping cart analysis  Beer and Diapers Company B > Climate + Sales history  Tuesday + Rain = Wine A ↑ Actionable Information!!!!
  • 22. 데이터 분석 프로세스 22 What are the information needs? What sources of data address the needs? What analytic tasks identify the needed information in the sources? What types of analysis best match the analytic task requirements? How can the analysis be organized to generate the most useful information first or generate greatest amount of information in the least amount of time?
  • 23. 데이터 분석 프로세스 23 문제 정의 데이터 소스 정의 분석 항목 정의 방법론 정의 분석/검증 프로세스 정의
  • 24. 데이터 분석 프로세스 24 오늘의 메뉴 $9.5 $9.0 $9.8 $7.5 $9.5 $9.5
  • 25. 신효정 shj@cmu.ac.kr 010-8940-0728 데이터 분석 프로세스 25 식수 예측이 정확하지 않아 준비한 재료가 낭비 됨 1일 판매량, 가격 등 식수 예측 모델 구축 선형 회귀 분석 문제정의 분석항목 정의 방법론 정의 분석/검증 프로세스 정의 평가지표 개발
  • 26. 신효정 shj@cmu.ac.kr 010-8940-0728 데이터 분석 프로세스 26 문제정의 데이터소스 정의 분석항목 정의 방법론 정의 분석/검증 프로세스 정의 오늘의 메뉴 몇 인분 준비 해야 할까? 준비한 재료가 남으면? 준비한 재료가 모자라면? 고추장을 더 사야 할까? 보관할 곳이.. 내일 몇 인분이 팔릴지 예측해보자!
  • 27. 신효정 shj@cmu.ac.kr 010-8940-0728 데이터 분석 프로세스 27 문제정의 데이터소스 정의 분석항목 정의 방법론 정의 분석/검증 프로세스 정의 오늘의 메뉴 가격 오늘 날씨 오늘의 메뉴 판매한 수 오늘의 메뉴가 내일 얼마나 팔릴까?
  • 28. 신효정 shj@cmu.ac.kr 010-8940-0728 데이터 분석 프로세스 28 문제정의 데이터소스 정의 분석항목 정의 방법론 정의 분석/검증 프로세스 정의 오늘의 메뉴가 내일 얼마나 팔릴지 예측하는 모델을 만들어보자!
  • 29. 신효정 shj@cmu.ac.kr 010-8940-0728 데이터 분석 프로세스 29 문제정의 데이터소스 정의 분석항목 방법론 정의 분석/검증 프로세스 정의 기존에 모은 데이터를 기반으로 예측 모델을 만들 수 있다 비개발자가 만들어야 한다 숫자를 예측해야 한다 엑셀 - 선형 회귀 분석
  • 30. 신효정 shj@cmu.ac.kr 010-8940-0728 데이터 분석 프로세스 30 문제정의 데이터소스 정의 분석항목 정의 방법론 정의 분석/검증 프로세스 정의 데이터 수집은? 매일 포스기에서 분석 플랫폼은? 엑셀 활용 모델 구축 주기는? 매일 학습데이터는? 150일전~120일전 평가데이터는? 30일전 모델 평가 지표는? 오차율
  • 31. 데이터 분석 프로세스 실습 31 선형회귀 분석
  • 32. 데이터 분석 프로세스 실습 32 선형회귀 분석 오늘의 메뉴 가격 판매수
  • 33. 데이터 분석 프로세스 실습 33 선형회귀 분석 오늘의 메뉴 가격 판매수
  • 34. 데이터 분석 프로세스 실습 34 선형회귀 분석 오늘의 메뉴 가격 판매수
  • 35. 데이터 분석 프로세스 실습 35 선형회귀 분석 오늘의 메뉴 가격 판매수
  • 36. 데이터 분석 프로세스 실습 36 선형회귀 분석 오늘의 메뉴 가격 판매수
  • 37. 데이터 분석 프로세스 실습 37 선형회귀 분석 오늘의 메뉴 가격 판매수
  • 38. 데이터 분석 프로세스 실습 38 선형회귀 분석 오늘의 메뉴 가격 판매수 y = a*x + b
  • 39. 데이터 분석 프로세스 실습 39 선형회귀 분석 오늘의 메뉴 가격 판매수 y = a*x + b
  • 40. 데이터 분석 프로세스 실습 40 선형회귀 분석 오늘의 메뉴 가격 판매수 y = a*x + b
  • 41. 데이터 분석 프로세스 실습 41 선형회귀 분석 오늘의 메뉴 가격 판매수 y = a*x + b
  • 42. 신효정 shj@cmu.ac.kr 010-8940-0728 사례 : GPS 데이터 분석 42
  • 43. 신효정 shj@cmu.ac.kr 010-8940-0728 사례 : GPS 데이터 분석 43
  • 44. 신효정 shj@cmu.ac.kr 010-8940-0728 사례 : GPS 데이터 분석 44
  • 45. 신효정 shj@cmu.ac.kr 010-8940-0728 사례 : GPS 데이터 분석 45 문제정의 배차 알고리즘 필요 데이터소스 정의 운영 데이터 분석항목 정의 검색엔진 개발 방법론 정의 엘라스틱서치 활용 분석/검증 프로세스 정 의 평가지표 개발
  • 46. 신효정 shj@cmu.ac.kr 010-8940-0728 사례 : GPS 데이터 분석 46 문제정의 데이터소스 정의 분석항목 정의 방법론 정의 분석/검증 프로세스 정의 31 기존배차 자동배차 운행 중 콜 선택 노하우 학습 필요 비효율적 배차 관리자비용 발생 안전 운행 진입 장벽 낮춤 효율적 배차 관리자비용 감소
  • 47. 신효정 shj@cmu.ac.kr 010-8940-0728 사례 : GPS 데이터 분석 47 문제정의 데이터소스 정의 분석항목 정의 방법론 정의 분석/검증 프로세스 정의 이동하면서 발생시키는 GPS 데이터
  • 48. 신효정 shj@cmu.ac.kr 010-8940-0728 사례 : GPS 데이터 분석 48 문제정의 데이터소스 정의 분석항목 정의 방법론 정의 분석/검증 프로세스 정의 해당 콜을 수행할 때 예상되는 소요시 간을 과거의 운행 기록에서 검색 5분 20분 22분 6분 35분
  • 49. 신효정 shj@cmu.ac.kr 010-8940-0728 사례 : GPS 데이터 분석 49 문제정의 데이터소스 정의 분석항목 정의 방법론 정의 분석/검증 프로세스 정의 대량의 데이터에서 빠른 검색이 가능한 검색 엔진 개발 필요 엘라스틱서치 활용
  • 50. 신효정 shj@cmu.ac.kr 010-8940-0728 사례 : GPS 데이터 분석 50 문제정의 데이터소스 정의 분석항목 정의 방법론 정의 분석/검증 프로세스 정의 데이터 수집은? GPS 수집기 분석 플랫폼은? 엘라스틱서치 모델 구축 주기는? GPS 데이터 수집시 학습데이터는? 1일전 모든 데이터 평가데이터는? 1일전 데이터 모델 평가 지표는? 오차율
  • 51. 신효정 shj@cmu.ac.kr 010-8940-0728 사례 : 대시보드 구축 51 문제정의 매일 엑셀로 리포트 생성 데이터소스 정의 운영 데이터베이스 분석항목 정의 대시보드 개발 방법론 정의 엘라스틱스택 활용 분석/검증 프로세스 정 의 사용자의 피드백
  • 52. 신효정 shj@cmu.ac.kr 010-8940-0728 사례 : 대시보드 구축 52 문제정의 데이터소스 정의 분석항목 정의 방법론 정의 분석/검증 프로세스 정의 어제 총 수익은? 어제 총 판매량은? 어제 판매된 항목은? 매일 아침 9시 엑셀 취합 후 메일 공유 매일 30분 반복 작업 실시간 정보 공유 불가
  • 53. 신효정 shj@cmu.ac.kr 010-8940-0728 사례 : 대시보드 구축 53 문제정의 데이터소스 정의 분석항목 정의 방법론 정의 분석/검증 프로세스 정의 기업에서 운영하는 데이터베이스
  • 54. 신효정 shj@cmu.ac.kr 010-8940-0728 사례 : 대시보드 구축 54 문제정의 데이터소스 정의 분석항목 정의 방법론 정의 분석/검증 프로세스 정의 실시간 공유가 가능한 대시보드 구축
  • 55. 신효정 shj@cmu.ac.kr 010-8940-0728 사례 : 대시보드 구축 55 문제정의 데이터소스 정의 분석항목 정의 방법론 정의 분석/검증 프로세스 정의 엘라스틱 스택 활용
  • 56. 신효정 shj@cmu.ac.kr 010-8940-0728 사례 : 대시보드 구축 56 문제정의 데이터소스 정의 분석항목 정의 방법론 정의 분석/검증 프로세스 정의 대시보드를 활용하는 사람들의 피드백을 통해 업데이트 수행