실리콘 밸리 데이터 사이언티스트의 하루Jaimie Kwon (권재명)(오리지널 구글 프리젠테이션은 http://goo.gl/uiX2UH 에)
- 권재명 (Jaimyoung Kwon)
1. 실리콘 벨리 데이터 기업들
2. 온라인 광고 사업
3. 데이터 사이언티스트, 데이터 엔지니어, 머신러닝 사이언티스트
4. 실리콘 벨리 데이터 사이언티스트의 하루
5. 데이터 사이언스 툴채인
6. 데이터 사이언스 베스트 프랙티스
7. 데이터 사이언스 필수 통계 개념
8. 사내 데이터 사이언스 도입
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)Myungjin Lee오늘날 인터넷의 보편화와 소셜 미디어 및 스마트 기기의 발전으로 인해 정보의 양이 급격히 증가함에 따라 비즈니스 영역에 있어서 새로운 기회와 도전의 시기를 맞고 있다. 빅 데이터라 불리는 이러한 수 많은 정보들은 기업이 효율적인 의사결정을 지원할 수 있도록 도와줄 수 있으며, 또한 다른 기업과의 비즈니스 경쟁에서 경쟁우위를 차지하는데 아주 중요한 역할을 한다. 이러한 의사결정을 지원하기 위해서는 빅 데이터를 효과적으로 분석할 수 있는 방법론이 필요할 뿐 아니라 이를 지원할 수 있는 다양한 인프라를 필요로 한다. 따라서 본 논문에서는 빅 데이터를 분석하기 위한 고급분석 기법과 이를 지원하기 위한 기술 요소들을 도출하고, 향후의 발전 방향에 대해 논하고자 한다. 이러한 분석 기법과 기술을 통한 정확하고 신뢰성 높으며 신속한 의사결정은 기업이 고객의 요구를 신속히 수용하고 반영함으로써 기업의 수익 창출 및 시장을 선점하는 중요한 요인으로 작용할 수 있다.
Recently, as the Internet, social-media, and smart devices have been spread and common, the amount of information increases incredibly. Nowadays, we are confronting new opportunities and challenges in every business area. Obviously, such huge amount of information which called Big Data is playing a significant role at many parts, like improvement of effective decision making. Therefore, many companies could maintain their competitiveness in the market place. In order to support firm’s decision making, we need not only the methodology for the effective analysis of Big Data, but also various infra-structure which could support the firm’s decision making. As a result, this paper discusses advanced analysis methodologies and it’s supporting technical factors. The firm’s decision which is based on such analysis and techniques is usually accurate, reliable, fast, receiving and refreshing customer’s feedback immediately, so the decision making plays an important role in the revenue creation and preempt of market share.
학습분석(Learning Analytics) 활용 가능성 및 전망Open Cyber University of Korea[KERIS 이슈리포트] 요약 세미나 (Webinar) 자료
* 원문 링크: http://bit.ly/196LHBs
국내외 빅데이터 및 학습 분석 관련 기고서들과 동향 분석자료를 요약한 이슈리포트. UNESCO Policy Brief와 IMS Global의 백서를 중심으로 학습 분석 기술의 활용가능성과 쟁정들을 분석한 자료.
<주요>
1. 빅데이터 기술 및 산업 동향
2. 학습 분석 기술에 대한 이해
3. 학습 분석 기술 표준화 동향
4. 시사점
[Retail & CPG Day 2019] AWS기반의 Data 분석 플랫폼 구축, 고객사례 (GS SHOP) -김형일, AWS 솔루션즈 ...Amazon Web Services Korea[Retail & CPG Day 2019] AWS기반의 Data 분석 플랫폼 구축, 고객사례 (GS SHOP) -김형일, AWS 솔루션즈 아키텍트
[IBM Korea 김상훈] Watson Explorer(Joe), Sanghun Kim[IBM Korea 김상훈] Watson Explorer
매초마다 발생되는 정량, 정성적인 데이터들을 수집하고 분석하며 새로운 해법까지 제시하는 왓슨 익스플로어러에 대한 소개 자료입니다. 잘 설명되어 있으니 한 번 살펴보시기 바랍니다.
#IBM #김상훈 #왓슨익스플로러
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰JeongHeon Lee최근 다양한 분야에서의 빅데이터 분석 시스템이 구축되어 활용되고 있으나, 대부분의 대상 데이터들이 텍스트 기반의 데이터를 한정하고 있다. 그러나, 현재 전 산업 분야에서 이미지(비디오) 데이터가 빅데이터의 핵심으로 부상하면서 이를 분석하기 위한 이미지 마이닝 기술에 대한 관심이 고조되고 있다. 이미지 마이닝 기술은 이미지 프로세싱 기술에 대한 연구가 시작된 시점 1960년대 이후인 1970년대부터 연구되기 시작하였다. 이와 관련된 많은 연구들이 의학적인 분야와 국방 분야에서 많이 연구되어 오다, 최근에는 마케팅 분야를 포함한 다양한 분야에서 연구되어 오고 있으며, 일부 산업 분야에서는 상용기술이 개발되어 실제 산업에 적용되고 있다. 이러한 기술들이 최근 빅데이터 기술에 대한 관심이 증가하면서 이미지(비디오) 데이터 분석에 적용하기 위한 연구들이 집중되고 있다. 이에 이에 이미지 마이닝을 위한 기존의 기술들의 연구 동향과 이러한 기술들을 활용하고 있는 산업 분야의 응용에 대한 동향을 조사 분석하고 향후 발전 방향에 대해 살펴보기로 한다.
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰JeongHeon Lee최근 다양한 분야에서의 빅데이터 분석 시스템이 구축되어 활용되고 있으나, 대부분의 대상 데이터들이 텍스트 기반의 데이터를 한정하고 있다. 그러나, 현재 전 산업 분야에서 이미지(비디오) 데이터가 빅데이터의 핵심으로 부상하면서 이를 분석하기 위한 이미지 마이닝 기술에 대한 관심이 고조되고 있다. 이미지 마이닝 기술은 이미지 프로세싱 기술에 대한 연구가 시작된 시점 1960년대 이후인 1970년대부터 연구되기 시작하였다. 이와 관련된 많은 연구들이 의학적인 분야와 국방 분야에서 많이 연구되어 오다, 최근에는 마케팅 분야를 포함한 다양한 분야에서 연구되어 오고 있으며, 일부 산업 분야에서는 상용기술이 개발되어 실제 산업에 적용되고 있다. 이러한 기술들이 최근 빅데이터 기술에 대한 관심이 증가하면서 이미지(비디오) 데이터 분석에 적용하기 위한 연구들이 집중되고 있다. 이에 이에 이미지 마이닝을 위한 기존의 기술들의 연구 동향과 이러한 기술들을 활용하고 있는 산업 분야의 응용에 대한 동향을 조사 분석하고 향후 발전 방향에 대해 살펴보기로 한다.
공간정보 대량맞춤화 정보지원체계 연구 소개SANGHEE SHIN국토지리정보원의 요청으로 수행했던 '공간정보 대량맞춤화 정보지원체계 연구' 소개 자료입니다. 연구의 배경, 공간정보 대량맞춤화의 개념, 향후 업무 체계 변화 방향, 법제도 개선 방향 등 연구 전반에 대한 개략적인 소개를 담고 있습니다. 결론적으로, 현재의 공급자, 제품 위주의 공간정보 생산/관리/제공 체계를 수요자, 서비스 위주로 개선할 때 필요한 사항들을 지적하고 있습니다.
기계독해를 위한 BERT 언어처리 모델 활용Kenneth Jung 서울시 챗봇팀이 개발한 ‘청년정책봇’은 시나리오 기반이 아닌 딥러닝 기반의 챗봇 서비스다. ETRI에서 개발한 KorBERT를 통해 언어 처리 모델을 대신하고, 형태소 분석 API를 통해 질문 문장에 대한 의도를 분석하였다. 카카오에서 배포한 khaii 형태소 분석기 적용을 통해 구문분석 정확도를 향상을 확인할 수 있었다. 또한, 위키 QA API를 통해 일반적인 질의응답을 위한 기능을 추가했다. 현재 상용화된 챗봇서비스의 대부분은 미리 구성된 시나리오(Flowchart)를 따라가는 방식을 활용하며, 자연어 처리 기술은 신뢰도가 낮아 사용되지 않고 있다. 그에 반해, ‘청년정책봇’은 cdQA 파이프라인을 접목해 유사도 높은 문서를 언어 처리 모델에 적용하는 방식으로 접근해 신뢰도를 높일 수 있었다. 기존 빌더를 통해, 상용화된 서비스 대비 두 가지 장점이 있다. 첫 번째 장점은 딥러닝 모델에 따른 발전 가능성으로써 ETRI KorBERT의 지속적인 개선에 따라 청년정책봇의 기계 독해 성능도 같이 개선된다는 것이다. 두 번째 장점은 서비스 지속 가능성으로써 cdQA 파이프라인에 기반해 주기적인 웹 크롤링을 통해 데이터 추가가 가능하기 때문에 소프트웨어 유지 보수에 필요한 자원을 최소화할 수 있다는 것이다. 청년정책 챗봇을 통해 cdQA 파이프라인과 ETRI BERT 모델을 활용해 기존의 데이터 인풋 제한을 극복하고 기계 독해에 대한 솔루션을 제시할 수 있었다.
[팝콘 시즌1] 윤석진 : 조직의 데이터 드리븐 문화를 위해 극복해야하는 문제들PAP (Product Analytics Playground)윤석진 : 조직의 데이터 드리븐 문화를 위해 극복해야하는 문제들
발표영상 https://youtu.be/X29liXyIo3s
---
PAP가 준비한 팝콘 시즌1에서 프로덕트와 함께 성장하는 데이터 실무자들의 이야기를 담았습니다.
---
PAP(Product Analytics Playground)는 프로덕트 데이터 분석에 대해 편안하게 이야기할 수 있는 커뮤니티입니다.
우리는 데이터 드리븐 프로덕트 문화를 더 많은 분들이 각자의 자리에서 이끌어갈 수 있도록 하는 것을 목표로 합니다.
다양한 직군의 사람들이 모여 프로덕트를 만들듯 PAP 역시 다양한 멤버로 구성되어 있으며, 여러분들의 참여로 만들어집니다.
---
공식 페이지 : https://playinpap.oopy.io
페이스북 그룹 : https://www.facebook.com/groups/talkinpap
팀블로그 : https://playinpap.github.io
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)Myungjin Lee오늘날 인터넷의 보편화와 소셜 미디어 및 스마트 기기의 발전으로 인해 정보의 양이 급격히 증가함에 따라 비즈니스 영역에 있어서 새로운 기회와 도전의 시기를 맞고 있다. 빅 데이터라 불리는 이러한 수 많은 정보들은 기업이 효율적인 의사결정을 지원할 수 있도록 도와줄 수 있으며, 또한 다른 기업과의 비즈니스 경쟁에서 경쟁우위를 차지하는데 아주 중요한 역할을 한다. 이러한 의사결정을 지원하기 위해서는 빅 데이터를 효과적으로 분석할 수 있는 방법론이 필요할 뿐 아니라 이를 지원할 수 있는 다양한 인프라를 필요로 한다. 따라서 본 논문에서는 빅 데이터를 분석하기 위한 고급분석 기법과 이를 지원하기 위한 기술 요소들을 도출하고, 향후의 발전 방향에 대해 논하고자 한다. 이러한 분석 기법과 기술을 통한 정확하고 신뢰성 높으며 신속한 의사결정은 기업이 고객의 요구를 신속히 수용하고 반영함으로써 기업의 수익 창출 및 시장을 선점하는 중요한 요인으로 작용할 수 있다.
Recently, as the Internet, social-media, and smart devices have been spread and common, the amount of information increases incredibly. Nowadays, we are confronting new opportunities and challenges in every business area. Obviously, such huge amount of information which called Big Data is playing a significant role at many parts, like improvement of effective decision making. Therefore, many companies could maintain their competitiveness in the market place. In order to support firm’s decision making, we need not only the methodology for the effective analysis of Big Data, but also various infra-structure which could support the firm’s decision making. As a result, this paper discusses advanced analysis methodologies and it’s supporting technical factors. The firm’s decision which is based on such analysis and techniques is usually accurate, reliable, fast, receiving and refreshing customer’s feedback immediately, so the decision making plays an important role in the revenue creation and preempt of market share.
학습분석(Learning Analytics) 활용 가능성 및 전망Open Cyber University of Korea[KERIS 이슈리포트] 요약 세미나 (Webinar) 자료
* 원문 링크: http://bit.ly/196LHBs
국내외 빅데이터 및 학습 분석 관련 기고서들과 동향 분석자료를 요약한 이슈리포트. UNESCO Policy Brief와 IMS Global의 백서를 중심으로 학습 분석 기술의 활용가능성과 쟁정들을 분석한 자료.
<주요>
1. 빅데이터 기술 및 산업 동향
2. 학습 분석 기술에 대한 이해
3. 학습 분석 기술 표준화 동향
4. 시사점
[Retail & CPG Day 2019] AWS기반의 Data 분석 플랫폼 구축, 고객사례 (GS SHOP) -김형일, AWS 솔루션즈 ...Amazon Web Services Korea[Retail & CPG Day 2019] AWS기반의 Data 분석 플랫폼 구축, 고객사례 (GS SHOP) -김형일, AWS 솔루션즈 아키텍트
[IBM Korea 김상훈] Watson Explorer(Joe), Sanghun Kim[IBM Korea 김상훈] Watson Explorer
매초마다 발생되는 정량, 정성적인 데이터들을 수집하고 분석하며 새로운 해법까지 제시하는 왓슨 익스플로어러에 대한 소개 자료입니다. 잘 설명되어 있으니 한 번 살펴보시기 바랍니다.
#IBM #김상훈 #왓슨익스플로러
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰JeongHeon Lee최근 다양한 분야에서의 빅데이터 분석 시스템이 구축되어 활용되고 있으나, 대부분의 대상 데이터들이 텍스트 기반의 데이터를 한정하고 있다. 그러나, 현재 전 산업 분야에서 이미지(비디오) 데이터가 빅데이터의 핵심으로 부상하면서 이를 분석하기 위한 이미지 마이닝 기술에 대한 관심이 고조되고 있다. 이미지 마이닝 기술은 이미지 프로세싱 기술에 대한 연구가 시작된 시점 1960년대 이후인 1970년대부터 연구되기 시작하였다. 이와 관련된 많은 연구들이 의학적인 분야와 국방 분야에서 많이 연구되어 오다, 최근에는 마케팅 분야를 포함한 다양한 분야에서 연구되어 오고 있으며, 일부 산업 분야에서는 상용기술이 개발되어 실제 산업에 적용되고 있다. 이러한 기술들이 최근 빅데이터 기술에 대한 관심이 증가하면서 이미지(비디오) 데이터 분석에 적용하기 위한 연구들이 집중되고 있다. 이에 이에 이미지 마이닝을 위한 기존의 기술들의 연구 동향과 이러한 기술들을 활용하고 있는 산업 분야의 응용에 대한 동향을 조사 분석하고 향후 발전 방향에 대해 살펴보기로 한다.
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰JeongHeon Lee최근 다양한 분야에서의 빅데이터 분석 시스템이 구축되어 활용되고 있으나, 대부분의 대상 데이터들이 텍스트 기반의 데이터를 한정하고 있다. 그러나, 현재 전 산업 분야에서 이미지(비디오) 데이터가 빅데이터의 핵심으로 부상하면서 이를 분석하기 위한 이미지 마이닝 기술에 대한 관심이 고조되고 있다. 이미지 마이닝 기술은 이미지 프로세싱 기술에 대한 연구가 시작된 시점 1960년대 이후인 1970년대부터 연구되기 시작하였다. 이와 관련된 많은 연구들이 의학적인 분야와 국방 분야에서 많이 연구되어 오다, 최근에는 마케팅 분야를 포함한 다양한 분야에서 연구되어 오고 있으며, 일부 산업 분야에서는 상용기술이 개발되어 실제 산업에 적용되고 있다. 이러한 기술들이 최근 빅데이터 기술에 대한 관심이 증가하면서 이미지(비디오) 데이터 분석에 적용하기 위한 연구들이 집중되고 있다. 이에 이에 이미지 마이닝을 위한 기존의 기술들의 연구 동향과 이러한 기술들을 활용하고 있는 산업 분야의 응용에 대한 동향을 조사 분석하고 향후 발전 방향에 대해 살펴보기로 한다.
공간정보 대량맞춤화 정보지원체계 연구 소개SANGHEE SHIN국토지리정보원의 요청으로 수행했던 '공간정보 대량맞춤화 정보지원체계 연구' 소개 자료입니다. 연구의 배경, 공간정보 대량맞춤화의 개념, 향후 업무 체계 변화 방향, 법제도 개선 방향 등 연구 전반에 대한 개략적인 소개를 담고 있습니다. 결론적으로, 현재의 공급자, 제품 위주의 공간정보 생산/관리/제공 체계를 수요자, 서비스 위주로 개선할 때 필요한 사항들을 지적하고 있습니다.
기계독해를 위한 BERT 언어처리 모델 활용Kenneth Jung 서울시 챗봇팀이 개발한 ‘청년정책봇’은 시나리오 기반이 아닌 딥러닝 기반의 챗봇 서비스다. ETRI에서 개발한 KorBERT를 통해 언어 처리 모델을 대신하고, 형태소 분석 API를 통해 질문 문장에 대한 의도를 분석하였다. 카카오에서 배포한 khaii 형태소 분석기 적용을 통해 구문분석 정확도를 향상을 확인할 수 있었다. 또한, 위키 QA API를 통해 일반적인 질의응답을 위한 기능을 추가했다. 현재 상용화된 챗봇서비스의 대부분은 미리 구성된 시나리오(Flowchart)를 따라가는 방식을 활용하며, 자연어 처리 기술은 신뢰도가 낮아 사용되지 않고 있다. 그에 반해, ‘청년정책봇’은 cdQA 파이프라인을 접목해 유사도 높은 문서를 언어 처리 모델에 적용하는 방식으로 접근해 신뢰도를 높일 수 있었다. 기존 빌더를 통해, 상용화된 서비스 대비 두 가지 장점이 있다. 첫 번째 장점은 딥러닝 모델에 따른 발전 가능성으로써 ETRI KorBERT의 지속적인 개선에 따라 청년정책봇의 기계 독해 성능도 같이 개선된다는 것이다. 두 번째 장점은 서비스 지속 가능성으로써 cdQA 파이프라인에 기반해 주기적인 웹 크롤링을 통해 데이터 추가가 가능하기 때문에 소프트웨어 유지 보수에 필요한 자원을 최소화할 수 있다는 것이다. 청년정책 챗봇을 통해 cdQA 파이프라인과 ETRI BERT 모델을 활용해 기존의 데이터 인풋 제한을 극복하고 기계 독해에 대한 솔루션을 제시할 수 있었다.
[팝콘 시즌1] 윤석진 : 조직의 데이터 드리븐 문화를 위해 극복해야하는 문제들PAP (Product Analytics Playground)윤석진 : 조직의 데이터 드리븐 문화를 위해 극복해야하는 문제들
발표영상 https://youtu.be/X29liXyIo3s
---
PAP가 준비한 팝콘 시즌1에서 프로덕트와 함께 성장하는 데이터 실무자들의 이야기를 담았습니다.
---
PAP(Product Analytics Playground)는 프로덕트 데이터 분석에 대해 편안하게 이야기할 수 있는 커뮤니티입니다.
우리는 데이터 드리븐 프로덕트 문화를 더 많은 분들이 각자의 자리에서 이끌어갈 수 있도록 하는 것을 목표로 합니다.
다양한 직군의 사람들이 모여 프로덕트를 만들듯 PAP 역시 다양한 멤버로 구성되어 있으며, 여러분들의 참여로 만들어집니다.
---
공식 페이지 : https://playinpap.oopy.io
페이스북 그룹 : https://www.facebook.com/groups/talkinpap
팀블로그 : https://playinpap.github.io
6. 강사 소개
6
신효정
shj@cmu.ac.kr
EXPERIENCE
현 창원문성대학교 빅데이터센터, 특임교수
전 카네기멜론대학교, 방문교수
전 삼성전자 메모리사업부, 선임
전 성균관대 정보 및 지능시스템 연구실, 연구원
PROJECTS
농가 데이터 분석 프로젝트
전문가 매칭 플랫폼 컨설팅
이륜 배송 자동 배차 알고리즘 개발
딥러닝 기반 경마데이터 분석
LECTURES
Elastic Stack 적용 방안 강의
엑셀을 활용한 데이터 분석 프로세스 실습 강의
7. 데이터 분석
7
Data analysis is a process of inspecting,
cleaning, transforming, and modeling data with
the goal of discovering useful information,
suggesting conclusions, and supporting decision-
making.
- Wikipedia
8. 데이터 분석
8
Data analysis is a process of inspecting,
cleaning, transforming, and modeling data with
the goal of discovering useful information,
suggesting conclusions, and supporting decision-
making.
- Wikipedia
Actionable Information
9. 데이터 분석 VS 빅데이터 분석
9
Volume
(양)
Variety
(다양)
Velocity
(속도)
Big Data 3Vs
Terabytes
Records
Transactions
Tables, files
Structured
Unstructured
Semistructured
Batch
Near time
Real time
Streams
Value(가치)
Veracity(진실성)
+
21. 퀴즈
21
Company A
> Shopping cart analysis Beer and Diapers
Company B
> Climate + Sales history Tuesday + Rain = Wine A ↑
Actionable Information!!!!
22. 데이터 분석 프로세스
22
What are the information needs?
What sources of data address the needs?
What analytic tasks identify the needed information in the
sources?
What types of analysis best match the analytic task
requirements?
How can the analysis be organized to generate the most
useful information first or generate greatest amount of
information in the least amount of time?
25. 신효정 shj@cmu.ac.kr 010-8940-0728
데이터 분석 프로세스
25
식수 예측이 정확하지 않아
준비한 재료가 낭비 됨
1일 판매량, 가격 등
식수 예측 모델 구축
선형 회귀 분석
문제정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
평가지표 개발
26. 신효정 shj@cmu.ac.kr 010-8940-0728
데이터 분석 프로세스
26
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
오늘의 메뉴 몇 인분 준비 해야 할까?
준비한 재료가 남으면?
준비한 재료가 모자라면?
고추장을 더 사야 할까? 보관할 곳이..
내일 몇 인분이 팔릴지 예측해보자!
29. 신효정 shj@cmu.ac.kr 010-8940-0728
데이터 분석 프로세스
29
문제정의
데이터소스
정의
분석항목
방법론 정의
분석/검증
프로세스 정의
기존에 모은 데이터를 기반으로 예측
모델을 만들 수 있다
비개발자가 만들어야 한다
숫자를 예측해야 한다
엑셀 - 선형 회귀 분석
30. 신효정 shj@cmu.ac.kr 010-8940-0728
데이터 분석 프로세스
30
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
데이터 수집은? 매일 포스기에서
분석 플랫폼은? 엑셀 활용
모델 구축 주기는? 매일
학습데이터는? 150일전~120일전
평가데이터는? 30일전
모델 평가 지표는? 오차율
45. 신효정 shj@cmu.ac.kr 010-8940-0728
사례 : GPS 데이터 분석
45
문제정의 배차 알고리즘 필요
데이터소스
정의 운영 데이터
분석항목
정의 검색엔진 개발
방법론 정의 엘라스틱서치 활용
분석/검증
프로세스 정
의
평가지표 개발
46. 신효정 shj@cmu.ac.kr 010-8940-0728
사례 : GPS 데이터 분석
46
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
31
기존배차 자동배차
운행 중 콜 선택
노하우 학습 필요
비효율적 배차
관리자비용 발생
안전 운행
진입 장벽 낮춤
효율적 배차
관리자비용 감소
48. 신효정 shj@cmu.ac.kr 010-8940-0728
사례 : GPS 데이터 분석
48
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
해당 콜을 수행할 때 예상되는 소요시
간을 과거의 운행 기록에서 검색
5분
20분
22분
6분
35분
49. 신효정 shj@cmu.ac.kr 010-8940-0728
사례 : GPS 데이터 분석
49
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
대량의 데이터에서 빠른 검색이
가능한 검색 엔진 개발 필요
엘라스틱서치 활용
50. 신효정 shj@cmu.ac.kr 010-8940-0728
사례 : GPS 데이터 분석
50
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
데이터 수집은? GPS 수집기
분석 플랫폼은? 엘라스틱서치
모델 구축 주기는? GPS 데이터 수집시
학습데이터는? 1일전 모든 데이터
평가데이터는? 1일전 데이터
모델 평가 지표는? 오차율
51. 신효정 shj@cmu.ac.kr 010-8940-0728
사례 : 대시보드 구축
51
문제정의 매일 엑셀로 리포트 생성
데이터소스
정의
운영 데이터베이스
분석항목
정의
대시보드 개발
방법론 정의 엘라스틱스택 활용
분석/검증
프로세스 정
의
사용자의 피드백
52. 신효정 shj@cmu.ac.kr 010-8940-0728
사례 : 대시보드 구축
52
문제정의
데이터소스
정의
분석항목
정의
방법론 정의
분석/검증
프로세스 정의
어제 총 수익은?
어제 총 판매량은?
어제 판매된 항목은?
매일 아침 9시 엑셀 취합 후 메일 공유
매일 30분 반복 작업
실시간 정보 공유 불가