ݺߣ

ݺߣShare a Scribd company logo
데이터 읽는 남자
6번째 숵ӄ
김영웅
꿈꾸는 데이터 디자이너 매니저
M.I.S 전공 박사과정
MBA (통신미디어트랙)
컴퓨터공학 전공
Ryan Kim | Convergence Business Designer
Facebook. https://www.facebook.com/keyassist
E-mail. youngwung.kim@gmail.com
Web. http://keyassist.tistory.com
데이터.읽는.남자
[week6] 데이터읽어주는남자
[week6] 데이터읽어주는남자
Data Centric
<source=http://www.i-scoop.eu/can-survive-age-integration-collaboration>
[week6] 데이터읽어주는남자
Categories of Data Scientists
Those strong in statistics: they sometimes develop new statistical theories for big data, that even traditional statisticians are
not aware of. They are expert in statistical modeling, experimental design, sampling, clustering, data reduction, confidence
intervals, testing, modeling, predictive modeling and other related techniques.
Those strong in mathematics: NSA (national security agency) or defense/military people working on big data, astronomers,
and operations research people doing analytic business optimization (inventory management and forecasting, pricing
optimization, supply chain, quality control, yield optimization) as they collect, analyse and extract value out of data.
Those strong in data engineering, Hadoop, database/memory/file systems optimization and architecture, API's, Analytics as
a Service, optimization of data flows, data plumbing.
Those strong in machine learning / computer science (algorithms, computational complexity)
Those strong in business, ROI optimization, decision sciences, involved in some of the tasks traditionally performed by
business analysts in bigger companies (dashboards design, metric mix selection and metric definitions, ROI optimization, high-
level database design)
Those strong in production code development, software engineering (they know a few programming languages)
Those strong in visualization
Those strong in GIS, spatial data, data modeled by graphs, graph databases
Those strong in a few of the above. After 20 years of experience across many industries, big and small companies (and lots of
training), I'm strong both in stats, machine learning, business, mathematics and more than just familiar with visualization and
data engineering. This could happen to you as well over time, as you build experience. I mention this because so many people
still think that it is not possible to develop a strong knowledge base across multiple domains that are traditionally perceived as
separated (the silo mentality). Indeed, that's the very reason why data science was created.
Most of them are familiar or expert in big data.
There are other ways to categorize data scientists, see for instance our article on Taxonomy of data scientists. A different
categorization would be creative versus mundane. The "creative" category has a better future, as mundane can be outsourced
(anything published in textbooks or on the web can be automated or outsourced - job security is based on how much you know
that no one else know or can easily learn). Along the same lines, we have science users (those using science, that is,
practitioners; often they do not have a PhD), innovators (those creating new science, called researchers), and hybrids. Most
data scientists, like geologists helping predict earthquakes, or chemists designing new molecules for big pharma, are scientists,
and they belong to the user category.
Implications for other IT professionals
You (engineer, business analyst) probably do already a bit of data science work, and know already some of the stuff that some
data scientists do. It might be easier than you think to become a data scientist. Check out our book (listed below in "related
articles"), to find out what you already know, what you need to learn, to broaden your career prospects.
Are data scientists a threat to your job/career? Again, check our book (listed below) to find out what data scientists do, if the
risk for you is serious (you = the business analyst, data engineer or statistician; risk = being replaced by
a data scientist who does everything) and find out how to mitigate the risk (learn some of the data scientist skills from our
book, if you perceive data scientists as competitors)
[week6] 데이터읽어주는남자
[week6] 데이터읽어주는남자
<source=http://a16z.com/2014/01/14/the-four-stages-of-disruption/>
[week6] 데이터읽어주는남자
이 책은 데이터 과학에 대해 입문하려는 사람에게 적절한 책입니다. 단순하게 분석사례를 서술
한 기술서가 아니라 분석의 필요성, 의미, 그것을 위한 기반지식까지 상당히 쉽게 안내하고 있습
니다. 빅데이터라는 단어와 함께 필요이상으로 남달되는 '데이터 분석' 분야에 대해 체계적으로
설명하고 있으니, 이 카테고리에 관심이 있으시다면 이 책을 읽고 나서 전체적인 감을 잡으실 수
있습니다. 책 자체가 그리 두꺼운 편이 아니고 내용도 쉽게 기술되어 있기 때문에 전문을 읽는데
그리 오랜 시간이 걸리지는 않습니다.
<source=http://keyassist.tistory.com/150>
데이터 분석의 가장 큰 효과는 

'의사 결정 프로세스의 최적화'

-'데이터 분석을 시작하려는 사람을 위한 책', p.15
복잡한 수리 모델을 구축하는 것도 대규모 데이터를 빠르게 처리하는
것도 아니다. 단순하면서도 운용하기 쉽게, 한정된 경영 자원이나 정책
자원을 효율적으로 사용할 수 있도록 의사 결정을 지원하는 것. 바로 이
것이 데이터 분석의 진정한 가치라고 할 수 있다
-'데이터 분석을 시작하려는 사람을 위한 책', p.15
데이터 분석이 성공하기 위한 다섯 가지 요소
-'데이터 분석을 시작하려는 사람을 위한 책', p.40
1) 분석 대상의 데이터와 분석 기반이 있다

2) 목적과 경영 과제가 명확하다

3) 첨단 기술을 보유하고 있으며 인식 능력이 있는 실행팀

4) 경영층의 지원

5) 열정과 창의력이 있는 인재
-'데이터 분석을 시작하려는 사람을 위한 책', p.46
요컨대 목적에 따라 통계나 분석 수법을 올바르게 실천해 결과를 이끌
어내는 것이 중요하며, 이를 위해 분석 담당자는 단순히 분석 자체에 재
미를 느끼는 것으로 끝내서는 안 된다. 협업 필터링 같은 일부를 제외하
면 통계나 기계 학습 자체에는 의사 결정을 완전 자동화하는 힘이 없다.
어디까지나 의사 결정의 최적화를 지원할 뿐이다. 그런데 이 본질을 이
해하지 못하는 사람이 많은 것이 현실이다.
-'데이터 분석을 시작하려는 사람을 위한 책', p.120
위기의식을 항상 느끼는 데이터 과학자는 데이터의 사전 처리와 분석
수법 선정, 유의성 검정 등 화려하지 않은 작업의 중요성을 잘 알고 있
다. 그러나 경험이 일천한 분석자 중에는 분석 대상에 관심을 보이기보
다 최첨단 분석 수법이나 도구에 정신이 팔려 이런 과정을 생략하고 숫
자와 씨름하는 데만 열중하는 사람도 있다.
-'데이터 분석을 시작하려는 사람을 위한 책', p.136
데이터 분석 프로젝트를 성공시킬 때 중요한 것은 분석 자체가 아니라
분석을 통해 얻은 결과를 현장의 프로세스에 반영하는 것이다. 그러나
분석 결과를 과신하다 현장에 예측 모델을 도입하는 단계에서 큰 실패
를 맛보는 경우가 있다. 올바른 프로세스를 통해 분석한 결과는 높은 정
확도로 현실을 말해 준다. 그러나 단순히 그 결과를 보여주기만 해서는
사람, 즉 조직은 움직이지 않는다.
"Efforts and courage are not enough
without purpose and direction."
노력이나 용기 있는 한 발을 내디뎠다고 해도 

목적이나 착지점에 대한 방향성이 없다면 

그 노력이나 행동의 결과는 

충분하지 못한 것이 될 것이다.

John F. Kennedy
[week6] 데이터읽어주는남자
[week6] 데이터읽어주는남자

More Related Content

What's hot (9)

PDF
꿈꾸는데이터디자이너 설명회 2부
Hanyang University
PDF
디포커스 전홍구
Newsjelly
PDF
꿈꾸는 데이터 디자이너 1기를 끝내며
neuroassociates
PDF
꿈꾸는 데이터 디자이너 시즌2 교육설명회
neuroassociates
PDF
DLAB company info and big data case studies
DLAB
PDF
뉴스생태계와 알고리즘의 역할 - CMS를 중심으로
Sungkyu Lee
PPSX
데이터 분석 프로세스
Lee Seungeun
PDF
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
Myungjin Lee
PDF
데이터 활용 스타트업을 위한 특화 지원사업 DB-Stars 안내
Dylan Ko
꿈꾸는데이터디자이너 설명회 2부
Hanyang University
디포커스 전홍구
Newsjelly
꿈꾸는 데이터 디자이너 1기를 끝내며
neuroassociates
꿈꾸는 데이터 디자이너 시즌2 교육설명회
neuroassociates
DLAB company info and big data case studies
DLAB
뉴스생태계와 알고리즘의 역할 - CMS를 중심으로
Sungkyu Lee
데이터 분석 프로세스
Lee Seungeun
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
Myungjin Lee
데이터 활용 스타트업을 위한 특화 지원사업 DB-Stars 안내
Dylan Ko

Viewers also liked (12)

PDF
ڰ±3ᅦᅵᅥᅵᆰᄋƥᄌƮƳᆫᅡᆷᄌơ
neuroassociates
PDF
Doing data science chap11
Keunhyun Oh
PDF
데이터 사이언티스트 키노트 Pt 20141008
Myung-Hoe Huh
PDF
ڰ±4ᅦᅵᅥᅵᆰᄋƥᄌƮƳᆫᅡᆷᄌơ
neuroassociates
PPTX
Lean Analytics_cojette
JeongMin Kwon
PPTX
데이터 사이언스 소개 - 정준호
준호 정
PPTX
[패스트캠퍼스] Making Travel Schedule
Jeong-Ho Lee
PPTX
R & big data analysis 20120531
JeongMin Kwon
PPTX
[2A7]Linkedin'sDataScienceWhyIsItScience
NAVER D2
PDF
[2A6]web & health 2.0. 회사에서의 data science란?
NAVER D2
PPTX
실리콘 밸리 데이터 사이언티스트의 하루
Jaimie Kwon (권재명)
PDF
어떻게 하면 데이터 사이언티스트가 될 수 있나요?
Yongho Ha
ڰ±3ᅦᅵᅥᅵᆰᄋƥᄌƮƳᆫᅡᆷᄌơ
neuroassociates
Doing data science chap11
Keunhyun Oh
데이터 사이언티스트 키노트 Pt 20141008
Myung-Hoe Huh
ڰ±4ᅦᅵᅥᅵᆰᄋƥᄌƮƳᆫᅡᆷᄌơ
neuroassociates
Lean Analytics_cojette
JeongMin Kwon
데이터 사이언스 소개 - 정준호
준호 정
[패스트캠퍼스] Making Travel Schedule
Jeong-Ho Lee
R & big data analysis 20120531
JeongMin Kwon
[2A7]Linkedin'sDataScienceWhyIsItScience
NAVER D2
[2A6]web & health 2.0. 회사에서의 data science란?
NAVER D2
실리콘 밸리 데이터 사이언티스트의 하루
Jaimie Kwon (권재명)
어떻게 하면 데이터 사이언티스트가 될 수 있나요?
Yongho Ha
Ad

Similar to [week6] 데이터읽어주는남자 (20)

PDF
Learning dataanalyst 2020oct_yonsei
Isabel Myeongju Han
PDF
데이터 분석가는 어떤 SKILLSET을 가져야 하는가? - 데이터 분석가 되기
Hui Seo
PDF
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
Jungmin Lee
PDF
How to Create Value from Data, and Its Difficulty
Dataya Nolja
PDF
분석 현장에서 요구되는 데이터과학자의 역량과 자질
Sun Young Kim
PDF
빅데이터 전문가 / 데이터 사이언티스트 커리어에 대한 고려 사항과 사례 - Gonnector 고영혁 (Dylan Ko)
Dylan Ko
PDF
[D2 CAMPUS] Tech meet-up `data science` 발표자료
NAVER D2
PDF
데이터를 비즈니스에 활용하기 왜 어려울까?
Glen Park
PDF
RUCK 2017 권재명 효율적 데이터 과학과 데이터 조직을 위한 7가지 요인
r-kor
PDF
효율적 데이터 과학을 위한 7가지 팁
Jaimie Kwon (권재명)
PDF
데이터는 차트가 아니라 돈이 되어야 한다.
Yongho Ha
PDF
데이터가 흐르는 조직 만들기 - 마이리얼트립
승화 양
PPTX
From Data Literacy to Data Fluency
sidney yang
PDF
데이터과학의 정의와 대표과제 도출
SRCDSC
PDF
2 기업의빅데이터delta전략 이진권
Saltlux Inc.
PDF
데이터 분석 동향과 비즈스프링이 제공하는 데이터
BizSpring Inc.
PDF
데이터분석과통계2 - 최재걸님
NAVER D2
PPTX
개발자가 이해하는 분석
동철 박
PDF
빅데이터의 다음 단계는 예측 분석이다
Kyunghoon Kim
PDF
통계분석연구회 2016년 여름 맞이 추천 도서와 영상
백승민 Baek Seung Min
Learning dataanalyst 2020oct_yonsei
Isabel Myeongju Han
데이터 분석가는 어떤 SKILLSET을 가져야 하는가? - 데이터 분석가 되기
Hui Seo
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
Jungmin Lee
How to Create Value from Data, and Its Difficulty
Dataya Nolja
분석 현장에서 요구되는 데이터과학자의 역량과 자질
Sun Young Kim
빅데이터 전문가 / 데이터 사이언티스트 커리어에 대한 고려 사항과 사례 - Gonnector 고영혁 (Dylan Ko)
Dylan Ko
[D2 CAMPUS] Tech meet-up `data science` 발표자료
NAVER D2
데이터를 비즈니스에 활용하기 왜 어려울까?
Glen Park
RUCK 2017 권재명 효율적 데이터 과학과 데이터 조직을 위한 7가지 요인
r-kor
효율적 데이터 과학을 위한 7가지 팁
Jaimie Kwon (권재명)
데이터는 차트가 아니라 돈이 되어야 한다.
Yongho Ha
데이터가 흐르는 조직 만들기 - 마이리얼트립
승화 양
From Data Literacy to Data Fluency
sidney yang
데이터과학의 정의와 대표과제 도출
SRCDSC
2 기업의빅데이터delta전략 이진권
Saltlux Inc.
데이터 분석 동향과 비즈스프링이 제공하는 데이터
BizSpring Inc.
데이터분석과통계2 - 최재걸님
NAVER D2
개발자가 이해하는 분석
동철 박
빅데이터의 다음 단계는 예측 분석이다
Kyunghoon Kim
통계분석연구회 2016년 여름 맞이 추천 도서와 영상
백승민 Baek Seung Min
Ad

More from neuroassociates (20)

PDF
[Week20] D3.js_Mapping
neuroassociates
PDF
[week17] D3.js_Tooltip
neuroassociates
PDF
[week16] D3.js_Transition
neuroassociates
PDF
[week8] 데이터읽어주는남자
neuroassociates
PDF
[Week15] D3.js_Scatter_Chart
neuroassociates
PDF
[Week14] D3.js_Scale and Axis (보충자료)
neuroassociates
PDF
[Week14] D3.js_Scale and Axis
neuroassociates
PDF
[Week13] D3.js_Bar Chart
neuroassociates
PDF
[Week12] D3.js_Basic2
neuroassociates
PDF
[week12] D3.js_Basic
neuroassociates
PDF
[week11] R_ggmap, leaflet
neuroassociates
PDF
[week9]R_statics
neuroassociates
PDF
[Week8]R_ggplot2
neuroassociates
PDF
[week7]R_Wrangling(2)
neuroassociates
PDF
[week6]R_Wrangling
neuroassociates
PDF
[Week5]R_scraping
neuroassociates
PDF
[Week4] Google refine
neuroassociates
PDF
[시즌2, week3] R Basic
neuroassociates
PDF
꿈꾸는 데이터 디자이너 시즌2 교육 설명회 2부
neuroassociates
PDF
[week16] D3.js (Scale & axis)
neuroassociates
[Week20] D3.js_Mapping
neuroassociates
[week17] D3.js_Tooltip
neuroassociates
[week16] D3.js_Transition
neuroassociates
[week8] 데이터읽어주는남자
neuroassociates
[Week15] D3.js_Scatter_Chart
neuroassociates
[Week14] D3.js_Scale and Axis (보충자료)
neuroassociates
[Week14] D3.js_Scale and Axis
neuroassociates
[Week13] D3.js_Bar Chart
neuroassociates
[Week12] D3.js_Basic2
neuroassociates
[week12] D3.js_Basic
neuroassociates
[week11] R_ggmap, leaflet
neuroassociates
[week9]R_statics
neuroassociates
[Week8]R_ggplot2
neuroassociates
[week7]R_Wrangling(2)
neuroassociates
[week6]R_Wrangling
neuroassociates
[Week5]R_scraping
neuroassociates
[Week4] Google refine
neuroassociates
[시즌2, week3] R Basic
neuroassociates
꿈꾸는 데이터 디자이너 시즌2 교육 설명회 2부
neuroassociates
[week16] D3.js (Scale & axis)
neuroassociates

[week6] 데이터읽어주는남자

  • 2. 김영웅 꿈꾸는 데이터 디자이너 매니저 M.I.S 전공 박사과정 MBA (통신미디어트랙) 컴퓨터공학 전공 Ryan Kim | Convergence Business Designer Facebook. https://www.facebook.com/keyassist E-mail. youngwung.kim@gmail.com Web. http://keyassist.tistory.com 데이터.읽는.남자
  • 8. Categories of Data Scientists
  • 9. Those strong in statistics: they sometimes develop new statistical theories for big data, that even traditional statisticians are not aware of. They are expert in statistical modeling, experimental design, sampling, clustering, data reduction, confidence intervals, testing, modeling, predictive modeling and other related techniques. Those strong in mathematics: NSA (national security agency) or defense/military people working on big data, astronomers, and operations research people doing analytic business optimization (inventory management and forecasting, pricing optimization, supply chain, quality control, yield optimization) as they collect, analyse and extract value out of data. Those strong in data engineering, Hadoop, database/memory/file systems optimization and architecture, API's, Analytics as a Service, optimization of data flows, data plumbing. Those strong in machine learning / computer science (algorithms, computational complexity) Those strong in business, ROI optimization, decision sciences, involved in some of the tasks traditionally performed by business analysts in bigger companies (dashboards design, metric mix selection and metric definitions, ROI optimization, high- level database design) Those strong in production code development, software engineering (they know a few programming languages) Those strong in visualization Those strong in GIS, spatial data, data modeled by graphs, graph databases
  • 10. Those strong in a few of the above. After 20 years of experience across many industries, big and small companies (and lots of training), I'm strong both in stats, machine learning, business, mathematics and more than just familiar with visualization and data engineering. This could happen to you as well over time, as you build experience. I mention this because so many people still think that it is not possible to develop a strong knowledge base across multiple domains that are traditionally perceived as separated (the silo mentality). Indeed, that's the very reason why data science was created. Most of them are familiar or expert in big data. There are other ways to categorize data scientists, see for instance our article on Taxonomy of data scientists. A different categorization would be creative versus mundane. The "creative" category has a better future, as mundane can be outsourced (anything published in textbooks or on the web can be automated or outsourced - job security is based on how much you know that no one else know or can easily learn). Along the same lines, we have science users (those using science, that is, practitioners; often they do not have a PhD), innovators (those creating new science, called researchers), and hybrids. Most data scientists, like geologists helping predict earthquakes, or chemists designing new molecules for big pharma, are scientists, and they belong to the user category. Implications for other IT professionals You (engineer, business analyst) probably do already a bit of data science work, and know already some of the stuff that some data scientists do. It might be easier than you think to become a data scientist. Check out our book (listed below in "related articles"), to find out what you already know, what you need to learn, to broaden your career prospects. Are data scientists a threat to your job/career? Again, check our book (listed below) to find out what data scientists do, if the risk for you is serious (you = the business analyst, data engineer or statistician; risk = being replaced by a data scientist who does everything) and find out how to mitigate the risk (learn some of the data scientist skills from our book, if you perceive data scientists as competitors)
  • 15. 이 책은 데이터 과학에 대해 입문하려는 사람에게 적절한 책입니다. 단순하게 분석사례를 서술 한 기술서가 아니라 분석의 필요성, 의미, 그것을 위한 기반지식까지 상당히 쉽게 안내하고 있습 니다. 빅데이터라는 단어와 함께 필요이상으로 남달되는 '데이터 분석' 분야에 대해 체계적으로 설명하고 있으니, 이 카테고리에 관심이 있으시다면 이 책을 읽고 나서 전체적인 감을 잡으실 수 있습니다. 책 자체가 그리 두꺼운 편이 아니고 내용도 쉽게 기술되어 있기 때문에 전문을 읽는데 그리 오랜 시간이 걸리지는 않습니다. <source=http://keyassist.tistory.com/150>
  • 16. 데이터 분석의 가장 큰 효과는 '의사 결정 프로세스의 최적화' -'데이터 분석을 시작하려는 사람을 위한 책', p.15
  • 17. 복잡한 수리 모델을 구축하는 것도 대규모 데이터를 빠르게 처리하는 것도 아니다. 단순하면서도 운용하기 쉽게, 한정된 경영 자원이나 정책 자원을 효율적으로 사용할 수 있도록 의사 결정을 지원하는 것. 바로 이 것이 데이터 분석의 진정한 가치라고 할 수 있다 -'데이터 분석을 시작하려는 사람을 위한 책', p.15
  • 18. 데이터 분석이 성공하기 위한 다섯 가지 요소 -'데이터 분석을 시작하려는 사람을 위한 책', p.40 1) 분석 대상의 데이터와 분석 기반이 있다 2) 목적과 경영 과제가 명확하다 3) 첨단 기술을 보유하고 있으며 인식 능력이 있는 실행팀 4) 경영층의 지원 5) 열정과 창의력이 있는 인재
  • 19. -'데이터 분석을 시작하려는 사람을 위한 책', p.46 요컨대 목적에 따라 통계나 분석 수법을 올바르게 실천해 결과를 이끌 어내는 것이 중요하며, 이를 위해 분석 담당자는 단순히 분석 자체에 재 미를 느끼는 것으로 끝내서는 안 된다. 협업 필터링 같은 일부를 제외하 면 통계나 기계 학습 자체에는 의사 결정을 완전 자동화하는 힘이 없다. 어디까지나 의사 결정의 최적화를 지원할 뿐이다. 그런데 이 본질을 이 해하지 못하는 사람이 많은 것이 현실이다.
  • 20. -'데이터 분석을 시작하려는 사람을 위한 책', p.120 위기의식을 항상 느끼는 데이터 과학자는 데이터의 사전 처리와 분석 수법 선정, 유의성 검정 등 화려하지 않은 작업의 중요성을 잘 알고 있 다. 그러나 경험이 일천한 분석자 중에는 분석 대상에 관심을 보이기보 다 최첨단 분석 수법이나 도구에 정신이 팔려 이런 과정을 생략하고 숫 자와 씨름하는 데만 열중하는 사람도 있다.
  • 21. -'데이터 분석을 시작하려는 사람을 위한 책', p.136 데이터 분석 프로젝트를 성공시킬 때 중요한 것은 분석 자체가 아니라 분석을 통해 얻은 결과를 현장의 프로세스에 반영하는 것이다. 그러나 분석 결과를 과신하다 현장에 예측 모델을 도입하는 단계에서 큰 실패 를 맛보는 경우가 있다. 올바른 프로세스를 통해 분석한 결과는 높은 정 확도로 현실을 말해 준다. 그러나 단순히 그 결과를 보여주기만 해서는 사람, 즉 조직은 움직이지 않는다.
  • 22. "Efforts and courage are not enough without purpose and direction." 노력이나 용기 있는 한 발을 내디뎠다고 해도 목적이나 착지점에 대한 방향성이 없다면 그 노력이나 행동의 결과는 충분하지 못한 것이 될 것이다. John F. Kennedy