2. 1
01. 제품 개발 배경
02. 제품 소개(ankus)
TableofContents
03. 별첨
3. 2
정보기술(IT)의 발달로 다양한 형태의 대용량 데이터를 신속히 처리해야 하는 환경에 직면 하게 되면서,
빅데이터 1세대에서는 데이터의 3가지 특징 (Volume, Velocity, Variety)에 주목하게 되었습니다.
이러한 배경속에서 ‘하둡과 같은 빅데이터 시스템(인프라)’분야가 빠르게 발전했습니다.
1.1빅데이터의변화
빅데이터의 3V
4. 3
빅데이터 2세대에서는 데이터에 숨어있는 ‘가치’를 찾는 일 에 집중합니다.
대용량의 데이터를 수집하고 관리하던 문제는
기업이 보유한 데이터에서 핵심 가치를 찾아내는 문제로 발전했습니다.
이제는 데이터로부터 숨겨진 ‘가치’를 찾기 위한 ‘데이터 분석 기술’이 필요 한 때입니다.
1.1빅데이터의변화
빅데이터의 4V
KNOWLEDGE
5. 4
1.2 전통적데이터분석도구
GUI기반데이터마이닝/기계학습분석 스크립트언어기반통계/응용분석및시각화
워크플로우기반데이터마이닝/기계학습분석
IBM SPSS Modeler SAS Enterprise Miner ECMiner
WEKA R (Rstudio)
빅데이터가나타나기이전부터데이터
에숨어있는새롭고,가치있고,유용한
정보를찾기위한노력은계속되어왔으
며,데이터마이닝/기계학습은가장중
요한데이터분석기법으로자리잡았
습니다.
데이터마이닝/기계학습기반의데이
터분석을위해서전통적으로WEKA,
R, SAS Enterprise Miner,
ECMiner, IBM SPSS Modeler
등이사용되어왔습니다.
6. 5
1.3 전통적데이터분석도구의 한계
데이터 전처리 요청
하둡 기반 빅데이터 인프라
…
namenode datanode-1 datanode-2 datanode-3 datanode-n
전처리 데이터 추출
관리
데이터수집및분석서버
전통적 도구를
이용한
빅데이터 분석
분산/병렬처리인프라
에서의분석필요
• 분석하고자 하는 데이터의 전처리 및
추출 작업필요
• 분석 수행을 위한 별도의 서버 필요
• 분석 서버 용량을 초과하는 대용량데이
터 처리불가
Hadoop 기반의 분산 빅데이터 환경
전통적데이터분석도구들은분석도구
가설치된개별서버에서분석이이루어
집니다.
하둡과같은빅데이터인프라와데이터
연계는가능하지만,분석자체를하둡의
분산·병렬처리인프라에서수행하지못
하고,별도의분석서버에서수행해야
합니다.
이때문에,하둡기반의빅데이터환경
에서직접운용가능한분산기반데이
터분석도구들의필요성이대두되었습
니다.
7. 6
Hbase
Columnar
Store
HCatalog
Meta Data
MapReduce
Distributed Processing
Framework
1.4 하둡기반데이터분석도구
* Apache Hadoop Ecosystem
Ambari
Provisioning, Managing and Monitoring Hadoop Clusters
Oozie
Workflow
HDFS
Hadoop Distributed File System
Tajo
Real-time
SQL Query
Impala
Real-time
SQL Query
Hive
SQL Query
Pig
Scripting
Mahout
Data Mining
Zookee
per
Coordinati
on
Avro
Data
Serialization
System
Hiho
Data
Exchanger
Scoop
Data
Exchanger
Chukwa
Log Collector
Flume
Log Collector
하둡 작업에 대한 워크플로우 관리 SQL/Script/CLI 기반 데이터 분석
빅데이터분산관리/처리환경인하둡
시스템에서운용가능한데이터분석도
구로는Pig, Hive, Mahout, Tajo,
Impala 등이있으며,
워크플로우관리를위한도구로는
Oozie가있습니다.
이중Mahout은유일하게데이터마
이닝/기계학습기반의데이터분석이
가능한도구로알려져있습니다.
19. 18
3.1추가정보
시스템요구사항 듀얼라이선스 기술지원
ankus 프레임워크운영환경요구
사항입니다.
• Java 7.0 이상
• Hadoop 1.0.3 이상
• MySQL 5.5 이상
• Tomcat 7.0 이상
• Linux OS
ankus는듀얼라이선스정책을따릅니다.
• Community License
연구또는비영리목적으로사용하는모든개인
사용자에게 적용되는라이선스로apache 2.0,
GPL v3의공개SW 라이선스규정이적용됩니
다.
• Commercial License
영리목적으로사용하거나공공/기관등개인사
용자가아닌경우에적용되는라이선스입니다.추
가적으로제품배포시적용되는코드공개등의
공개SW라이선스의무사항을회피하고싶은경
우에도적용가능합니다. ankus framework를
이용하여새로운상업용SW를개발하거나민간/
공공프로젝트에솔루션형태로사용하고자하는
경우에도Commercial License가적용되어야
합니다.
다음과같은다양한경로를통해기술지원을받을수있습니다.
• ankus 공식홈페이지
공개SW인ankus를다운로드받고,메뉴별정의서,사용자매뉴얼,테스트케이
스등을확인하실수있습니다.
http://www.openankus.org
• ankus 프레임워크다운로드
http://github.com/suhyunjeon/ankus
http://github.com/suhyunjeon/ankus-web
http://sourceforge.net/projects/ankus
• ankus 프레임워크정보확인및토론이가능한사용자그룹입니다.
http://www.facebook.com/groups/openankus
http://goo.gl/d8nP81 (구글그룹스사용자포럼)
• 데모동영상
문자형데이터셋유사도
http://goo.gl/YjR05G
• 바이너리형데이터셋유사도
http://goo.gl/0vp3pO
• 문의처
ankus@openankus.org
20. 19
3.2회사소개
성공적인 비즈니스로 세상을 이끌어가는 주역 ‘어니컴'
어니컴 주식회사는 설립이래 항상 시대의 주역이 되기 위해 끊임없이 노력하고
성장하고 있습니다.
어니컴은 IT에 대한 기술적 전문성과 고객산업에 대한 이해를 바탕으로 고객지
원솔루션, BCI, Application 등 다양한 산업 분야 전반에 걸쳐 컨설팅에서 시스템
구축 및 유지 보수에 이르기까지 IT와 관련된 Total Service를 제공하며 고객가
치 극대화에 기여해 왔습니다.
또한, 모바일 관련 분야를 중점으로 SmartSolution, Smart Service, SI 분야로
Smart한 세상에 한발 앞서 나가기 위해 끊임없는 노력을 하고 있습니다.
어니컴은 성공적인 비즈니스로 새로운 세상을 이끌어 가는 주역이 되겠습니다.
인증 및 수상내역 기업정보
설립일:1998년 9월
회사명:어니컴 주식회사
대표이사:지영만
직원수:200명
사업분야:SmartSolution/
SmartService/ SI
위치정보
본사
서울시 중구 세종대로21길, 22
태성빌딩4층
기업부설연구소
경기도 용인시 기흥구 영덕동 1029
U-Tower 2809호 어니컴㈜ 기업부
설연구소