ݺߣ

ݺߣShare a Scribd company logo
소셜데이터의 재구성
LG CNS SMA/CRM팀
남궁현 nghyun@lgcns.com
@gmail.com
데이터 재구성
데이터 분석
재구성분석
proactivepassive
분석
데이터
분석결과
/ 보고서
Data Analyst
재구성
데이터
분석
해석
시각화
가공데이터
인사이트
분석결과
/보고서
Cleansing
Data Modeling
Adaptation
Physical Architecture
Fast Processing
Data Handling
Data Analysis
Data&
Infrastructure
Insight&
Report
Network Analysis Content Analysis
Semi/Structured Data Un-structured Data
소셜 데이터
비정형 텍스트 데이터의 재구성
소셜 데이터의
Content Analysis를 위한
#SmartSMA #InsightReport
LG CNS SMA/CRM@ @
#과장
#분석파트장
#박사
#시맨틱웹
#온톨로지
#의료정보
#빅데이터
#공공데이터
#연구소
#소셜데이터
#텍스트 분석
#Linked Data
#Knowledge Base
nghyun@gmail.com
재구성
데이터 데이터분석
Relating un-structured Data to
Ontology / Structured Knowledge
Semantic Annotation
Ontology Enrichment
Ontology Population
In Semantic Web Area
2007 2011
Linked Data
Currently
Realization of Ontology Enriched
From http://linkeddata.org/
Rich Snippets Realization of Ontology Enriched
See https://developers.google.com/structured-data/
https://www.wikipedia.org/
http://www.yelp.com/ https://www.freebase.com/
Nearly Artificial Intelligence ≈ Answering Systems
Structured
Semi-Structured
Un-Structured
By Rich Snippets
Data Extraction, 자연어처리
저흰 주로
여기 있네요
Attachment
Attachment
Structured
Semi-Structured
Un-Structured
Not Here?
Why?
Approximately 90% of the world’s data is held in unstructured formats
90%
Structured Numerical or Coded
Information
10%
Unstructured or Semi-structured
Information
Possibilities ..
By http://www.oracle.com, 2012
No, Schema.org
http://schema.org/
No, Linked Data Cloud
From http://linkeddata.org/
Data Extraction 자연어처리
Scraping a.k.a. Focused Crawling
HTML Tag, DOM Handling
Instance Extraction
긍부정 분석
Topic Modeling (LDA)
Word Counting 모호성 해소
문서분류
What we do
Semi-Structured
Un-Structured
틶
From **전자 김치냉장고 마케팅분석 by LG CNS
From **전자 김치냉장고 마케팅분석 by LG CNS
From *** 녹즙 마케팅포인트분석 by LG CNS
From **카드 신규카드 마케팅 전략 by LG CNS
From (NIA-BC카드 빅데이터 시범사업) SixPocket 분석 by LG CNS
At SmartSMA ShowRoom - http://smartsma.co.kr
+
틶
데이터
Structured
Data
Un-Structured
Data
Know-How
LG CNS SMA/CRM@ @
Tools
데이터_crawling
ABcrawler by LG CNS
Available at: https://www.odpia.org
틶_Data Modeling
틶
BM 소셜데이터내부데이터 외부데이터
재구성_Defined Rules
SAS Content Categorizer
http://www.sas.com/
재구성_After Parser
Morpheme Anal. User Dic.
Patterned Str.
Text Prism by LG CNS
Available at: https://www.odpia.org
재구성_Machine Learning
WSD module by LG CNS & BilKE Lab(http://bike.sn.ac.kr)
시각화
가공데이터 인사이트
해석
분석_Where we create Values
www.odpia.org
Big Picture
Social Data
in Classifications
Indexed
Reputations
Tangible Tools
Data, and
Alliances
From 분석 갤러리 in https://www.odpia.org/
정돈된 데이터 Tools & Know-How
in
Q & A
감사합니다.
Self Q & A
근데 *G의 마케팅은 왜 그런가요?

More Related Content

소셜데이터의 재구성