ݺߣ

ݺߣShare a Scribd company logo
FLEXINK
워드벡터를 활용한
관광지 리뷰 ѫ싵ӊ템
FLEXINK
TABLE OF AGENDA
회사개요01
관광지 리뷰 ѫ싵ӊ템02
향후 목표03
3
www.flexink.com
회사개요
FLEXINK 4
데이터 분석에 기반한
콘텐츠 크리에이터 컴퍼니
서비스 디자인 및 컨설팅
통계자료에 기초한 서비스 디자인 및 컨설팅
신재생 에너지 데이터 분석
신재생 에너지 관련 데이터 분석 및 시각화
데이터 분석 리포팅 서비스
관광산업분야의 데이터 분석 리포트 제공
관광/문화 콘텐츠 개발
웰니스 관광 콘텐츠 개발 및 컨설팅
5
민관(제주도청+카카오) 융합형
데이터 포털 서비스 개발 및
데이터 분석 리포트 제공
제주데이터허브
구축(2017)
제주지역 데이터 공유 포털
서비스 구축
6
데이터 수집 및 분석
수요기업 컨설팅
중소기업
빅데이터활용
지원사업(2018)
지역 중소기업을 대상으로
관광/여행 빅데이터 분석 서비스 제공
7
워드벡터 기반의
관광 데이터 분석 기술을 활용한
서비스 제공
웰니스관광
O2O
플랫폼구축
빅데이터 기반의 맞춤형 관광서비스 O2O 플랫폼
(with 세종대학교 인공지능빅데이터 연구센터)
8
플렉싱크 + 세종대학교 인공지능 빅데이터 연구센터
관광지 리뷰
ѫ싵ӊ템
FLEXINK 9
트렌드에 민감한 관광산업 분야의
데이터 기반 의사결정 가이드라인 구축시스템 개발목표
긍정/부정 감정의
발생원인 파악
실용적
데이터 분석서비스 구축
소규모 관광사업자의
의사결정지원
FLEXINK
서비스 플로우
국내외 관광리뷰 수집
데이터셋 생성
워드 임베딩
(Word2Vec)
딥러닝 모델
입출력 설계
모델 설계
모델학습
모델실험 및 성능측정
성능측정
파라미터 조정
테스트 모듈
입력 데이터 처리
긍정/부정 분류
사용자 유형분류
데이터셋 유형분류
유형별 서비스 매칭
추천상품 매칭
서비스 최적화
전략수립
상품개발
FLEXINK 11
동남아 국가의 제주관광 리뷰 및 여행기 수집
분석의 편의를 위해 영어로 리뷰를 번역 후 진행수집 프로세스
< 웹 크롤링 > < 문서 파싱 > < 데이터 전처리 > < 데이터 저장 >
HTML 문서
Parser
(BeautifulSoup)
사이트 구조 파악
게시글 추출
리뷰 데이터
(텍스트)
크롤러
Requests
전처리 모듈
리뷰 데이터
(제목, 내용, 날짜,
평점)이미지, 불필요한
특수문자 등 제거
텍스트 정제
데이터 수집 서버
동남아 및 일본어
리뷰 및 여행기 수집 사이트
FLEXINK 12
관광지의 8개 속성을 활용하여 사전 구축
워드넷 패키지를 통한 유사어 및 동의어 수집속성 사전 구축
< 속성 단어 설정 > < 1차 속성 사전 생성 > < 유사어(동의어) 추가 > < 최종 속성 사전 저장 >
여행 관련
속성 단어 설정
각 속성 별
단어 추가
WordNet
중복 단어 제거
숙어/연어 제거
속성 사전 DB
1차 속성사전
유사어(동의어)
확대
FLEXINK 13
딥러닝 기반의 감성분석기 구현
각 리뷰의 긍정-부정 평가작업 수행감성분석
딥러닝 모델
설계 모듈
입출력 설계
모델 설계
모델 실험 및
성능 측정 모듈
성능 측정
파라미터 조정
데이터셋
생성 모듈
워드 임베딩
(Word2Vec)
DNN 모델 DNN 모델
모델 학습
테스트 모듈
입력 데이터 처리
긍정/부정 분류
< 데이터 셋 준비 > < 딥러닝 모델 생성 및 학습 > < 실험 및 성능 측정 > < 긍정/부정 분류 테스트 >
Text Data
Sentiment
Analysis
Model
P
N
FLEXINK 14
분석결과 시각화
<국가별 긍정리뷰 생성 비율> <국가별 리뷰 생성 추이>
FLEXINK 15
리뷰 데이터 시각화
<긍정리뷰의 영문번역> <부정리뷰의 영문번역> <속성별 감정요소>
FLEXINK 16
키워드 네트워크
FLEXINK 17
서비스 구현 ˳황
FLEXINK 18
서비스 사용˳황
중국어
데이터
한국어
데이터
인도네시아 일본어 기타
80%
45%
회원가입자 수
사용자 ˳황
2,712
사이트 임시 오픈 후 국내외 회원 가입자 수 2,172명 확보
사용자 트래픽 ˳황
31,215
10,211
345
5.127
194
19
플렉싱크 + 세종대학교 인공지능 빅데이터 연구센터
향후
추진계획
FLEXINK 20
데이터 수집대상 확대
북미권 데이터 수집
동남아시아
시범서비스 론칭
한중일 데이터
수집 고도화
✓ 북미권 영어 관광 데이터 수집 확대
✓ 동북아시아권 데이터 수집 및 분석 고도화
✓ 동남아시아권 시범서비스 론칭
북미권영어관광데이터수집
웰니스 관광에 대한 인식 및
요구사항 분석
한중일데이터수집고도화
수집 데이터의 정확도 향상
분석 결과의 정확도 향상
동남아시아시범서비스런칭
제주도 관광객 증가를 고려한
웰니스 상품 개발 및
시범서비스 출시
FLEXINK 21
최적화된 웰니스 관광 플랫폼 오픈
여행 수요와 요구사항의 변화를 고려한
차별화된 웰니스 O2O 플랫폼 정식 런칭
웰니스 기반의 신규서비스 개발 및 분석
제주 관광의
일본 신시장 창출
고부가가치 체험형 상품서비스 구현
중국인의 인식 발달을
고려한 관광상품 개발
22
세부 목표
15,000
1.월간 이용자 수
1,500(10%)
2.구매전환율
15%(최종 결제)
가입 회원 수
95%
데이터 분석 정확도
1.데이터 수집목표
언어별 10,000건 이상
2.감성분석정확도
85%→95%
2018.12
서비스 제공기반 구축 예정
빅데이터 기반의
차별화된 관광서비스
세계시장 진입
달성 목표
24
THANKS
FOR WATCH
감사합니다.

More Related Content

[중소기업형 인공지능/빅데이터 기술 심포지엄] 워드벡터를 활용한 관광지 리뷰 ѫ싵ӊ템

  • 2. FLEXINK TABLE OF AGENDA 회사개요01 관광지 리뷰 ѫ싵ӊ템02 향후 목표03
  • 4. FLEXINK 4 데이터 분석에 기반한 콘텐츠 크리에이터 컴퍼니 서비스 디자인 및 컨설팅 통계자료에 기초한 서비스 디자인 및 컨설팅 신재생 에너지 데이터 분석 신재생 에너지 관련 데이터 분석 및 시각화 데이터 분석 리포팅 서비스 관광산업분야의 데이터 분석 리포트 제공 관광/문화 콘텐츠 개발 웰니스 관광 콘텐츠 개발 및 컨설팅
  • 5. 5 민관(제주도청+카카오) 융합형 데이터 포털 서비스 개발 및 데이터 분석 리포트 제공 제주데이터허브 구축(2017) 제주지역 데이터 공유 포털 서비스 구축
  • 6. 6 데이터 수집 및 분석 수요기업 컨설팅 중소기업 빅데이터활용 지원사업(2018) 지역 중소기업을 대상으로 관광/여행 빅데이터 분석 서비스 제공
  • 7. 7 워드벡터 기반의 관광 데이터 분석 기술을 활용한 서비스 제공 웰니스관광 O2O 플랫폼구축 빅데이터 기반의 맞춤형 관광서비스 O2O 플랫폼 (with 세종대학교 인공지능빅데이터 연구센터)
  • 8. 8 플렉싱크 + 세종대학교 인공지능 빅데이터 연구센터 관광지 리뷰 ѫ싵ӊ템
  • 9. FLEXINK 9 트렌드에 민감한 관광산업 분야의 데이터 기반 의사결정 가이드라인 구축시스템 개발목표 긍정/부정 감정의 발생원인 파악 실용적 데이터 분석서비스 구축 소규모 관광사업자의 의사결정지원
  • 10. FLEXINK 서비스 플로우 국내외 관광리뷰 수집 데이터셋 생성 워드 임베딩 (Word2Vec) 딥러닝 모델 입출력 설계 모델 설계 모델학습 모델실험 및 성능측정 성능측정 파라미터 조정 테스트 모듈 입력 데이터 처리 긍정/부정 분류 사용자 유형분류 데이터셋 유형분류 유형별 서비스 매칭 추천상품 매칭 서비스 최적화 전략수립 상품개발
  • 11. FLEXINK 11 동남아 국가의 제주관광 리뷰 및 여행기 수집 분석의 편의를 위해 영어로 리뷰를 번역 후 진행수집 프로세스 < 웹 크롤링 > < 문서 파싱 > < 데이터 전처리 > < 데이터 저장 > HTML 문서 Parser (BeautifulSoup) 사이트 구조 파악 게시글 추출 리뷰 데이터 (텍스트) 크롤러 Requests 전처리 모듈 리뷰 데이터 (제목, 내용, 날짜, 평점)이미지, 불필요한 특수문자 등 제거 텍스트 정제 데이터 수집 서버 동남아 및 일본어 리뷰 및 여행기 수집 사이트
  • 12. FLEXINK 12 관광지의 8개 속성을 활용하여 사전 구축 워드넷 패키지를 통한 유사어 및 동의어 수집속성 사전 구축 < 속성 단어 설정 > < 1차 속성 사전 생성 > < 유사어(동의어) 추가 > < 최종 속성 사전 저장 > 여행 관련 속성 단어 설정 각 속성 별 단어 추가 WordNet 중복 단어 제거 숙어/연어 제거 속성 사전 DB 1차 속성사전 유사어(동의어) 확대
  • 13. FLEXINK 13 딥러닝 기반의 감성분석기 구현 각 리뷰의 긍정-부정 평가작업 수행감성분석 딥러닝 모델 설계 모듈 입출력 설계 모델 설계 모델 실험 및 성능 측정 모듈 성능 측정 파라미터 조정 데이터셋 생성 모듈 워드 임베딩 (Word2Vec) DNN 모델 DNN 모델 모델 학습 테스트 모듈 입력 데이터 처리 긍정/부정 분류 < 데이터 셋 준비 > < 딥러닝 모델 생성 및 학습 > < 실험 및 성능 측정 > < 긍정/부정 분류 테스트 > Text Data Sentiment Analysis Model P N
  • 14. FLEXINK 14 분석결과 시각화 <국가별 긍정리뷰 생성 비율> <국가별 리뷰 생성 추이>
  • 15. FLEXINK 15 리뷰 데이터 시각화 <긍정리뷰의 영문번역> <부정리뷰의 영문번역> <속성별 감정요소>
  • 18. FLEXINK 18 서비스 사용˳황 중국어 데이터 한국어 데이터 인도네시아 일본어 기타 80% 45% 회원가입자 수 사용자 ˳황 2,712 사이트 임시 오픈 후 국내외 회원 가입자 수 2,172명 확보 사용자 트래픽 ˳황 31,215 10,211 345 5.127 194
  • 19. 19 플렉싱크 + 세종대학교 인공지능 빅데이터 연구센터 향후 추진계획
  • 20. FLEXINK 20 데이터 수집대상 확대 북미권 데이터 수집 동남아시아 시범서비스 론칭 한중일 데이터 수집 고도화 ✓ 북미권 영어 관광 데이터 수집 확대 ✓ 동북아시아권 데이터 수집 및 분석 고도화 ✓ 동남아시아권 시범서비스 론칭 북미권영어관광데이터수집 웰니스 관광에 대한 인식 및 요구사항 분석 한중일데이터수집고도화 수집 데이터의 정확도 향상 분석 결과의 정확도 향상 동남아시아시범서비스런칭 제주도 관광객 증가를 고려한 웰니스 상품 개발 및 시범서비스 출시
  • 21. FLEXINK 21 최적화된 웰니스 관광 플랫폼 오픈 여행 수요와 요구사항의 변화를 고려한 차별화된 웰니스 O2O 플랫폼 정식 런칭 웰니스 기반의 신규서비스 개발 및 분석 제주 관광의 일본 신시장 창출 고부가가치 체험형 상품서비스 구현 중국인의 인식 발달을 고려한 관광상품 개발
  • 22. 22 세부 목표 15,000 1.월간 이용자 수 1,500(10%) 2.구매전환율 15%(최종 결제) 가입 회원 수 95% 데이터 분석 정확도 1.데이터 수집목표 언어별 10,000건 이상 2.감성분석정확도 85%→95% 2018.12 서비스 제공기반 구축 예정