ݺߣ

ݺߣShare a Scribd company logo
INVEN, NAVER, TERA커뮤니티사이트분석을통해본테라–첫걸음
목차•왜시작했는가? •목표가무엇인가? •앞으로의방향은? •사용한라이브러리?
왜시작했는가? 사용자동향분석을해보자! 게임커뮤니티의데이터로가능할까? 이를통해사용자들이원하는것을알아낼수있을까? 라는질문을가지고호기심반재미반으로시작!
커뮤니티사이트를ѫ야는이유•사용자의의견을직Ϊ청취수있는통로중하나Ģ그외에청취수있는경로있ѫ있지만Ħ
사용자의목소리는어디에? •게임채팅–알수없음•각종커뮤니티사이트의게시판–공개된글은확인가능
커뮤니티에쓰여진글은과연믿을만한가? •(제관점에서본) 게임커뮤니티글의특징•형식이자유로움–은어/비속어/유행어등을통해의견표출•하고싶은말은함–솔직한의견을가감없이들을수있음•게임과관련없는이야기도존재
핸폰을바꾸고자판이적응안되요ㅠ길리안.. 내일만돌면속옷상자가5개!! 재미로는켈상도나쁘지않았죠. ㅋㅋ 
한사람의이야기 
여러주제가섞여있음커뮤니티에쓰여진글은과연믿을만한가?
커뮤니티에쓰여진글은과연믿을만한가? •각자자유로운이야기를진행•하지만많은사람의이야기를합쳐보면분명한방향성은존재•기를모으면알수있을지도?
다양한이야기 
그리고공통의주제는TERA 
TERA 
개인의관심사 
커플일기 
연예인기사 
최신짤방/유행어 
테라커뮤니티안에서는테라이야기가메인! 
테라커뮤니티에서논의되는내용들
커뮤니티에쓰여진글은과연믿을만한가? •충분한양의데이터가있다면•같은주제의글을모으고•핵심키워드분석을통해•사용자의만족/불만족에대해파악할수있다. •이러한것을집단지성이라고하는듯?! •여러미디어에서이러분석을고있음
http://sentdex.com/24hr-global-sentiment-analysis/ 
위치정보를활용한지역별집단지성분석의예
http://www.datameer.com/blog/big-data-analytics- perspectives/analyzing-twitter-sentiment-presidential-election.html 
미국대선에서지역별분석을통한맞춤형정책으로승리를거둔오바마대통령http://swampland.time.com/2012/11/07/inside-the-secret-world-of- quants-and-data-crunchers-who-helped-obama-win/ 
Inside the Secret World of the Data Crunchers 
Who Helped Obama Win 
Twitter Sentiment Analysis
물론국에서도하고있듯니다?!
커뮤니티에쓰여진글은과연믿을만한가? •실제로사용되고있는사례를볼때•같은주제의글을대량으로모으고•핵심키워드분석을하면•사용자의만족/불만족에대해파악할수있지않을까?
0 
200 
400 
600 
800 
1,000 
1,200 
1,400 
1,600 
1,800 
2,000테라오픈Free to Play포악한퀴르갈의동굴 
테라자유게시판
테라자유게시판ļ벤Ģ자유게시판의전체글수는약20만건이상•근하루에약200400건의긶이올라오데달에대략0.61.2만건이상•충분하다고긴려울수있는분량이지만사용자의반응을개략적으롵ӕ수있짶않을까?
그래서자유게시판의키워드를일단뽑아보았습니다! 
나오다 
61 
테라 
31 
상자 
27 
만들다 
22 
오늘 
21 
생각 
20 
진짜 
19 
사람 
18 
이상 
18 
기준 
16 
게임 
15 
시간 
15 
보이다 
14 
정도 
14단순키워드분석, 인벤테라자유게시판,2014-10-30 기준 
의외로괜찮아보이는단어들?
2784, 12% 
3074, 13% 
3377, 14% 
3563, 15% 
4768, 20% 
3229, 14% 
2745, 12% 
일요일 
월요일 
화요일 
수요일 
목요일 
금요일 
토요일 
업데이트가있는목요일에글을쓰는사람의비율이높음 
각요일에글을가장많이쓴사람의수(인벤자유게시판기준) 
-목요일에가장글을많이쓴사람의비율은20%로다른요일에비해두드러짐 
-업데이트전날인수요일도높음 
-결론:테라커뮤니티는테라자체에관심이높은사람들이모여테라를이야기하는곳(너무당연한가요^^;)
테라자유게시판ļ벤Ģ개략적으로ѫ였짶만Ģ충분한데이터를홵Ӛ면•사용자의반응을개략적으로확인할수있보인다!
목표가무엇인가? 앞서이야기하였듯이커뮤니티의글을모아사용자들의욕구를파악할수있는지확인하고싶다!
앞으로의방향은? 잉여로운시간에즐기는취미중하나인지라… 구체적인것은없습니다. 번뜩이는ѫ디어갶떠오르면(주시면)불오를짶도Ħ
사용한라이브러리? 문서수집/형태소분석/데이터분석단계에여러가지도구를사용하였는데빠르고쉽게사용할수있는것을주로선택하였습니다.
문서수집/데이터분석/웹뷰등에사용된도구•수집및ѫ에는#ѫ용Ģ웹클라이언트는ұ鴳레ѫ크Ģ웹서버N홵Ӛ
형태소분석•주어진글에대해명사, 형용사, 및부사등각종품사로분석하는것•한국어형태소분석기의게임사전은많이부족한상황•데이터분석엔명사/동사/형용사만사용하기로결정•다른품사의경우의미있는정보가부족
<?xmlversion="1.0" encoding="utf-8"?> <Document> <HtmlCleanDocument>혹시티켓이벤트조건있나요? 혹PC방에서접속이라던가몇월몇일전생성된케릭이라던가특정레벨이라던가??? 오늘들어갔는데?이벤트옷재료는주는데티켓은안주는걸까요?</HtmlCleanDocument> <Sentence>티켓/NN,이벤트/NN,조건/NN,있/VV</Sentence> <Sentence>방/NN,접속/NN</Sentence> <Sentence>월/NNB,일전/NN,생성/NN,케릭/NN</Sentence> <Sentence>특정/NN,레벨/NN</Sentence> <Sentence>오늘/NN,들어가/VV,이벤트/NN,옷/NN,의료/NN</Sentence> <Sentence>티켓/NN,안주/NN,것/NNB</Sentence> </Document> 형태소분석의예
은전한닢프로젝트 
검색에서쓸만한오픈소스한국어형태소분석기를만들자! 형태소분석이어느정도잘되는오픈소스발견!
토론및질문? 이런주제에관심이있으신분들과즐거운이야기를나누고싶습니다. 아래의링크로오시면됩니다.  HTTP://GOO.GL/NHQ7CI

More Related Content

취미로 하는 커뮤니티 사이트 분석