Data Mining and Recommendation SystemsSalil NavgireThis document discusses data mining techniques and recommendation systems. It describes common data mining techniques like classification, clustering, regression, association rule mining and outlier analysis. It also discusses the knowledge discovery process and applications of data mining. The document then covers recommendation systems, describing content-based, collaborative filtering and hybrid recommendation approaches. It provides examples of these systems.
data warehouse vs data lakePolestarsolutionsThe document discusses the differences between data lakes and data warehouses, highlighting their distinct architectures, use cases, and accessibility. Data lakes allow for the storage of raw data and experimentation, primarily catering to data scientists, while data warehouses store structured data for business users seeking refined insights. Ultimately, organizations see data lakes as complementary to data warehouses, as they evolve to become crucial in enterprise data management strategies.
Natural Language Search with Knowledge Graphs (Activate 2019)Trey GraingerThe document discusses natural language search using knowledge graphs. It provides an overview of knowledge graphs and how they can help with natural language search. Specifically, it discusses how knowledge graphs can represent relationships and semantics in unstructured text. It also describes how semantic knowledge graphs are generated in Solr and how they can be used for tasks like query understanding, expansion and disambiguation.
Azure governanceUdaiappa RamachandranThe document outlines the governance of Azure, focusing on management groups, role-based access control (RBAC), policies, and blueprints. It explains how management groups and subscriptions serve as organizational structures within Azure, along with the roles and policies that can be applied for resource management. Additionally, it discusses the creation and management of blueprints for deploying resources efficiently and in a compliant manner.
Learning to Rank Datasets for Search with Oscar CastanedaDatabricksOscar Castañeda presented on learning to rank datasets for search using Elasticsearch's learning to rank capabilities. He discussed extracting relevance judgements during data pipelines to bootstrap a dataset ranking model, and leveraging click-through data on dataset profiles to continuously improve the model. The demo showed ranking movie datasets based on a relevance judgement file, with movie profile pages representing dataset profiles. Next steps included describing datasets in a structured way, building a knowledge graph to extract insights, and using topic models to understand datasets.
From Insights to Action, How to build and maintain a Data Driven Organization...Amazon Web Services KoreaThe document outlines key insights from AWS Data Week 2023, highlighting the importance of a data-driven organization for innovation and decision-making in today's fast-paced business environment. It discusses common challenges faced by enterprises, such as data accessibility and governance, and emphasizes the need for stronger collaboration and the integration of data across departments. Additionally, it presents success stories and the transformative potential of modern data strategies, particularly leveraging data lakes and machine learning to improve operational efficiency and drive new revenue opportunities.
Introduction to azure cosmos dbRatan ParaiAzure Cosmos DB is Microsoft's globally distributed, multi-model database service that supports multiple APIs such as SQL, Cassandra, MongoDB, Gremlin and Azure Table. It allows storing entities with automatic partitioning and provides automatic online backups every 4 hours with the latest 2 backups stored. The Azure Cosmos DB change feed and Data Migration Tool allow importing and exporting data for backups. An emulator is also available for trying Cosmos DB locally without an Azure account.
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유Hyojun JeonNDC18에서 발표하였습니다. 현재 보고 계신 슬라이드는 1부 입니다.(총 2부)
- 1부 링크: https://goo.gl/3v4DAa
- 2부 링크: https://goo.gl/wpoZpY
(ݺߣShare에 슬라이드 300장 제한으로 2부로 나누어 올렸습니다. 불편하시더라도 양해 부탁드립니다.)
Intelligence led policing- pole sandbox (webinar 21012019) Neo4jThis document discusses using Neo4j and graph databases for intelligence-led policing. It introduces intelligence-led policing as an information-based model that aims to provide strategic knowledge and a targeted approach to crime reduction. The document outlines the POLE data model for representing people, objects, locations, and events in a graph. It then demonstrates Neo4j for implementing a graph database using crime data from Greater Manchester, with nodes for crimes, locations, people, and relationships between them. Finally, it discusses ways the demo could be extended for real-world use, such as adding more detailed relationships and supporting data traceability.
Azure storageAdam SkibickiThe document discusses Azure Storage, detailing various account types, redundancy options, encryption methods, and data structures such as block blobs, page blobs, and append blobs. It covers blob access tiers, lifecycle management for cost reduction, and features like snapshots and static hosting. Additionally, it describes table storage with its schemaless design, partitioning strategies, atomic transactions, and the file service for managed file sharing in the cloud.
Facebook and Data MiningPratik DalviFacebook, founded by Mark Zuckerberg in 2004, aims to connect people globally while collecting and organizing user data for targeted advertising. The platform's data mining capabilities enable businesses to analyze consumer behavior and enhance customer acquisition and retention, while also addressing privacy concerns. With over 2.13 billion monthly active users, Facebook continues to evolve from a social networking site into a powerful tool for data-driven marketing.
Scaling Django Apps using AWS Elastic BeanstalkLushen WuThe document discusses scaling Django applications using AWS Elastic Beanstalk, outlining the benefits of using it over manual EC2 management, auto-scaling, and load-balancing. It provides a comprehensive guide on creating and configuring an Elastic Beanstalk environment, details deployment processes, and emphasizes the importance of optimizing application performance beyond just scaling resources. Key considerations for using AWS, environment properties, deployment commands, and potential pitfalls during deployment are also addressed.
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [YouPlace 팀] : 카프카와 스파크를 활용한 유튜브 영상 속 제주 명소 검색 BOAZ Bigdata데이터 엔지니어링 프로젝트를 진행한 YouPlace팀에서는 아래와 같은 프로젝트를 진행했습니다.
<aside>
이젠 검색도 유튜브 시대
제주여행을 계획할 때 브이로그 영상을 많이 참고하실텐데요
수많은 영상들과 영상 속 분산된 명소들을 하나 하나 찾으려 생각하면 막막하지 않으셨나요?
이러한 고민을 갖고 계신 분들을 위해, 유튜브 브이로거들이 찾아간 여행 명소들을 지도에서 한 눈에 파악할 수 있도록 만들었어요
(github : https://github.com/Boaz-Youplace)
16기 엔지니어링 고은서 | 중앙대학교 소프트웨어학부
16기 엔지니어링 류정화 | 성신여자대학교 융합보안공학과
16기 엔지니어링 송경민 | 국민대학교 소프트웨어학과
Creating a Website SitemapJeannie MelinzThe document discusses what a website sitemap is and its purpose for planning and organizing a site's architecture, navigation, and content. It covers the different elements and types of sitemaps, and provides guidance on creating a sitemap including outlining the steps, tools, and principles to consider. The sitemap is presented as a collaborative planning tool to map out the logical structure and flow of a website.
Introduction To RDF and RDFSNilesh WagmareThe document introduces RDF (Resource Description Framework) as a W3C recommended framework used for describing resources on the web, emphasizing its format and structure based on triples (subject, predicate, object). It discusses the importance of Uniform Resource Identifiers (URIs) for naming resources and the role of RDF Schema (RDFS) in providing classification and interpretation of data. Additionally, the document addresses criticisms of RDF and highlights the framework's significance for semantic web interoperability.
Near Real-Time Netflix Recommendations Using Apache Spark Streaming with Nit...DatabricksThe document details Netflix's approach to near real-time recommendations, emphasizing the need to personalize content for over 125 million active members across 190 countries while handling vast data effectively. It highlights the challenges of scaling with increasing data volume and the importance of swift processing for timely recommendations and video insights. Key infrastructures and methods for achieving low latency and high performance, including Spark Streaming and auto-remediation strategies, are also discussed.
Integrating Black Duck into your Agile DevOps EnvironmentBlack Duck by SynopsysThe document discusses the integration of Black Duck into agile DevOps environments, emphasizing the need for early vulnerability detection in the software development lifecycle (SDLC). It highlights the challenges companies face in managing open source security and the advantages of automating checks to reduce costs, time to market, and risks. Key recommendations include ensuring builds only contain approved components and implementing automated checks in continuous integration processes.
[Rightbrain UX Academy] Megabox UX/UI개선 RightBrain inc.라이트브레인 2020 UX 아카데미 10기 Open Project입니다.
이번에 소개해 드릴 결과물은 'Megabox - UX/UI 개선 프로젝트'입니다.
올해 초에 진행된 UX 아카데미 10기 교육 기간 동안 정규과정의 수업뿐만 아니라 별도의 조별 모임을 통해 과제와 프로젝트를 진행하며 만들어 낸 신선한 아이디어를 Rightbrain lab을 통해 공개합니다.
라이트브레인 아카데미 수강생들이 어떤 과정을 통해 아이디에이션하고 또 인사이트와 컨셉을 도출했는지 궁금하시다면 지금 바로 슬라이드쉐어로 내용을 확인하세요.
UX 아카데미 ‘라이트브레인 U –
미래의 UXer들을 위한 교육으로 UX전문가로서 성장할 수 있는 발판이 되는 교육입니다. UX에 대한 기초지식이 있는 학생과 직장인들을 대상으로 하며 정규 과정은 보통 15회 강의로 구성됩니다. UX 개념, 필드 리서치, 모델링, 서비스 디자인, 프로토타이핑과 같은 구성으로 UX디자인의 주요 프로세스를 모두 경험하고 최종 결과물을 발표하는 것을 목표로 합니다. 2019년 상반기 배출된 8기부터 아카데미 정글과 함께 UX Academy를 개설하여 보다 전문적이며, 밀도 있는 교육을 UX에 관심있는 분들에게 제공하고 있습니다.
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유Hyojun JeonNDC18에서 발표하였습니다. 현재 보고 계신 슬라이드는 1부 입니다.(총 2부)
- 1부 링크: https://goo.gl/3v4DAa
- 2부 링크: https://goo.gl/wpoZpY
(ݺߣShare에 슬라이드 300장 제한으로 2부로 나누어 올렸습니다. 불편하시더라도 양해 부탁드립니다.)
Intelligence led policing- pole sandbox (webinar 21012019) Neo4jThis document discusses using Neo4j and graph databases for intelligence-led policing. It introduces intelligence-led policing as an information-based model that aims to provide strategic knowledge and a targeted approach to crime reduction. The document outlines the POLE data model for representing people, objects, locations, and events in a graph. It then demonstrates Neo4j for implementing a graph database using crime data from Greater Manchester, with nodes for crimes, locations, people, and relationships between them. Finally, it discusses ways the demo could be extended for real-world use, such as adding more detailed relationships and supporting data traceability.
Azure storageAdam SkibickiThe document discusses Azure Storage, detailing various account types, redundancy options, encryption methods, and data structures such as block blobs, page blobs, and append blobs. It covers blob access tiers, lifecycle management for cost reduction, and features like snapshots and static hosting. Additionally, it describes table storage with its schemaless design, partitioning strategies, atomic transactions, and the file service for managed file sharing in the cloud.
Facebook and Data MiningPratik DalviFacebook, founded by Mark Zuckerberg in 2004, aims to connect people globally while collecting and organizing user data for targeted advertising. The platform's data mining capabilities enable businesses to analyze consumer behavior and enhance customer acquisition and retention, while also addressing privacy concerns. With over 2.13 billion monthly active users, Facebook continues to evolve from a social networking site into a powerful tool for data-driven marketing.
Scaling Django Apps using AWS Elastic BeanstalkLushen WuThe document discusses scaling Django applications using AWS Elastic Beanstalk, outlining the benefits of using it over manual EC2 management, auto-scaling, and load-balancing. It provides a comprehensive guide on creating and configuring an Elastic Beanstalk environment, details deployment processes, and emphasizes the importance of optimizing application performance beyond just scaling resources. Key considerations for using AWS, environment properties, deployment commands, and potential pitfalls during deployment are also addressed.
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [YouPlace 팀] : 카프카와 스파크를 활용한 유튜브 영상 속 제주 명소 검색 BOAZ Bigdata데이터 엔지니어링 프로젝트를 진행한 YouPlace팀에서는 아래와 같은 프로젝트를 진행했습니다.
<aside>
이젠 검색도 유튜브 시대
제주여행을 계획할 때 브이로그 영상을 많이 참고하실텐데요
수많은 영상들과 영상 속 분산된 명소들을 하나 하나 찾으려 생각하면 막막하지 않으셨나요?
이러한 고민을 갖고 계신 분들을 위해, 유튜브 브이로거들이 찾아간 여행 명소들을 지도에서 한 눈에 파악할 수 있도록 만들었어요
(github : https://github.com/Boaz-Youplace)
16기 엔지니어링 고은서 | 중앙대학교 소프트웨어학부
16기 엔지니어링 류정화 | 성신여자대학교 융합보안공학과
16기 엔지니어링 송경민 | 국민대학교 소프트웨어학과
Creating a Website SitemapJeannie MelinzThe document discusses what a website sitemap is and its purpose for planning and organizing a site's architecture, navigation, and content. It covers the different elements and types of sitemaps, and provides guidance on creating a sitemap including outlining the steps, tools, and principles to consider. The sitemap is presented as a collaborative planning tool to map out the logical structure and flow of a website.
Introduction To RDF and RDFSNilesh WagmareThe document introduces RDF (Resource Description Framework) as a W3C recommended framework used for describing resources on the web, emphasizing its format and structure based on triples (subject, predicate, object). It discusses the importance of Uniform Resource Identifiers (URIs) for naming resources and the role of RDF Schema (RDFS) in providing classification and interpretation of data. Additionally, the document addresses criticisms of RDF and highlights the framework's significance for semantic web interoperability.
Near Real-Time Netflix Recommendations Using Apache Spark Streaming with Nit...DatabricksThe document details Netflix's approach to near real-time recommendations, emphasizing the need to personalize content for over 125 million active members across 190 countries while handling vast data effectively. It highlights the challenges of scaling with increasing data volume and the importance of swift processing for timely recommendations and video insights. Key infrastructures and methods for achieving low latency and high performance, including Spark Streaming and auto-remediation strategies, are also discussed.
Integrating Black Duck into your Agile DevOps EnvironmentBlack Duck by SynopsysThe document discusses the integration of Black Duck into agile DevOps environments, emphasizing the need for early vulnerability detection in the software development lifecycle (SDLC). It highlights the challenges companies face in managing open source security and the advantages of automating checks to reduce costs, time to market, and risks. Key recommendations include ensuring builds only contain approved components and implementing automated checks in continuous integration processes.
[Rightbrain UX Academy] Megabox UX/UI개선 RightBrain inc.라이트브레인 2020 UX 아카데미 10기 Open Project입니다.
이번에 소개해 드릴 결과물은 'Megabox - UX/UI 개선 프로젝트'입니다.
올해 초에 진행된 UX 아카데미 10기 교육 기간 동안 정규과정의 수업뿐만 아니라 별도의 조별 모임을 통해 과제와 프로젝트를 진행하며 만들어 낸 신선한 아이디어를 Rightbrain lab을 통해 공개합니다.
라이트브레인 아카데미 수강생들이 어떤 과정을 통해 아이디에이션하고 또 인사이트와 컨셉을 도출했는지 궁금하시다면 지금 바로 슬라이드쉐어로 내용을 확인하세요.
UX 아카데미 ‘라이트브레인 U –
미래의 UXer들을 위한 교육으로 UX전문가로서 성장할 수 있는 발판이 되는 교육입니다. UX에 대한 기초지식이 있는 학생과 직장인들을 대상으로 하며 정규 과정은 보통 15회 강의로 구성됩니다. UX 개념, 필드 리서치, 모델링, 서비스 디자인, 프로토타이핑과 같은 구성으로 UX디자인의 주요 프로세스를 모두 경험하고 최종 결과물을 발표하는 것을 목표로 합니다. 2019년 상반기 배출된 8기부터 아카데미 정글과 함께 UX Academy를 개설하여 보다 전문적이며, 밀도 있는 교육을 UX에 관심있는 분들에게 제공하고 있습니다.
2016 국민디자인단 - ‘통계’ 하면 통계청 ‘KOSIS!’, 내가 필요한 정보는 꼭 집어주네 !한국디자인진흥원 공공서비스디자인PD국민체감 통계서비스, 국민이 직접 디자인, 국민이 평가. (통계청 정부3.0)
통계청(청장 유경준)은 국민중심의 통계서비스 발굴을 위해 국민디자인단을 운영하고, 2016.9.8(목) 대전 통계센터에서 그 활동성과를 공유하는 발표대회를 가졌다.
통계청은 그동안 통계가 국민에게 어떻게 서비스되어야 하는지에 대한 해결책을 찾기 위해 3개 과제 21명의 국민디자인단을 구성하여, 지난 4월부터 7월까지 약 4개월간 서비스디자인 활동을 진행해 왔다.
통계청은 국민디자인단이 제시하는 통계서비스 정책에 대해 어떤 정책이 국민에게 가장 필요한 서비스인지를 국민이 직접 평가할 수 있도록 했다. 국민평가단을 모집한 결과 전국 각지에서 많은 국민들이 신청하였고 이 중 30여명을 선정하여 현장 투표방식으로 국민이 체감하는 우수사례 선정에 참여하였다.
[2016 통계청 국민디자인단 과제 소개]
우수상
‘통계’ 하면 통계청 ‘KOSIS!’, 내가 필요한 정보는 꼭 집어주네!
서비스디자이너 : 하광수 한밭대학교 시각디자인과 교수
대학원생 B씨는 졸업논문 때문에 오랜만에 KOSIS를 다시 접해보게 된다. 과거 통계와 관련된 용어를 정확히 넣어야 원하는 정보를 얻었던 것과 달리 유사한 용어를 입력하여도 연관검색어를 통하여 원하는 정보를 빠르게 얻을 수 있도록 개선되어 있었다.
그래도 못 찾는 통계정보를 질문하니 놀랍게도 하루도 안 되어 다른 이용자가 내가 원하는 정보의 위치를 알려주었다. 논문작성에 필요한 통계정보를 든든하게 확보한 B씨는 역시 ‘통계’하면 통계청
‘KOSIS!’구나.. 하고 느꼈다.
국민디자인단 구성
01 일반국민 (김민경 씨, 허선념 씨)
02 전문가 (김유미 과장_유코아 디자인사업부)
03 대학생 (민경은 학생)
04 주관 공무원 (이주원 사무관, 심현수 주무관)
05 서비스디자이너 (하광수 교수_한밭대학교)
06 그 외 관계자(서비스 개발자, 서비스 관련 공무원 등)
진행경과
01 환경 이해: 서비스 이해 및 현황 파악 (1 week)
서비스의 이유와 목적에 대한 이해, 서비스 현황파악
서비스를 둘러싼 환경에 대한 이해
02 문제 발견: 서비스 이해관계자 경험 이해하기 (2, 3, 4 week)
서비스와 관련된 이해관계자에는 어떤 문제를 격고 있는가
서비스를 이용하는 고객은 어떤 사람이고 어떤 문제를 격고 있는가
03 문제 정의: 대상사용자 경험 모델링 및 문제점 도출 (5, 6 week)
서비스를 이용하는 주된 고객은 어떤 사람인가 (퍼소나)
고객은 어떤 절차로 서비스를 경험하고 사용하는가(고객여정)
04 문제 해결: 서비스 컨셉 아이디어 (7, 8 week)
서비스 타입에따른 서비스 시나리오 제안
핵심 아이디어
Ideation Workshop을 통해 프로젝트 기간동안 분석된 송윤희씨의 경험과정을 바탕으로 사용자가 처한 각 과정의 문제점과 경험적 특징요인을 격려 함으로서 사용자 경험을 극대화 할 수 있는 아이디어를 도출하고 제안하였다. 아이디어는 4가지 측면에서 검토 되었다.
1. 스스로 찾아오는 사용자
2. 검색을 사용자에게 돌려주는 방법
3. 쇼핑같은 즐거운 경험
4. 참여하는 통계, 공감하는 통계
...
담당자 :안성문
담당부서 : 통계청 창조행정담당관실
출처 : 통계청 보도자료 http://goo.gl/EDjyR5
모빌리티 산업에서의 개인정보보호 이슈 : 모빌리티 세미나(191028) Session 3 황혜진 변호사법무법인 디라이트 / D'LIGHT Law Group[모빌리티 산업에서의 개인정보보호 이슈] Session 3 황혜진 변호사
‘모빌리티 산업의 법률적 현안 및 발전 동향’ 세미나 개최
법무법인 디라이트는 10월 28일(월) 서울 서초구 드림플러스 강남 지하 1층 이벤트홀에서 모빌리티 산업의 법률적 현안과 발전 동향을 전망하는 세미나를 개최하였습니다.
이번 세미나는 법무법인 디라이트가 주최하고 Zdnet Korea, 코리아스타트업포럼, CLO, 한화 드림플러스가 후원하는 세미나이며 모빌리티 산업에 관심있는 사람이면 누구나 참가할 수 있는 행사였습니다. 또한, 최근 모빌리티 산업에서 중대하게 떠오른 법률적 현안과 변화 및 발전 상황을 살펴봄으로써 관련 업계 종사자들이 최신 이슈들을 파악하고 규제와의 조화 또는 규제 개선방향에 대한 가이드라인을 제시하는 세미나였습니다. 특히, 우버코리아, 카카오모빌리티, 쏘카의 담당자가 패널 토론자로 참여하여 현재 모빌리티 업계의 실질적인 이슈를 논의하는 자리이기도 했습니다.
세미나의 프로그램은 정구민 국민대 교수가 ‘모빌리티 서비스의 진화와 시사점’의 주제로 Keynote Speech를 시작하였고, 세미나 1세션은 박경희 디라이트 변호사가 ‘퍼스널 모빌리티 사업화를 위한 법적이슈’를 2세션은 김용혁 디라이트 변호사가 ‘여객운송 모빌리티 사업과 규제’에 대해서 살펴보았습니다. 그리고, 류동근 우버코리아 상무와 황윤영 카카오 모빌리티 법무실장, 김혜영 쏘카 정책연구팀장이 모빌리티 산업의 규제와 관련하여 패널 토론을 진행하였습니다. 이어지는 3세션은 황혜진 디라이트 변호사가 ‘모빌리티 산업에서의 개인정보보호 이슈’ 에 대해서 논의하였고, 4세션은 심용석 전남테크노파크 선임연구원이 ‘모빌리티 산업 관련 규제 샌드박스’를 5세션은 주상돈 IP 타겟 대표가 ‘모빌리티 관련 기술 및 특허 동향’ 에 대해서 살펴보았습니다.
[세미나 발표자료]
Session 1 _퍼스널 모빌리티 사업화를 위한 법적이슈 _ 박경희 변호사(법무법인 디라이트)
Session 2 _여객운송 모빌리티 사업과 규제 _ 김용혁 변호사(법무법인 디라이트)
Session 3 _모빌리티 산업에서의 개인정보보호 이슈 _ 황혜진 변호사(법무법인 디라이트)
Session 4 _ 전남 e모빌리티 규제자유특구 현황 및 전망 _ 심용석 선임연구원(전남테크노파크)
Session 5 _모빌리티 관련 기술 및 특허 동향_ 주상돈 대표(IPTargets)
법무법인 디라이트 : http://dlightlaw.com
급변하는 소셜미디어 환경, 흥하는 콘텐츠 기획법Jay Cho소셜커뮤니케이션 전문가 세션 2강.
"급변하는 소셜미디어 환경, 흥하는 콘텐츠 기획법"_ 공개 버젼
점점 더 빠르고..암울하게 변해가는 소셜미디어, SNS, 홍보 환경. 흥하는 콘텐츠를 만드는 방법에 대해 살펴보았습니다.
본자료는 공개버젼으로 실제 강의와 다소 차이가 있습니다.^^
MapReduce based Recommendation SystemSuHyun Jeonhttp://onoffmix.com/event/19596
2013.10.10(목) '빅 데이터 활용을 위한 오픈소스 프레임워크 기술 세미나'에 중
'빅데이터 분석 오픈소스를 활용한 데이터 분석 사례' 대한 발표자료입니다.
2. ◈ 사례 1. 영화추천 어플리케이션 ‘ watcha’
프로그램스에서 개발 , 서비스하는 영화추천 App
2013 년말 기준
앱 다운로드횟수 35 만 건 돌파
20 개 이상 별점을 매긴 가입자 50 만 명 이상
최초 가입시 20 개의 영화에 별점을 부여하도록 하고
그 데이터를 바탕으로 분석하여 이용자의 취향에 맞는 영화를 추천
• 이용자가 별점을 평가한 영화의 수를 늘려갈 수록
추천의 정확도와 다양성이 증가함
•이용자가 평가한 영화의 감독 , 출연자 , 장르 , 줄거리 등을
분석하여 영화를 추천하고 감독 , 배우 , 장르 등의 공통점
을
추천이유로 보여 줌 .
•딱딱한 조건입력이나 추천이 아닌 놀이 같은 흥미를
유발시키는 별점 평가와 코멘트쓰기 등을 통해 피드백을
유도하여 더 많은 사용자의 취향정보와 데이터를 수집하고
분석하여 보다 정확한 추천을 가능하게 함 .
3. •분석되어 나온 영화 중 검색결과가 맘에 들지 않으면 다시 추천받기나
영화 평가 늘리기를 통하여 영화 평가를 늘려서 좀 더 정확하고 다양한 결과를 얻을 수
있다 .
•주기능인 영화추천과 더불어 예매순위확인과 예고편 감상 , 영화예매도 가능하며 유료결
제를
통한 영화감상도 가능 .
•또한 제목 , 배우 , 감독이름을 통해 검색하는 일반검색도 가능하다 .
4. •2013 년 9 월 지능정보연구 제 19 권 제 3 호에 게재된
‘ 온톨로지 기반 영화메타데이터간 연관성을 활용한 영화 추천 기법’ 이라는 논문에서
사용자의 프로파일과 영화의 메타데이터에 대한 선호도를 분석하여 영화를 검색하고
추천하는 모델을 제시 .
•사용자가 영화를 선택할 때 고려하고 영화의 특징을 담고 있는 메타데이터를 기반으로
영화 메타데이터 온톨로지를 구축하고 이를 사용하여 영화 메타데이터간에 속성을 부
여함으로써 메타데이터간의 관계를 정의하고 유사성 분석을 통하여 유사성을 도출하고
검색된 영화메타데이터를 확장함으로써 다른 유사한 영화를 검색하게 함 .
•영화의 메타데이터 ( 감독 , 출연배우 , 장르 , 줄거리 등 ) 를 기반으로 영화간의 연관
성을 도출하고 사용자의 선호도를 입력 받아 사용자의 개인화된 정보를 활용하여 영화
를 추천하는 기법을 제안하고 구현함 .
•이러한 논문의 사례에 비추어 볼 때 ‘ watcha’ 에서도 최초 20 개의 영화에 대한 별점
평가를 이용하여 사용자의 선호도와 영화메타데이터 정보를 수집하고 분석하여 사용자
에게 추천영화를 제시하는 것으로 보이며 추가적인 별점 평가를 통해 누적된 사용자의
정보를 바탕으로 취향데이터가 쌓여 추천의 정확도와 다양성을 높일 수 있는 것으로 보
인다 .
5. ◈ 사례 2. 디지털 자료실 지원센터 (Digital Library
System)
< 발췌 -http://reading.ssem.or.kr/r/reading/main/main.jsp>
- 시 / 도 교육청 단위에 설치되어 표준화된 학교 도서관 정보시스템
- 교육청 관내의 개별학교도서관의 도서관리업무를 자동화
- 인터넷 기반의 독서지원기능 ( 정보검색 , 독서정보제공 , 독서표현활동 , 독서지도
및 상담 등 )
6. DLS 의 대출 / 반납
프로그램 환경
이용자 등록으로
이용자에 대한
메타데이터 생성
자료 등록으로
자료에 대한
메타데이터 생성
7. - DLS 에 입력된 이용자 ( 학생 , 학부모 , 교직원 등 ) 에 대한 메타데이
터는 학기 말이나 학년 말에 ‘다대출자’의 시상이나’ 다활용도서’를 추
출할 때 활용가능 .
- 입수 된 도서의 정보를 등록할 때 , DLS 를 사용하는 타 기관에서 입력
해 놓은 도서의 메타데이터를 활용하여 등록이 가능하게 되어 입수 작
업의 효율성을 향상시킴 .
- 이용자들의 대출 상황에 대한 메타데이터를 활용하여 이용자들의 성향
분석 및 선호도 등의 파악이 용이하여 다음 장서 구매를 할 때에 이용
자의 요구에 맞는 장서구매계획을 세울 수 있음 .
8. ◈ 사례 3. 인력파견업체
<< 인력파견업체인력파견업체 >> << 기업기업 >><< 구직희망자구직희망자 >>
개인의 이력정보
및 소개서
회사소개 및
필요인재요건
원하는 인재 제공원하는 회사 제공
9. - 기업 , 기관 등으로부터 인력을 조달해주는 아웃소싱업체를 ‘인력파견
업체’라고 한다 .
- 구직 희망자는 자신의 이력사항을 인력파견업체에 제출하면 파견업체
에서는 구직자에 대한 메타데이터를 생성하여 기업체의 인력요청이 있
을 때 작업의 스타일에 맞는 인력을 추천해 줄 수 있다 .
- 구직자와 구인자는 직접적인 접촉이 없어도 인력파견업체의 메타데
이터를 이용해서 상호간의 필요한 요소를 충족 할 수 있다 .
10. - 1999 년 미국에서 콘텐츠 제
작자 및 방송사 서비스제공자
, 사용자가 대용량 저장매체
를 사용하기 위해 출발
- 사용자가 원하는 멀티미디어
콘텐츠를 원하는 시간에 텔레
비전을 통해 볼 수 있게 하는
서비스
- 궁극적으로 실시간 방송과 인
터넷이 결합된 형태의 통합서
비스 IPTV
◈ 사례 4. 멀티미디어 검색 서비스 ‘ TV-Anytime’
12. 1) 콘텐츠 기술 메타데이터 (Content Description Metadata)
프로그램 개체와는 독립적으로 콘텐츠 자체의 내용정보를 기술하기 위한 메타
데이터 . 단일 프로그램 및 연속 프로그램 정보를 기술할 수 있으며 , 그룹도
하나의 콘텐츠로서 간주됨 .
2) 개체기술 메타데이터 (Instance Description Metadata)
특정한 ( 방송 ) 이벤트 관련 프로그램 개체에 연관된 메타데이터로서 프로그
램의 위치 및 서비스 정보를 기술하여 지역방송과 같은 정보응용에 사용할 수
있음 .
3) 사용자 메타데이터 (Consumer Metadata)
사용자의 콘텐츠 이용내역 및 사용자의 선호도와 관련된 정보사용 .
사용자 이용내역은 관찰시간 동안의 사용자 동작에 대한 리스트를 기술하기
위한 메타데이터로 사용자 선호도 정보를 자동으로 생성하거나 이용내역에 관한
정보를 상호간에 교환함에 있어서 호환성을 갖도록 하는데 목적을 둠 .
사용자 선호도는 콘텐츠의 소비와 관련된 사용자의 취향 정보를 기술하며 ,
콘텐츠 관련 메타데이터 ( 콘텐츠기술 메타데이터 , 개체관련 메타데이터 등 )
와 그 내용을 비교하여 원하는 콘텐츠를 탐색 , 선택하고 소비할 수 있도록 함
.
13. ◈ 사례 5. 소송을 위한 수집자료의 메타데이터 활용 .
건강보험공단이 담배 회사를 상대로 흡연피해 손해배상 청구소송을
함 .
소송대상
- KT&G
59% 외국자본
41% 국내기업지분소유
- 필립모리스 ( 말보로 )
- BAT( 던힐 )
유해성 ( 위법성 )
- 69 종 발암 및 의심물질
20 여종 A 급
- 4800 여 화학물질
- 흡연자는 후두암 6.5 배 ,
폐암 4.5 배 , 식도암
3.6
배 높다 .
- 중독성유발 : 첨가물
( 딸기향 , 쓴맛제거제 ) 과
니코틴양조작 및 조제
- 암모니아외 첨가물 포함
가능성
- 마케팅
- 자판기 설치
- KT&G 와 유사 위해
주기적 성분분석
Data 활용
- 19 년간 130 만명 925 억건
추적조사
- 흡연으로 유발된 35 종 질병
중 1 위 뇌질환 , 2 위 심장
질
환 외 각종 암종류중
- 법원의 인과관계 인정된
폐 : 소세포암
후두 : 편평세포암
편평상피세포암
537 억 /10 년 - 건보부담금
환수소송제기 .
가액늘려 소송규모확대계획
14. - 년간 흡연으로 인한 의료손실액 1 조 7 천억으로 건강보험공단은
흡연으로 인한 피해자의 정보를 메타데이터로 확보하여 흡연과
질병의 인과관계를 밝힐 수 있다 .
- 담배 중독증은 질병으로 분류
- 건강보험공단에서는 가입자들의 병원이용정보 , 성별 , 나이 , 질병유무
및 종류 등의 메타데이터를 활용하여 각종 통계데이터로 도출이 가능
하다 .
- 이용자에 관련 된 메타데이터를 바탕으로 추후에 건강의료예방정책을
수립할 때 참고가 가능하다 . .