ݺߣ

ݺߣShare a Scribd company logo
Wiedza w grach, gry z celem
tworzenia wiedzy
dr inż. Agnieszka Ławrynowicz
Instytut Informatyki Politechniki Poznańskiej
ZTG 2013
Kim jestem?
• Adiunkt w Instytucie Informatyki Politechniki
Poznańskiej
• Zainteresowania: sztuczna inteligencja,
głównie reprezentacja i inżynieria wiedzy
(ontologie), odkrywanie wiedzy i technologie
semantyczne (Semantic Web)
http://www.cs.put.poznan.pl/alawrynowicz/
LeoLOD
• LeoLOD - Learning and Evolving Ontologies from Linked
Open Data (2013-2015)
• Projekt realizowany w ramach programu POMOST Fundacji
na Rzecz Nauki Polskiej
• Tworzenie wiedzy: metody automatyczne (uczenie
maszynowe)
• Walidacja wyników: crowd-sourcing (mikro-zadania)
• Strona projektu:
http://www.cs.put.poznan.pl/alawrynowicz/leolod/
WIEDZA W GRACH
Jeopardy!
• Jeopardy! to amerykański quiz show (odpowiednik
polskiego Va Banque!)
• 1964 – do dzisiaj
• format odpowiedź-i-pytanie
• Przykład:
– Kategoria: Nauka ogólnie
– Wskazówka: W zderzeniu z elektronami, fosfor wydziela energię
elektromagnetyczną w tej formie
– Odpowiedź: Czym jest światło?
dla ludzi, wyzwaniem jest znajomość odpowiedzi
dla maszyn, wyzwaniem jest zrozumienie pytania
IBM Watson
• Watson – system komputerowy stworzony
przez IBM do odpowiadania na pytania
zadawane w języku naturalnym
• Watson wystąpił w Jeopardy! w trzydniowej
rozgrywce (2011) …
IBM Watson
…
• przeciwnikami IBM Watsona byli:
– Brad Rutter – do tej pory wygrał najwięcej
pieniędzy,
– Ken Jennings – był najdłużej niepokonanym
mistrzem
• IBM Watson zajął pierwsze miejsce
IBM Watson
• DeepQA (Watson)
– generuje i ocenia wiele hipotez wykorzystując kolekcję metod z
dziedziny przetwarzania języka naturalnego, uczenia
maszynowego, reprezentacji wiedzy i wnioskowania;
– gromadzą one i ważą dowody pochodzące ze źródeł danych
niestrukturalnych i strukturalnych (np. otwartych powiązanych
danych) aby ustalić odpowiedź o najwyższej pewności na
podstawie odpowiedzi wielu (setek) metod
JĘZYK NATURALNY ZADANIE
parsowanie
NER
wyszukiwanie
informacji
technologie
semantyczne
uczenie
maszynowe
crowd
IBM Watson
• DeepQA (Watson)
– generuje i ocenia wiele hipotez wykorzystując kolekcję metod z
dziedziny przetwarzania języka naturalnego, uczenia
maszynowego, reprezentacji wiedzy i wnioskowania;
– gromadzą one i ważą dowody pochodzące ze źródeł danych
niestrukturalnych i strukturalnych (np. otwartych powiązanych
danych) aby ustalić odpowiedź o najwyższej pewności na
podstawie odpowiedzi wielu (setek) metod
JĘZYK NATURALNY ZADANIE
parsowanie
NER
wyszukiwanie
informacji
technologie
semantyczne
uczenie
maszynowe
crowd
GRY Z CELEM TWORZENIA WIEDZY
Tworzenie wiedzy
• wykwalifikowany zespół ludzi
• metody (pół)-automatyczne
• społecznościowe (crowd-sourcing)
Tworzenie wiedzy
• wykwalifikowany zespół ludzi
• metody (pół)-automatyczne
• społecznościowe (crowd-sourcing):
– Gry z celem tworzenia wiedzy
Motywacje w tworzeniu treści przez
społeczność
• Obopólna korzyść (tagowanie)
• Reputacja, sława (Wikipedia)
• Rywalizacja
• Przystosowanie się do grupy
• Altruizm
• Poczucie własnej wartości i nauka
• Zabawa i osobista przyjemność
• Domniemana obietnica przyszłych nagród
• Nagrody (Amazon Mechanical Turk)
Gry z celem
• Games with a purpose (GWAP):
• Technika oparta na obliczeniach wykonywanych przez
ludzi (human-based computation)
• Proces obliczeniowy wykonywany jest poprzez zlecanie
niektórych czynności ludziom do wykonania w
zabawny, zajmujący sposób
• GWAP wykorzystuje różnice w umiejętnościach i
kosztach pracy ludzi i metod informatycznych w celu
osiągnięcia symbiotycznej interakcji człowiek-komputer
Gry z celem
• Luis Von Ahn (2006)
• Główna motywacja: nie leży w rozwiązaniu instancji
problemu obliczeniowego, jest to ludzkie pragnienie
zabawy
• W GWAP ludzie wykonują pożyteczne obliczenia jako
efekt uboczny przyjemnej rozrywki
• Miarą użyteczności GWAP jest kombinacja
wygenerowanych wyników i przyjemności rozgrywki
Kluczowe elementy GWAP
Gry z celem tworzenia treści, wiedzy
• Adnotacja tekstu/audio/obrazów/video
• Konstrukcja ontologii
• Mapowanie ontologii
• Tworzenie linków między zasobami
• „Wyścigi Wiki”
Adnotacja obrazów:
Google Image Labeler
• Dwuosobowa gra internetowa (online: 2006 – 2011,
wcześniej ESP Game)
• Cel: przypisanie etykiet do obrazka; dane wprowadzone
przez graczy wspomagały wyszukiwarkę grafik Google
• Zasady: punkty za podanie zgodnych etykiet obiektów na
obrazku. Często podawane etykiety umieszczane na
czarnej liście, niepunktowane.
• Dane wyjściowe : adnotacje opisujące obiekty na
obrazkach
• Walidacja: konsensus, większość
ESP Game
Źródło: http://www.idolhands.com/contact/
• Wieloosobowa gra
• Cel: adnotacja audio
• Zasady: kilka mini-gier dotyczących części utworu
muzycznego; wszyscy gracze słuchają tego
samego fragmentu audio i odpowiadają na
pytania. Punkty przyznawane za podobieństwo
odpowiedzi do tych udzielonych przez innych
graczy.
• Dane wyjściowe: adnotacja plików audio
• Walidacja: konsensus, większość
Adnotacja audio:
HerdIt
Ontologia w „pigułce”
• “An ontology is a
• formal specification  maszynowa interpretacja
• of a shared  grupa osób, konsensus
• conceptualization  abstrakcyjny model zjawisk, pojęcia
• of a domain of interest“  wiedza dziedzinowa
• (Gruber 93)
ontologia = formalna specyfikacja pojęć z danej dziedziny
Konstrukcja ontologii:
OntoPronto (Ontogame)
• Dwuosobowa gra quizowa
• Cel: budowa ontologii dziedzinowej będącej
rozszerzeniem ontologii Proton
• Zasady: Gracze czytają streszczenie losowo
wybranego artykułu z Wikipedii i odpowiadają na
zapytania o relacji tego artykułu w stosunku do
ontologii Proton.
• Dane wyjściowe: Ontologia dziedzinowa
ufundowana na ontologii Proton
• Walidacja: konsensus, większość
OntoPronto (Ontogame)
Mapowanie ontologii:
SpotTheLink
• Dwuosobowa gra quizowa
• Cel: uzgadnianie ontologii, np. Dbpedia i Proton
• Zasady: Graczom prezentowane jest pojęcie z
jednej ontologii. Pierwszy krok: zgadzają się co do
odpowiadającego mu pojęcia w drugiej ontologii.
Krok drugi: zgadzają się co do relacji wiążącej te
dwa pojęcia.
• Dane wyjściowe: Odwzorowanie (w języku
SKOS)pomiędzy pojęciami w ontologiach
• Walidacja: konsensus, większość
SpotTheLink
Otwarte powiązane dane w „pigułce”
• Projekt społecznościowy ze wsparciem W3C
• Publikowanie zbiorów danych jako otwarte i powiązane ze
sobą dane grafowe (sieci semantyczne)
• Główna idea: wziąć istniejące (otwarte) zbiory danych i
uczynić je dostępnymi w sieci WWW w formacie RDF (sieci
semantyczne)
• Raz opublikowane w RDF, połączyć je linkami z innymi
zbiorami danych
• Przykładowy link RDF: http://dbpedia.org/resource/Berlin
[Identyfikator Berlina w DBPedia] owl:sameAs
http://sws.geonames.org/2950159 [Identyfikator Berlina w Geonames].
Tworzenie linków między zasobami:
VeriLinks
• Cel: walidacja linków w arbitralnym zbiorze
danych
• Zasady: Zgoda graczy co do poprawności linku
jest nagradzana monetami, które są następnie
wykorzystywane do zwalczania najeźdźców w
grze polegającej na obronie wieży.
• Dane wyjściowe: zwalidowane linki
VeriLinks
„Wyścigi Wiki”:
Wikispeedia
• Podążanie za linkami w Wikipedii
• Cel: obliczanie semantycznej odległości
pomiędzy dwoma artykułami Wikipedii.
• Zasady: Gracze muszą znaleźć jak najkrótszą
ścieżkę między dwoma hasłami.
• Dane wyjściowe: semantyczna odległość
pomiędzy dwoma artykułami Walidacja:
Większość
Wikispeedia
Spróbuj: Game -> Astronomy, Game->Potato
Dalsze uwagi
• Nie każde zadanie da się łatwo przerobić na
GWAP (wymóg dekompozycji na mikro-
zadania)
• Tworzenie niektórych ontologii wymaga
bardzo specjalistycznej wiedzy
• To co powstaje w wyniku GWAP jest raczej
„płytkim” modelem
• GWAP wymaga strategii zapobiegania
oszustwom
Więcej informacji
• LeoLOD:
http://www.cs.put.poznan.pl/alawrynowicz/leolod
• IBM Watson (The DeepQA Project):
http://researcher.ibm.com/researcher/view_project.php?id=2099
• GWAP:
1. Luis von Ahn (2006). "Games With A Purpose" (PDF). IEEE Computer
Magazine: 96–98.
2. Luis von Ahn, Laura Dabbish (2008). "Designing Games With A Purpose"
(PDF). Communications of the ACM 51 (08/08).
• Semantic Games:
1. Elena Simperl, Roberta Cuel, Martin Stein, Incentive-Centric Semantic
Web Application Engineering, Morgan & Claypool Publishers (2013)
2. http://semanticgames.org/
Ad

Recommended

Semantic Web Technologies: A Paradigm for Medical Informatics
Semantic Web Technologies: A Paradigm for Medical Informatics
Chimezie Ogbuji
Zarządzanie danymi badawczymi
Zarządzanie danymi badawczymi
Platforma Otwartej Nauki
Marcin Roszkowski : Modelowanie uniwersum bibliograficznego, czyli do czego p...
Marcin Roszkowski : Modelowanie uniwersum bibliograficznego, czyli do czego p...
Zakład Systemów Informacyjnych, Instytut Informacji Naukowej i Studiów Bibliologicznych (UW)
Strategie wykorzystania Internetu w nauce historycznej
Strategie wykorzystania Internetu w nauce historycznej
historiaimedia
Konferencja e-commerce 2007 Web 3.0 - Internet semantyczny; Kazimierz Pogoda,...
Konferencja e-commerce 2007 Web 3.0 - Internet semantyczny; Kazimierz Pogoda,...
ecommerce2007
Gene Wiki and Wikimedia Foundation SPARQL workshop
Gene Wiki and Wikimedia Foundation SPARQL workshop
Benjamin Good
Otwarte Miasta
Otwarte Miasta
Data Science Warsaw
Multilingual challenges for accessing digitized culture online - Riga Summit 15
Multilingual challenges for accessing digitized culture online - Riga Summit 15
Antoine Isaac
Modelling Knowledge Organization Systems and Structures
Modelling Knowledge Organization Systems and Structures
Marcia Zeng
KOSO Knowledge Organization Systems Ontology
KOSO Knowledge Organization Systems Ontology
Katrin Weller
Multilingual Knowledge Organization Systems Management: Best Practices
Multilingual Knowledge Organization Systems Management: Best Practices
Mauro Dragoni
Wikipedia as source of collaboratively created Knowledge Organization Systems
Wikipedia as source of collaboratively created Knowledge Organization Systems
Jakob .
Justyna Walkowska, Semantic Web - technologia w rękach humanistów
Justyna Walkowska, Semantic Web - technologia w rękach humanistów
Geek Girls Carrots Poznan
Czy Pan istnieje Mr. Jones? RDF jako model rekordu bibliograficznego
Czy Pan istnieje Mr. Jones? RDF jako model rekordu bibliograficznego
Marcin Roszkowski
Using OWL for the RESO Data Dictionary
Using OWL for the RESO Data Dictionary
Chimezie Ogbuji
DigiBird: on the fly collection integration using crowdsourcing
DigiBird: on the fly collection integration using crowdsourcing
VU University Amsterdam
Crowdsourcing Linked Data Quality Assessment
Crowdsourcing Linked Data Quality Assessment
Maribel Acosta Deibe
Brief on Linked Data for U.S. EPA's Chief Data Scientist
Brief on Linked Data for U.S. EPA's Chief Data Scientist
3 Round Stones
Internetowe narzędzia zarządzania informacją (wybór)
Internetowe narzędzia zarządzania informacją (wybór)
Marcin Roszkowski
Role of Ontologies in Semantic Digital Libraries
Role of Ontologies in Semantic Digital Libraries
Sebastian Ryszard Kruk
AP CodeWeek 2016
AP CodeWeek 2016
EwaB
Ontologia w informatyce, ontology
Ontologia w informatyce, ontology
EwaB
Semantic Data Management in Graph Databases: ESWC 2014 Tutorial
Semantic Data Management in Graph Databases: ESWC 2014 Tutorial
Maribel Acosta Deibe
Linked Open Data in Romania
Linked Open Data in Romania
Vlad Posea
VIII Encuentros de Centros de Documentación de Arte Contemporáneo en Artium -...
VIII Encuentros de Centros de Documentación de Arte Contemporáneo en Artium -...
Artium Vitoria
Wikidata and the Semantic Web of Food
Wikidata and the Semantic Web of Food
Benjamin Good
Knowledge Organization System (KOS) for biodiversity information resources, G...
Knowledge Organization System (KOS) for biodiversity information resources, G...
Dag Endresen
Knowledge Organization Systems
Knowledge Organization Systems
R A Akerkar
CHIST-ERA 2019 - presentation of CAMIL (Poznan University of Technology)
CHIST-ERA 2019 - presentation of CAMIL (Poznan University of Technology)
Agnieszka Ławrynowicz
Ontologie w historyczno-geograficznych systemach informacyjnych
Ontologie w historyczno-geograficznych systemach informacyjnych
Agnieszka Ławrynowicz

More Related Content

Viewers also liked (20)

Modelling Knowledge Organization Systems and Structures
Modelling Knowledge Organization Systems and Structures
Marcia Zeng
KOSO Knowledge Organization Systems Ontology
KOSO Knowledge Organization Systems Ontology
Katrin Weller
Multilingual Knowledge Organization Systems Management: Best Practices
Multilingual Knowledge Organization Systems Management: Best Practices
Mauro Dragoni
Wikipedia as source of collaboratively created Knowledge Organization Systems
Wikipedia as source of collaboratively created Knowledge Organization Systems
Jakob .
Justyna Walkowska, Semantic Web - technologia w rękach humanistów
Justyna Walkowska, Semantic Web - technologia w rękach humanistów
Geek Girls Carrots Poznan
Czy Pan istnieje Mr. Jones? RDF jako model rekordu bibliograficznego
Czy Pan istnieje Mr. Jones? RDF jako model rekordu bibliograficznego
Marcin Roszkowski
Using OWL for the RESO Data Dictionary
Using OWL for the RESO Data Dictionary
Chimezie Ogbuji
DigiBird: on the fly collection integration using crowdsourcing
DigiBird: on the fly collection integration using crowdsourcing
VU University Amsterdam
Crowdsourcing Linked Data Quality Assessment
Crowdsourcing Linked Data Quality Assessment
Maribel Acosta Deibe
Brief on Linked Data for U.S. EPA's Chief Data Scientist
Brief on Linked Data for U.S. EPA's Chief Data Scientist
3 Round Stones
Internetowe narzędzia zarządzania informacją (wybór)
Internetowe narzędzia zarządzania informacją (wybór)
Marcin Roszkowski
Role of Ontologies in Semantic Digital Libraries
Role of Ontologies in Semantic Digital Libraries
Sebastian Ryszard Kruk
AP CodeWeek 2016
AP CodeWeek 2016
EwaB
Ontologia w informatyce, ontology
Ontologia w informatyce, ontology
EwaB
Semantic Data Management in Graph Databases: ESWC 2014 Tutorial
Semantic Data Management in Graph Databases: ESWC 2014 Tutorial
Maribel Acosta Deibe
Linked Open Data in Romania
Linked Open Data in Romania
Vlad Posea
VIII Encuentros de Centros de Documentación de Arte Contemporáneo en Artium -...
VIII Encuentros de Centros de Documentación de Arte Contemporáneo en Artium -...
Artium Vitoria
Wikidata and the Semantic Web of Food
Wikidata and the Semantic Web of Food
Benjamin Good
Knowledge Organization System (KOS) for biodiversity information resources, G...
Knowledge Organization System (KOS) for biodiversity information resources, G...
Dag Endresen
Knowledge Organization Systems
Knowledge Organization Systems
R A Akerkar
Modelling Knowledge Organization Systems and Structures
Modelling Knowledge Organization Systems and Structures
Marcia Zeng
KOSO Knowledge Organization Systems Ontology
KOSO Knowledge Organization Systems Ontology
Katrin Weller
Multilingual Knowledge Organization Systems Management: Best Practices
Multilingual Knowledge Organization Systems Management: Best Practices
Mauro Dragoni
Wikipedia as source of collaboratively created Knowledge Organization Systems
Wikipedia as source of collaboratively created Knowledge Organization Systems
Jakob .
Justyna Walkowska, Semantic Web - technologia w rękach humanistów
Justyna Walkowska, Semantic Web - technologia w rękach humanistów
Geek Girls Carrots Poznan
Czy Pan istnieje Mr. Jones? RDF jako model rekordu bibliograficznego
Czy Pan istnieje Mr. Jones? RDF jako model rekordu bibliograficznego
Marcin Roszkowski
Using OWL for the RESO Data Dictionary
Using OWL for the RESO Data Dictionary
Chimezie Ogbuji
DigiBird: on the fly collection integration using crowdsourcing
DigiBird: on the fly collection integration using crowdsourcing
VU University Amsterdam
Crowdsourcing Linked Data Quality Assessment
Crowdsourcing Linked Data Quality Assessment
Maribel Acosta Deibe
Brief on Linked Data for U.S. EPA's Chief Data Scientist
Brief on Linked Data for U.S. EPA's Chief Data Scientist
3 Round Stones
Internetowe narzędzia zarządzania informacją (wybór)
Internetowe narzędzia zarządzania informacją (wybór)
Marcin Roszkowski
Role of Ontologies in Semantic Digital Libraries
Role of Ontologies in Semantic Digital Libraries
Sebastian Ryszard Kruk
AP CodeWeek 2016
AP CodeWeek 2016
EwaB
Ontologia w informatyce, ontology
Ontologia w informatyce, ontology
EwaB
Semantic Data Management in Graph Databases: ESWC 2014 Tutorial
Semantic Data Management in Graph Databases: ESWC 2014 Tutorial
Maribel Acosta Deibe
Linked Open Data in Romania
Linked Open Data in Romania
Vlad Posea
VIII Encuentros de Centros de Documentación de Arte Contemporáneo en Artium -...
VIII Encuentros de Centros de Documentación de Arte Contemporáneo en Artium -...
Artium Vitoria
Wikidata and the Semantic Web of Food
Wikidata and the Semantic Web of Food
Benjamin Good
Knowledge Organization System (KOS) for biodiversity information resources, G...
Knowledge Organization System (KOS) for biodiversity information resources, G...
Dag Endresen
Knowledge Organization Systems
Knowledge Organization Systems
R A Akerkar

More from Agnieszka Ławrynowicz (8)

CHIST-ERA 2019 - presentation of CAMIL (Poznan University of Technology)
CHIST-ERA 2019 - presentation of CAMIL (Poznan University of Technology)
Agnieszka Ławrynowicz
Ontologie w historyczno-geograficznych systemach informacyjnych
Ontologie w historyczno-geograficznych systemach informacyjnych
Agnieszka Ławrynowicz
Semantic data mining: an ontology based approach
Semantic data mining: an ontology based approach
Agnieszka Ławrynowicz
ML Schema: Machine Learning Schema
ML Schema: Machine Learning Schema
Agnieszka Ławrynowicz
Semantic Meta-Mining of Knowledge Discovery Processes
Semantic Meta-Mining of Knowledge Discovery Processes
Agnieszka Ławrynowicz
Hazardous Situation Ontology Design Pattern
Hazardous Situation Ontology Design Pattern
Agnieszka Ławrynowicz
Using Substitutive Itemset Mining Framework for Finding Synonymous Properties...
Using Substitutive Itemset Mining Framework for Finding Synonymous Properties...
Agnieszka Ławrynowicz
Data Mining OPtimization Ontology and its application to meta-mining of knowl...
Data Mining OPtimization Ontology and its application to meta-mining of knowl...
Agnieszka Ławrynowicz
CHIST-ERA 2019 - presentation of CAMIL (Poznan University of Technology)
CHIST-ERA 2019 - presentation of CAMIL (Poznan University of Technology)
Agnieszka Ławrynowicz
Ontologie w historyczno-geograficznych systemach informacyjnych
Ontologie w historyczno-geograficznych systemach informacyjnych
Agnieszka Ławrynowicz
Semantic data mining: an ontology based approach
Semantic data mining: an ontology based approach
Agnieszka Ławrynowicz
Semantic Meta-Mining of Knowledge Discovery Processes
Semantic Meta-Mining of Knowledge Discovery Processes
Agnieszka Ławrynowicz
Hazardous Situation Ontology Design Pattern
Hazardous Situation Ontology Design Pattern
Agnieszka Ławrynowicz
Using Substitutive Itemset Mining Framework for Finding Synonymous Properties...
Using Substitutive Itemset Mining Framework for Finding Synonymous Properties...
Agnieszka Ławrynowicz
Data Mining OPtimization Ontology and its application to meta-mining of knowl...
Data Mining OPtimization Ontology and its application to meta-mining of knowl...
Agnieszka Ławrynowicz
Ad

ZTG 2013 Agnieszka Ławrynowicz

  • 1. Wiedza w grach, gry z celem tworzenia wiedzy dr inż. Agnieszka Ławrynowicz Instytut Informatyki Politechniki Poznańskiej ZTG 2013
  • 2. Kim jestem? • Adiunkt w Instytucie Informatyki Politechniki Poznańskiej • Zainteresowania: sztuczna inteligencja, głównie reprezentacja i inżynieria wiedzy (ontologie), odkrywanie wiedzy i technologie semantyczne (Semantic Web) http://www.cs.put.poznan.pl/alawrynowicz/
  • 3. LeoLOD • LeoLOD - Learning and Evolving Ontologies from Linked Open Data (2013-2015) • Projekt realizowany w ramach programu POMOST Fundacji na Rzecz Nauki Polskiej • Tworzenie wiedzy: metody automatyczne (uczenie maszynowe) • Walidacja wyników: crowd-sourcing (mikro-zadania) • Strona projektu: http://www.cs.put.poznan.pl/alawrynowicz/leolod/
  • 5. Jeopardy! • Jeopardy! to amerykański quiz show (odpowiednik polskiego Va Banque!) • 1964 – do dzisiaj • format odpowiedź-i-pytanie • Przykład: – Kategoria: Nauka ogólnie – Wskazówka: W zderzeniu z elektronami, fosfor wydziela energię elektromagnetyczną w tej formie – Odpowiedź: Czym jest światło? dla ludzi, wyzwaniem jest znajomość odpowiedzi dla maszyn, wyzwaniem jest zrozumienie pytania
  • 6. IBM Watson • Watson – system komputerowy stworzony przez IBM do odpowiadania na pytania zadawane w języku naturalnym • Watson wystąpił w Jeopardy! w trzydniowej rozgrywce (2011) …
  • 7. IBM Watson … • przeciwnikami IBM Watsona byli: – Brad Rutter – do tej pory wygrał najwięcej pieniędzy, – Ken Jennings – był najdłużej niepokonanym mistrzem • IBM Watson zajął pierwsze miejsce
  • 8. IBM Watson • DeepQA (Watson) – generuje i ocenia wiele hipotez wykorzystując kolekcję metod z dziedziny przetwarzania języka naturalnego, uczenia maszynowego, reprezentacji wiedzy i wnioskowania; – gromadzą one i ważą dowody pochodzące ze źródeł danych niestrukturalnych i strukturalnych (np. otwartych powiązanych danych) aby ustalić odpowiedź o najwyższej pewności na podstawie odpowiedzi wielu (setek) metod JĘZYK NATURALNY ZADANIE parsowanie NER wyszukiwanie informacji technologie semantyczne uczenie maszynowe crowd
  • 9. IBM Watson • DeepQA (Watson) – generuje i ocenia wiele hipotez wykorzystując kolekcję metod z dziedziny przetwarzania języka naturalnego, uczenia maszynowego, reprezentacji wiedzy i wnioskowania; – gromadzą one i ważą dowody pochodzące ze źródeł danych niestrukturalnych i strukturalnych (np. otwartych powiązanych danych) aby ustalić odpowiedź o najwyższej pewności na podstawie odpowiedzi wielu (setek) metod JĘZYK NATURALNY ZADANIE parsowanie NER wyszukiwanie informacji technologie semantyczne uczenie maszynowe crowd
  • 10. GRY Z CELEM TWORZENIA WIEDZY
  • 11. Tworzenie wiedzy • wykwalifikowany zespół ludzi • metody (pół)-automatyczne • społecznościowe (crowd-sourcing)
  • 12. Tworzenie wiedzy • wykwalifikowany zespół ludzi • metody (pół)-automatyczne • społecznościowe (crowd-sourcing): – Gry z celem tworzenia wiedzy
  • 13. Motywacje w tworzeniu treści przez społeczność • Obopólna korzyść (tagowanie) • Reputacja, sława (Wikipedia) • Rywalizacja • Przystosowanie się do grupy • Altruizm • Poczucie własnej wartości i nauka • Zabawa i osobista przyjemność • Domniemana obietnica przyszłych nagród • Nagrody (Amazon Mechanical Turk)
  • 14. Gry z celem • Games with a purpose (GWAP): • Technika oparta na obliczeniach wykonywanych przez ludzi (human-based computation) • Proces obliczeniowy wykonywany jest poprzez zlecanie niektórych czynności ludziom do wykonania w zabawny, zajmujący sposób • GWAP wykorzystuje różnice w umiejętnościach i kosztach pracy ludzi i metod informatycznych w celu osiągnięcia symbiotycznej interakcji człowiek-komputer
  • 15. Gry z celem • Luis Von Ahn (2006) • Główna motywacja: nie leży w rozwiązaniu instancji problemu obliczeniowego, jest to ludzkie pragnienie zabawy • W GWAP ludzie wykonują pożyteczne obliczenia jako efekt uboczny przyjemnej rozrywki • Miarą użyteczności GWAP jest kombinacja wygenerowanych wyników i przyjemności rozgrywki
  • 17. Gry z celem tworzenia treści, wiedzy • Adnotacja tekstu/audio/obrazów/video • Konstrukcja ontologii • Mapowanie ontologii • Tworzenie linków między zasobami • „Wyścigi Wiki”
  • 18. Adnotacja obrazów: Google Image Labeler • Dwuosobowa gra internetowa (online: 2006 – 2011, wcześniej ESP Game) • Cel: przypisanie etykiet do obrazka; dane wprowadzone przez graczy wspomagały wyszukiwarkę grafik Google • Zasady: punkty za podanie zgodnych etykiet obiektów na obrazku. Często podawane etykiety umieszczane na czarnej liście, niepunktowane. • Dane wyjściowe : adnotacje opisujące obiekty na obrazkach • Walidacja: konsensus, większość
  • 20. • Wieloosobowa gra • Cel: adnotacja audio • Zasady: kilka mini-gier dotyczących części utworu muzycznego; wszyscy gracze słuchają tego samego fragmentu audio i odpowiadają na pytania. Punkty przyznawane za podobieństwo odpowiedzi do tych udzielonych przez innych graczy. • Dane wyjściowe: adnotacja plików audio • Walidacja: konsensus, większość Adnotacja audio: HerdIt
  • 21. Ontologia w „pigułce” • “An ontology is a • formal specification  maszynowa interpretacja • of a shared  grupa osób, konsensus • conceptualization  abstrakcyjny model zjawisk, pojęcia • of a domain of interest“  wiedza dziedzinowa • (Gruber 93) ontologia = formalna specyfikacja pojęć z danej dziedziny
  • 22. Konstrukcja ontologii: OntoPronto (Ontogame) • Dwuosobowa gra quizowa • Cel: budowa ontologii dziedzinowej będącej rozszerzeniem ontologii Proton • Zasady: Gracze czytają streszczenie losowo wybranego artykułu z Wikipedii i odpowiadają na zapytania o relacji tego artykułu w stosunku do ontologii Proton. • Dane wyjściowe: Ontologia dziedzinowa ufundowana na ontologii Proton • Walidacja: konsensus, większość
  • 24. Mapowanie ontologii: SpotTheLink • Dwuosobowa gra quizowa • Cel: uzgadnianie ontologii, np. Dbpedia i Proton • Zasady: Graczom prezentowane jest pojęcie z jednej ontologii. Pierwszy krok: zgadzają się co do odpowiadającego mu pojęcia w drugiej ontologii. Krok drugi: zgadzają się co do relacji wiążącej te dwa pojęcia. • Dane wyjściowe: Odwzorowanie (w języku SKOS)pomiędzy pojęciami w ontologiach • Walidacja: konsensus, większość
  • 26. Otwarte powiązane dane w „pigułce” • Projekt społecznościowy ze wsparciem W3C • Publikowanie zbiorów danych jako otwarte i powiązane ze sobą dane grafowe (sieci semantyczne) • Główna idea: wziąć istniejące (otwarte) zbiory danych i uczynić je dostępnymi w sieci WWW w formacie RDF (sieci semantyczne) • Raz opublikowane w RDF, połączyć je linkami z innymi zbiorami danych • Przykładowy link RDF: http://dbpedia.org/resource/Berlin [Identyfikator Berlina w DBPedia] owl:sameAs http://sws.geonames.org/2950159 [Identyfikator Berlina w Geonames].
  • 27. Tworzenie linków między zasobami: VeriLinks • Cel: walidacja linków w arbitralnym zbiorze danych • Zasady: Zgoda graczy co do poprawności linku jest nagradzana monetami, które są następnie wykorzystywane do zwalczania najeźdźców w grze polegającej na obronie wieży. • Dane wyjściowe: zwalidowane linki
  • 29. „Wyścigi Wiki”: Wikispeedia • Podążanie za linkami w Wikipedii • Cel: obliczanie semantycznej odległości pomiędzy dwoma artykułami Wikipedii. • Zasady: Gracze muszą znaleźć jak najkrótszą ścieżkę między dwoma hasłami. • Dane wyjściowe: semantyczna odległość pomiędzy dwoma artykułami Walidacja: Większość
  • 30. Wikispeedia Spróbuj: Game -> Astronomy, Game->Potato
  • 31. Dalsze uwagi • Nie każde zadanie da się łatwo przerobić na GWAP (wymóg dekompozycji na mikro- zadania) • Tworzenie niektórych ontologii wymaga bardzo specjalistycznej wiedzy • To co powstaje w wyniku GWAP jest raczej „płytkim” modelem • GWAP wymaga strategii zapobiegania oszustwom
  • 32. Więcej informacji • LeoLOD: http://www.cs.put.poznan.pl/alawrynowicz/leolod • IBM Watson (The DeepQA Project): http://researcher.ibm.com/researcher/view_project.php?id=2099 • GWAP: 1. Luis von Ahn (2006). "Games With A Purpose" (PDF). IEEE Computer Magazine: 96–98. 2. Luis von Ahn, Laura Dabbish (2008). "Designing Games With A Purpose" (PDF). Communications of the ACM 51 (08/08). • Semantic Games: 1. Elena Simperl, Roberta Cuel, Martin Stein, Incentive-Centric Semantic Web Application Engineering, Morgan & Claypool Publishers (2013) 2. http://semanticgames.org/

Editor's Notes

  • #3: Może można od razu cos powiedziec o moim projekcie i ze tworzenie wiedzy jest jego tematem? Może można po prostu zrobic slajd z tego kim jestem i czym się zajmuje i drugi o kontekscie projektu i dlaczego mnie ten wlasnie temat/te tematy interesuje/interesuja?
  • #7: Można usunac np. ostatnia informacje i po tym puscic film z tego jak to bylo
  • #9: Tutaj może przed tym film a ten slajd jako podsumowanie
  • #10: Tutaj może przed tym film a ten slajd jako podsumowanie
  • #12: Tutaj może być krotka reklama, np., w pierwszym przypadku np., za pomoca narzedzia protege, w drugim chcemy napisac wtyczke do tego narzedzia i zrobic to pol-automatycznie, a dzisiaj chce mowic o trzecim temacie
  • #14: In the last few years researchers from different scientific disciplines investigated the grounds of the success of community-driven content creation. Although these studies reveal that the inner motivations that drive people to participate are heterogeneous and strongly context-specific, several main categories can be identified: Reciprocity and expectancy Reciprocity means that contributors receive an immediate or long- term benefit in return for spending their time and resources on performing a certain task. An example of this is tagging, where the user organizes her knowledge assets, such as bookmarks or pictures, and while doing so, reuses tag classifications of other users. Reputation Reputation is an important factor within (virtual) communities: it can drive users to invest time and effort to improve the opinion of their peers about them. It has shown that this is an important motivation for, for instance, Wikipedia users [75]. Competition Competition is a relevant incentive in the context of games (rankings), but it can also be a strong driver in community portals where the user with the, for example, most contributions, or highest status is awarded. Conformitytoagroup Throughimitationandempathypeopletendtoconformtothesocialgroup they belong to, therefore making available information about members behaviors is a way to spur people to act according to this information. Staying with the example of Wikipedia as a strong community, studies have shown that the feeling of belonging to a group makes users be more active and supportive. They feel needed and thus obliged to contribute to the joint goals of their community [75]. Altruism People contribute to a joint endeavor because they believe it is for a good cause, without expecting anything in return. Self-esteem and learning People contribute to a certain endeavor in order for them to grow as individuals, either in terms of their own self-perception or to increase their knowledge and skills. Fun and personal enjoyment People get engaged in entertaining activities. The most popular ap- proach in this context hides a complex task behind casual games [114, 132]. Implicit promise of future monetary rewards People typically act in order to increase their own human capital and to position themselves to gain future rewards (money or better roles). Rewards Peoplereceiveadirectcompensationwhichcanobviouslyplayalargeroleinexplainingthe rationale for contributing effort toward a goal. Examples of this are crowdsourcing platforms, such as Amazon’s Mechanical Turk2 or InnoCentive.3
  • #15: I tutaj o tym, ze wg tego pana najwazniejsza motywacja jest nie altruism i pieniadze ale wlasnie to radosc z grania
  • #17: described as a series of interconnected questions (or challenges), which the players will need to answer during the game. The questions depend on the input, which is taken from the knowledge corpus the game processes and may be closed or open scale. The problem solved through the game needs to be highly decomposable into tasks which can be approached in a decentralized fashion by answering different questions. The questions themselves can have a varying level of difficulty, but in general it is assumed that an average player will be able to answer them in a matter of a couple of minutes. The input used to generate the questions needs to be verbalized and translated into simple, unambiguous questions. When the input is generated automatically, for instance because it contains results computed by algorithms that need to be validated by the players, it is essential that the quality of these results is not too low—otherwise the game experience will be less entertaining, as many of the questions will probably not make any sense at all. One important aspect to be considered is how to assign questions to players. The basic approach is to do this randomly, though optimizations are possible when information about the performance of players in previous game rounds is available In addition, in a multi-player game, the game developer might want to customize the ways players are matched to play against each other. The output of a game with a purpose is an aggregated, manually cleansed form of the players’ answers. In a first step, the game developer needs to be able to match the contributions of the players; this is a not an issue for those challenges in which the set of allowed solutions are known, but it is less trivial in open-scale questions, where one has to deal not only with different spelling and spelling errors, but also synonyms and the like. As a second step, the game developer needs ways to be able to identify correct answers with as little effort as possible, ideally automatically. Once accurate answers are identified, the game developer needs to translate them into a semantic format, using existing ontologies and Semantic Web representation languages. The most basic game elements are points and leader boards.
  • #18: Tutaj wymienione te kategorie od eleny lub z insemtives itp..