際際滷

際際滷Share a Scribd company logo
Datamining 2007 antwoordmodel werkcollege-opgaven, week 1
N.B. De modelantwoorden zijn weergegeven in telegramstijl. Van de studenten wordt verwacht dat
zij normale Nederlandse zinnen gebruiken.
1. Mensen zetten data om in kennis, door leerproces of bewustzijn, waaruit mogelijk nieuwe
kennis ontstaat. Voor ML/DM technieken is het lastig om aan te tonen dat zij nieuwe nuttige
kennis hebben afgeleid. (1 punt)
2. Mensen leren doelgericht, met het oog op het verbeteren van prestaties. Bij machines is
doelgerichte manier van leren lastig vast te stellen. (1 punt)
3. Een concept is wat geleerd moet worden, een instantie is een voorbeeld van het concept wat
geleerd moet worden, en attributen zijn de features waarmee instanties omschreven worden.
(goed=3: 1 punt; 0<goed<3: 1/2 punt)
4.  typ- of meetfouten: controle de mogelijke attribuutwaardes handmatig
 dubbele instanties: automatische controle
 opzettelijke fouten: moeilijk op te sporen zonder uitgebreide kennis van de data
 verouderde data; beslissen tot wanneer data nog bruikbaar is
(goed>=3: 1 punt; 0<goed<3: 1/2 punt)
5. Nominale attributen hebben onvergelijkbare strings als waarden, ordinale hebben ook strings
als waarde maar deze kunnen wel worden vergeleken, en numerieke attributen hebben getallen
als waarde. (1 punt)
6. Beide zijn verzamelingen (gelabelde) data. De ene wordt door een classi鍖er gebruikt om
een model te bouwen (trainingdata) en de andere (geheel verschillend van de eerste) wordt
gebruikt om het gebouwde model te evalueren (testdata). (1 punt)
7.  Toenemende beschikbaarheid van data
 Nut van historische data voor het ontdekken van regelmatigheden
 Nut van historische data voor het verbeteren van beslissingsprocessen
(goed>=2: 1 punt; 0<goed<2: 1/2 punt)
8. Machine learning is een belangrijk onderdeel van datamining, maar datamining bestaat uit
meer stappen (onderhoud, data verzamelen, data schonen etc.) (1 punt)
9.  Ontwikkeling van accuratere leeralgorithmes
 Ontwikkeling van leeralgorithmes die diverse databronnen verwerken
 Ontwikkeling van leeralgorithmes die menselijke training gebruiken
 Integratie van leeralgorithmes in data-managementsystemen
 Dataminingtechnologie onder aandacht brengen van grote organisaties
(goed>=3: 1 punt; 0<goed<3: 1/2 punt)
10. Datamining is een nuttige technologie die nog verder kan worden verbeterd door toekomstige
ontwikkelingen. (1/2 punt) (Eigen mening: 1/2 punt).

More Related Content

Dm uitwerkingen wc1

  • 1. Datamining 2007 antwoordmodel werkcollege-opgaven, week 1 N.B. De modelantwoorden zijn weergegeven in telegramstijl. Van de studenten wordt verwacht dat zij normale Nederlandse zinnen gebruiken. 1. Mensen zetten data om in kennis, door leerproces of bewustzijn, waaruit mogelijk nieuwe kennis ontstaat. Voor ML/DM technieken is het lastig om aan te tonen dat zij nieuwe nuttige kennis hebben afgeleid. (1 punt) 2. Mensen leren doelgericht, met het oog op het verbeteren van prestaties. Bij machines is doelgerichte manier van leren lastig vast te stellen. (1 punt) 3. Een concept is wat geleerd moet worden, een instantie is een voorbeeld van het concept wat geleerd moet worden, en attributen zijn de features waarmee instanties omschreven worden. (goed=3: 1 punt; 0<goed<3: 1/2 punt) 4. typ- of meetfouten: controle de mogelijke attribuutwaardes handmatig dubbele instanties: automatische controle opzettelijke fouten: moeilijk op te sporen zonder uitgebreide kennis van de data verouderde data; beslissen tot wanneer data nog bruikbaar is (goed>=3: 1 punt; 0<goed<3: 1/2 punt) 5. Nominale attributen hebben onvergelijkbare strings als waarden, ordinale hebben ook strings als waarde maar deze kunnen wel worden vergeleken, en numerieke attributen hebben getallen als waarde. (1 punt) 6. Beide zijn verzamelingen (gelabelde) data. De ene wordt door een classi鍖er gebruikt om een model te bouwen (trainingdata) en de andere (geheel verschillend van de eerste) wordt gebruikt om het gebouwde model te evalueren (testdata). (1 punt) 7. Toenemende beschikbaarheid van data Nut van historische data voor het ontdekken van regelmatigheden Nut van historische data voor het verbeteren van beslissingsprocessen (goed>=2: 1 punt; 0<goed<2: 1/2 punt) 8. Machine learning is een belangrijk onderdeel van datamining, maar datamining bestaat uit meer stappen (onderhoud, data verzamelen, data schonen etc.) (1 punt) 9. Ontwikkeling van accuratere leeralgorithmes Ontwikkeling van leeralgorithmes die diverse databronnen verwerken Ontwikkeling van leeralgorithmes die menselijke training gebruiken Integratie van leeralgorithmes in data-managementsystemen Dataminingtechnologie onder aandacht brengen van grote organisaties (goed>=3: 1 punt; 0<goed<3: 1/2 punt) 10. Datamining is een nuttige technologie die nog verder kan worden verbeterd door toekomstige ontwikkelingen. (1/2 punt) (Eigen mening: 1/2 punt).