際際滷

際際滷Share a Scribd company logo
Een korte introductie

Justin van Wees               Bart de Goede
justin@vwees.net              bart@degoede.nu
@justin_v_w                   @bartdegoede
PentaPolitica.nl


 In 2009 op eigen initiatief gestart na project
  met kamervragen
 Trias Politica (Montesquieu)
PentaPolitica.nl
 Data over personen en partijen (statisch)
  Namen, zittingen, nevenfuncties,
    opleidingen, etc.
 Uitingen in social media (dynamisch)
  Tweets, videos (YouTube), fotos, blogs,
    etc.
Pentapolitica.nl - Introductie
Pentapolitica.nl - Introductie
Pentapolitica.nl - Introductie
Pentapolitica.nl - Introductie
Pentapolitica.nl - Introductie
Pentapolitica.nl - Introductie
Pentapolitica.nl - Introductie
Technische details
 Importeren
  Verschillende APIs
  Python
 Dataopslag
  MySQL
 Frontend
  CakePHP
Partijen

 Naam
 Afkorting
 Datum van oprichting
 Logo
 Lidzittingen
Personalia
 Voornaam                    Levens鍖loso鍖e
 Achternaam                  Loopbaan *
 Roepnaam                       Periode, instituut, functie
 Initialen                   Nevenfuncties *
 Titels                         Periode, instituut, functie
 Geslacht *                  Opleidingen *
 Biogra鍖e                       Periode, instituut, functie
 Foto *                      Lidzittingen
 PDC-code                       Periode, Kamer en partij
 Geboorteplaats en -datum      * niet altijd volledig
 Plaats en datum van
                                Bronnen: parlement.com,
  overlijden                    tweedekamer.nl, eerstekamer.nl
Feeds
 Fotos in verschillende formaten
  (gedownload)*
 Metadata van fotos (datum, locatie, tags,
  etc.)
 Gebruikersinformatie (aanmaakdatum
  account, aantal views, etc.)
 Titel, beschrijving, tags, etc.
 De video zelf (in hoogst beschikbare
  kwaliteit)
 Statistieken van videos (aantal views,
  beoordelingen, etc.)
 Gebruikersinformatie (vrienden, aantal
  abonnementen, etc.)
 Tweets (inhoud, datum, reply op, RT, Geo-
  info, etc.)
 Gebruikersinformatie (van screen_name
  tot URL van pro鍖elachtergrondafbeelding)
 Followers en following door de tijd heen *
RSS

 (Hyves-) blogs, partijnieuws, podcasts, etc.
 Titel, samenvatting, datum van publicatie,
  etc.
 Downloaden van achterliggende pagina (of
  andere documenten; HTML + CSS + IMG,
  podcasts, PDFs, afbeeldingen)
Wat hebben we?

 Tweede Kamer- en kabinetsleden van
  Balkenende IV
 (Handmatig) geveri鍖eerde personalia
 (Handmatig) gevonden feeds
 (Automatisch ge誰mporteerde) feeditems
Wat hebben we?
Onvolkomenheden
 Onzekerheid over volledigheid m.b.t.
  feeditems
 Alleen Balkenende IV en Rutte I (exclusief
  ministers)
 Rijkere informatie (nog) niet opgenomen
 Archief van verwijzingen; bron kan dood
  zijn
Wat doen we nu?

 Importeerproces herschrijven
 Formele procedures voor het toevoegen en
  beheren van personen, partijen en feeds
 Uitgebreidere personalia (automatisch)
  verzamelen
Wat willen we nog?
 Front-end uitbreiden (compatible met
  nieuwe data)
 Meer kabinetten, meer kamers
 Normalisatie van personalia
 API
 ...
Vragen?

More Related Content

Pentapolitica.nl - Introductie

  • 1. Een korte introductie Justin van Wees Bart de Goede justin@vwees.net bart@degoede.nu @justin_v_w @bartdegoede
  • 2. PentaPolitica.nl In 2009 op eigen initiatief gestart na project met kamervragen Trias Politica (Montesquieu)
  • 3. PentaPolitica.nl Data over personen en partijen (statisch) Namen, zittingen, nevenfuncties, opleidingen, etc. Uitingen in social media (dynamisch) Tweets, videos (YouTube), fotos, blogs, etc.
  • 11. Technische details Importeren Verschillende APIs Python Dataopslag MySQL Frontend CakePHP
  • 12. Partijen Naam Afkorting Datum van oprichting Logo Lidzittingen
  • 13. Personalia Voornaam Levens鍖loso鍖e Achternaam Loopbaan * Roepnaam Periode, instituut, functie Initialen Nevenfuncties * Titels Periode, instituut, functie Geslacht * Opleidingen * Biogra鍖e Periode, instituut, functie Foto * Lidzittingen PDC-code Periode, Kamer en partij Geboorteplaats en -datum * niet altijd volledig Plaats en datum van Bronnen: parlement.com, overlijden tweedekamer.nl, eerstekamer.nl
  • 14. Feeds
  • 15. Fotos in verschillende formaten (gedownload)* Metadata van fotos (datum, locatie, tags, etc.) Gebruikersinformatie (aanmaakdatum account, aantal views, etc.)
  • 16. Titel, beschrijving, tags, etc. De video zelf (in hoogst beschikbare kwaliteit) Statistieken van videos (aantal views, beoordelingen, etc.) Gebruikersinformatie (vrienden, aantal abonnementen, etc.)
  • 17. Tweets (inhoud, datum, reply op, RT, Geo- info, etc.) Gebruikersinformatie (van screen_name tot URL van pro鍖elachtergrondafbeelding) Followers en following door de tijd heen *
  • 18. RSS (Hyves-) blogs, partijnieuws, podcasts, etc. Titel, samenvatting, datum van publicatie, etc. Downloaden van achterliggende pagina (of andere documenten; HTML + CSS + IMG, podcasts, PDFs, afbeeldingen)
  • 19. Wat hebben we? Tweede Kamer- en kabinetsleden van Balkenende IV (Handmatig) geveri鍖eerde personalia (Handmatig) gevonden feeds (Automatisch ge誰mporteerde) feeditems
  • 21. Onvolkomenheden Onzekerheid over volledigheid m.b.t. feeditems Alleen Balkenende IV en Rutte I (exclusief ministers) Rijkere informatie (nog) niet opgenomen Archief van verwijzingen; bron kan dood zijn
  • 22. Wat doen we nu? Importeerproces herschrijven Formele procedures voor het toevoegen en beheren van personen, partijen en feeds Uitgebreidere personalia (automatisch) verzamelen
  • 23. Wat willen we nog? Front-end uitbreiden (compatible met nieuwe data) Meer kabinetten, meer kamers Normalisatie van personalia API ...