ºÝºÝߣ

ºÝºÝߣShare a Scribd company logo
informatieovervloed
 een korte geschiedenis

      Eric Sieverts
                          GOopleidingen april 2012
informatiegroei
      &
informatieinflatie
                        © Foam Amsterdam




 informatie of data ?
overhead sheet
100000000
                                                                                                                        ca. 260 jaar verdubbelt
                                                                                                                         al 1985
                           schatting jaarlijks aantal                                                                   bronnen: aantal
                                                                                                                          jaarlijks
                          schatting jaarlijks aantal
 10000000                  wetenschappelijke publicaties
                          wetenschappelijke publicaties
                                                                                                                        • wetenschappelijke
                                                                                                                           Derek de Solla Price
                           aantal tijdschriften
                          (Sieverts 1981-1994)                                                                          • artikelen elke 14 jaar
                                                                                                                           Gale Directory
                                                                                                                        • Ulrich's
                                                                                                                          en aantal tijdschriften
 1000000                                                                                                                • ...
                                                                                                                          ook zo ongeveer

   100000




   10000




     1000




     100




      10
            1720




                                 1780




                                               1820

                                                      1840




                                                                    1880




                                                                                  1920

                                                                                         1940




                                                                                                       1980

                                                                                                              2000

                                                                                                                     2020
                   1740

                          1760




                                        1800




                                                             1860




                                                                           1900




                                                                                                1960
100000000
                                                                                                                      na (exponentiële) groei
                                                                                                                      met factor 100.000
                          schatting jaarlijks aantal
 10000000
                          wetenschappelijke publicaties                                                               neiging tot verzadiging?
                          (Sieverts 1981-1994)


 1000000




   100000




   10000




     1000




     100




      10
            1720




                                 1780




                                               1820

                                                      1840




                                                                    1880




                                                                                  1920

                                                                                         1940




                                                                                                       1980

                                                                                                              2000

                                                                                                                     2020
                   1740

                          1760




                                        1800




                                                             1860




                                                                           1900




                                                                                                1960




                             NRC 12 maart 2011
100000000

                          schatting jaarlijks aantal
                          wetenschappelijke publicaties
 10000000                 (Eric Sieverts, 1981-1994)

                          jaarlijks aantal
                          wetenschappelijke publicaties
  1000000                 (NRC-Handelsblad, maart 2011)



   100000




    10000




     1000



                                                                                                exponentiële groei blijkt na 280
      100
                                                                                                jaar toch nog niet afgevlakt
                                                                                                wetenschappers raken niet op?
      10
                                                                                                • meer in china en india
                                 1780




                                                             1860




                                                                                         1940




                                                                                                                      2020
            1720

                   1740

                          1760




                                        1800

                                               1820

                                                      1840




                                                                    1880

                                                                           1900

                                                                                  1920




                                                                                                 1960

                                                                                                        1980

                                                                                                               2000
                                                                                                • nog meer "publish or perish"
                                                                                                • …. ?
publish or perish




                    ©
"what next" voor wetenschappelijk publiceren ?
• ook blogs
• ook tweets                        r "it ems"
                                 ee
                             mopgesplitst tot "nanopublicaties":
                       nog
• klassieke artikelen ontleed /
  afzonderlijke beweringen die beschreven worden als RDF-tripels
  (zelfde techniek als voor "linked open data")
                   DNA variant NG_000007.3:g.70628G>A (Subject)
                   has a frequency (Predicate) of 0.25% (Object).
  voorbeeld        The assertion holds for the Sardinian population
                   Provenance includes authors of the article (Giardine et. al.),
                   the date when the nanopublication was created, et cetera.
Barend Mons, Jan Velterop, et al., Nature Genetics 43, 281–283 (2011)
doi:10.1038/ng0411-281
hoeveel doorzoekt een
webzoekmachine?
een antwoord uit 1996!
Dutch Home Page
Dutch Home Page
   zomer 1994    najaar 1993
1000000                                                                                             hoeveel doorzoekt een
                                           aantal miljoenen                                       ? webzoekmachine?
                                           webpagina's in grootste
         100000
                                           zoekmachine                                              latere antwoorden
                                           (verschillende bronnen)
                                          gegevens vooral uit:

                  10000
                                                                            Nexis
                                                             ialog of Lexis
miljoenen webpagina's




                                                     ts als D
                                      content in hos
                        1000

                                                                                                           14 jaar lang
                         100                                                                               verdubbelde elke
                                                                    1998                                   12 maanden het
                                                                                                           aantal webpagina's
                          10
                                                                                                           in grootste
                                                                                                           zoekmachine(s)
                           1
                               1992


                                        1994


                                               1996


                                                      1998




                                                                             2004


                                                                                    2006


                                                                                           2008


                                                                                                    2010
                                                             2000


                                                                      2002
1000000


                                                                      aantal miljoenen
                                    100000                            webpagina's in grootste
webpagina's in zoekmachines




                                                                      zoekmachine
                                                                      (verschillende bronnen)

                                        10000



                                            1000

                                                                                                                                14 jaar lang
                                               100                                                                              verdubbelde elke
                                                                                                                                12 maanden het
                              wetenschappelijke
                              artikelen per jaar




                                                                                                                                aantal webpagina's
miljoenen




                                                   10
                                                                                                                                in grootste
                                                                                                                                zoekmachine(s)
                                                    1
                                                        1992


                                                               1994


                                                                        1996


                                                                               1998




                                                                                                    2004


                                                                                                           2006


                                                                                                                  2008


                                                                                                                         2010
                                                                                      2000


                                                                                             2002
informatieinflatie
2000 Hall & Varian:
      gezamenlijk produceren we in een jaar
      1,5 exabyte (miljard gigabyte) informatie
      (is dat informatie of zijn het data?)
Informatieovervloed, een korte geschiedenis
informatieinflatie
2000 Hall & Varian:
      gezamenlijk produceren we in een jaar
      1,5 exabyte (miljard gigabyte) informatie
      (is dat informatie of zijn het data?)

2011 uit een "infographic":
      gezamenlijk produceren we dat jaar
                           21
      2 zettabytes : 2 x 10 bytes
      (2000 miljard gigabyte)
      [d.w.z. ruim 300 GB per persoon]
informatieinflatie

ongeveer elk jaar verdubbelt de
hoeveelheid bytes die we produceren
is dat groei of inflatie?
• TXT documentje met mijn tekst: 50 kB
• videoregistratie van mijn lezing: 500 MB
dezelfde informatie(!?) maar 10.000 x zoveel data
informatieinflatie

ongeveer elk jaar verdubbelt de
hoeveelheid bytes die we produceren
is dat groei of inflatie?
• berichten op het web worden 100-voudig
  gerepliceerd, herblogd en geretweet
• van alles maken we ongecoördineerd back-ups
  [nog eens 300 GB per persoon]
• ...
Informatieovervloed, een korte geschiedenis
YouTube groeit met 30 uur per minuut
our yearly data                   51
                                 10 atomen
production
        ?? 2110: ~1051 bits

                  exponentiële
                  groei blijft
                  voortduren ?


           2010: ~1022 bits
           2000: ~1019 bits      (1 exabyte)
5 MB harde schijf
in 1956




       64 GB in 2011
hoe moeten we
al die informatie
terugvinden?



onze ideeën
daarover
volgen een
slingerbeweging
zoeken       ontsluiten
                                 1990
             yahoo! directory


     lycos
 altavista

             yahoo! directory
             open directory
             startpagina's

  google

             tagging / folksonomies
             semantisch web
             content curation      2012
Informatieovervloed, een korte geschiedenis
December 2002
het semantisch web
in semantisch web
wordt van "alles"
betekenis vastgelegd
Informatieovervloed, een korte geschiedenis
Informatieovervloed, een korte geschiedenis
?
semantisch web
content curation
taxonomies
?

               it's all
               "ontsluiting"
               by another name

More Related Content

Informatieovervloed, een korte geschiedenis

  • 1. informatieovervloed een korte geschiedenis Eric Sieverts GOopleidingen april 2012
  • 2. informatiegroei & informatieinflatie © Foam Amsterdam informatie of data ?
  • 3. overhead sheet 100000000 ca. 260 jaar verdubbelt al 1985 schatting jaarlijks aantal bronnen: aantal jaarlijks schatting jaarlijks aantal 10000000 wetenschappelijke publicaties wetenschappelijke publicaties • wetenschappelijke Derek de Solla Price aantal tijdschriften (Sieverts 1981-1994) • artikelen elke 14 jaar Gale Directory • Ulrich's en aantal tijdschriften 1000000 • ... ook zo ongeveer 100000 10000 1000 100 10 1720 1780 1820 1840 1880 1920 1940 1980 2000 2020 1740 1760 1800 1860 1900 1960
  • 4. 100000000 na (exponentiële) groei met factor 100.000 schatting jaarlijks aantal 10000000 wetenschappelijke publicaties neiging tot verzadiging? (Sieverts 1981-1994) 1000000 100000 10000 1000 100 10 1720 1780 1820 1840 1880 1920 1940 1980 2000 2020 1740 1760 1800 1860 1900 1960 NRC 12 maart 2011
  • 5. 100000000 schatting jaarlijks aantal wetenschappelijke publicaties 10000000 (Eric Sieverts, 1981-1994) jaarlijks aantal wetenschappelijke publicaties 1000000 (NRC-Handelsblad, maart 2011) 100000 10000 1000 exponentiële groei blijkt na 280 100 jaar toch nog niet afgevlakt wetenschappers raken niet op? 10 • meer in china en india 1780 1860 1940 2020 1720 1740 1760 1800 1820 1840 1880 1900 1920 1960 1980 2000 • nog meer "publish or perish" • …. ?
  • 7. "what next" voor wetenschappelijk publiceren ? • ook blogs • ook tweets r "it ems" ee mopgesplitst tot "nanopublicaties": nog • klassieke artikelen ontleed / afzonderlijke beweringen die beschreven worden als RDF-tripels (zelfde techniek als voor "linked open data") DNA variant NG_000007.3:g.70628G>A (Subject) has a frequency (Predicate) of 0.25% (Object). voorbeeld The assertion holds for the Sardinian population Provenance includes authors of the article (Giardine et. al.), the date when the nanopublication was created, et cetera.
  • 8. Barend Mons, Jan Velterop, et al., Nature Genetics 43, 281–283 (2011) doi:10.1038/ng0411-281
  • 10. Dutch Home Page Dutch Home Page zomer 1994 najaar 1993
  • 11. 1000000 hoeveel doorzoekt een aantal miljoenen ? webzoekmachine? webpagina's in grootste 100000 zoekmachine latere antwoorden (verschillende bronnen) gegevens vooral uit: 10000 Nexis ialog of Lexis miljoenen webpagina's ts als D content in hos 1000 14 jaar lang 100 verdubbelde elke 1998 12 maanden het aantal webpagina's 10 in grootste zoekmachine(s) 1 1992 1994 1996 1998 2004 2006 2008 2010 2000 2002
  • 12. 1000000 aantal miljoenen 100000 webpagina's in grootste webpagina's in zoekmachines zoekmachine (verschillende bronnen) 10000 1000 14 jaar lang 100 verdubbelde elke 12 maanden het wetenschappelijke artikelen per jaar aantal webpagina's miljoenen 10 in grootste zoekmachine(s) 1 1992 1994 1996 1998 2004 2006 2008 2010 2000 2002
  • 13. informatieinflatie 2000 Hall & Varian: gezamenlijk produceren we in een jaar 1,5 exabyte (miljard gigabyte) informatie (is dat informatie of zijn het data?)
  • 15. informatieinflatie 2000 Hall & Varian: gezamenlijk produceren we in een jaar 1,5 exabyte (miljard gigabyte) informatie (is dat informatie of zijn het data?) 2011 uit een "infographic": gezamenlijk produceren we dat jaar 21 2 zettabytes : 2 x 10 bytes (2000 miljard gigabyte) [d.w.z. ruim 300 GB per persoon]
  • 16. informatieinflatie ongeveer elk jaar verdubbelt de hoeveelheid bytes die we produceren is dat groei of inflatie? • TXT documentje met mijn tekst: 50 kB • videoregistratie van mijn lezing: 500 MB dezelfde informatie(!?) maar 10.000 x zoveel data
  • 17. informatieinflatie ongeveer elk jaar verdubbelt de hoeveelheid bytes die we produceren is dat groei of inflatie? • berichten op het web worden 100-voudig gerepliceerd, herblogd en geretweet • van alles maken we ongecoördineerd back-ups [nog eens 300 GB per persoon] • ...
  • 19. YouTube groeit met 30 uur per minuut
  • 20. our yearly data 51 10 atomen production ?? 2110: ~1051 bits exponentiële groei blijft voortduren ? 2010: ~1022 bits 2000: ~1019 bits (1 exabyte)
  • 21. 5 MB harde schijf in 1956 64 GB in 2011
  • 22. hoe moeten we al die informatie terugvinden? onze ideeën daarover volgen een slingerbeweging
  • 23. zoeken ontsluiten 1990 yahoo! directory lycos altavista yahoo! directory open directory startpagina's google tagging / folksonomies semantisch web content curation 2012
  • 27. in semantisch web wordt van "alles" betekenis vastgelegd
  • 30. ? semantisch web content curation taxonomies ? it's all "ontsluiting" by another name