ݺߣ

ݺߣShare a Scribd company logo
www.magdalenaszpunar.com
Sieć ukryta a sieć widzialna
O zasobach WWW nieindeksowanych przez wyszukiwarki
prof. UJ dr hab. Magdalena Szpunar
www.magdalenaszpunar.com
● tylko 56 mln stron internetowych tj. ok. 25% wszystkich
stron internetowych jest silnie związanych z „centrum”
● w większości innych przypadków prawdopodobieństwo
znalezienia drogi z jednej strony na inną, bez
wykorzystania adresu URL jest bliskie zeru
● aż 10% witryn w internecie jest odizolowanych całkowicie
Topologia „muchy” -
połączenia w sieci WWW
www.magdalenaszpunar.com
● badania Alberta-László Barabási z 1999 roku →
połączenia między poszczególnymi węzłami sieci
internetowej (stronami WWW) rozkładają się
nierównomiernie
● gdyby połączenia były kwestią przypadku – rozkład
normalny
● opracowanie algorytmu opisującego rozrastanie sieci
internetowej
Rozrastanie się sieci
internetowej
www.magdalenaszpunar.com
● statystyczny rozkład węzłów podlega bezskalowemu rozkładowi
potęgowemu
● bardzo duża liczba witryn ma niewiele połączeń z innymi,
niewiele witryn wykazuje bardzo dużą liczbę połączeń
● kolejne węzły przyłączają się z większym prawdopodobieństwem
do tych, które posiadają większą liczbę połączeń
● przyłączanie ma charakter preferencyjny → efekt św. Mateusza
„bogaci się bogacą, biedni biednieją” lub prawo silniejszego (power
law)
● węzły strategiczne, superwęzły, punkty węzłowe
● struktura oligarchiczna, a nie demokratyczna
Ryc. Najpopularniejsze witryny
internetowe w Polsce
według Mapy Internetu /R.
Enikiejew/
Właściwości połączeń w obrębie
sieci WWW
www.magdalenaszpunar.com
● wyszukiwarki indeksują jedynie około 1% wszystkich informacji
zgromadzonych w Sieci
● szacuje się, że sieć głęboka gromadzi 500 razy więcej
informacji, niż sieć płytka
● 73% badanych deklaruje, że informacje wyłuskiwane przez
szperacze są wiarygodne i dokładne
● 66% uważa, że wyszukiwarki są obiektywnym i rzetelnym
źródłem informacji
● technologia definiująca /Jay Bolter/
● „kształtujemy nasze narzędzia, a potem one kształtują nas”
/Marshall McLuhan/
Ograniczenie horyzontu użytkownika
www.magdalenaszpunar.com
Sieć ukryta a sieć widzialna
www.magdalenaszpunar.com
● zasada najmniejszego wysiłku (the principle of least
effort) → szybko i efektywnie dotrzeć do interesujących
treści
● zasada minimaksu → osiągnięcie celu jak najmniejszym
kosztem
● wyniki proponowane przez wyszukiwarki → trafne,
adekwatne i satysfakcjonujące
Specyfika zachowań
informacyjnych online
www.magdalenaszpunar.com
● główna przyczyna: mechanizmy wyszukująco-indeksujące
● połączone ze sobą hierplinkami strony można zobrazować za pomocą
struktury grafu
● struktura grafu nie jest dokładnie znana, opracowanie algorytmu, który
wyszuka i zindeksuje wszystkie strony internetowe jest trudne
● boty (pająki, crawlery) przeczesują internet metodą grafu co sprawia,
że nie docierają do stron do których nie prowadzą żadne linki, po
wtóre każdy z nich wybiera różne drogi, co sprawia, że automaty
różnych wyszukiwarek rejestrują odmienne zbiory danych
● crawlery „nie widzą” stron prywatnych (zasoby chronione hasłem);
zasobów ograniczających działanie botów np. poprzez CAPTCHA
● znaczenie ma także to, czy strona jest zbudowana w statycznym
HTML-u, czy bazuje także na treściach dynamicznie pobieranych z
serwerów WWW w technologii Flash, czy Ajax
Przyczyny istnienia ukrytego
internetu
www.magdalenaszpunar.com
● Immanentna cecha internetu na tle innych mediów →
rozproszona topologia, brak wyraźnego centrum → coraz
wyraźniej widoczna topologia oparta o superwęzły/węzły
strategiczne
● Apogeum demokratyzacji informacji → model raczej
oligarchiczny, niż demokratyczny i egalitarny
● Brak właściciela → dominacja gigantów internetowych,
zawłaszczanie przestrzeni internetu, komercjalizacja
● Brak kontroli → filtrowanie, cenzurowanie treści online,
inwigilacja jednostek, zanik prywatności, PRISM
● Przełamanie informacyjnego monopolu mediów masowych →
monopol koncernów medialnych, egocasting
● Aktywna rola odbiorców – użytkowników → hipoteza opóźnienia
kulturowego, reguła 1%, reprodukowanie zachowań typowych
dla mediów masowych – bierność, pasywność
Utopie internetu a
rzeczywistość
www.magdalenaszpunar.com

More Related Content

Sieć ukryta a sieć widzialna. O zasobach WWW nieindeksowanych przez wyszukiwarki

  • 1. www.magdalenaszpunar.com Sieć ukryta a sieć widzialna O zasobach WWW nieindeksowanych przez wyszukiwarki prof. UJ dr hab. Magdalena Szpunar
  • 2. www.magdalenaszpunar.com ● tylko 56 mln stron internetowych tj. ok. 25% wszystkich stron internetowych jest silnie związanych z „centrum” ● w większości innych przypadków prawdopodobieństwo znalezienia drogi z jednej strony na inną, bez wykorzystania adresu URL jest bliskie zeru ● aż 10% witryn w internecie jest odizolowanych całkowicie Topologia „muchy” - połączenia w sieci WWW
  • 3. www.magdalenaszpunar.com ● badania Alberta-László Barabási z 1999 roku → połączenia między poszczególnymi węzłami sieci internetowej (stronami WWW) rozkładają się nierównomiernie ● gdyby połączenia były kwestią przypadku – rozkład normalny ● opracowanie algorytmu opisującego rozrastanie sieci internetowej Rozrastanie się sieci internetowej
  • 4. www.magdalenaszpunar.com ● statystyczny rozkład węzłów podlega bezskalowemu rozkładowi potęgowemu ● bardzo duża liczba witryn ma niewiele połączeń z innymi, niewiele witryn wykazuje bardzo dużą liczbę połączeń ● kolejne węzły przyłączają się z większym prawdopodobieństwem do tych, które posiadają większą liczbę połączeń ● przyłączanie ma charakter preferencyjny → efekt św. Mateusza „bogaci się bogacą, biedni biednieją” lub prawo silniejszego (power law) ● węzły strategiczne, superwęzły, punkty węzłowe ● struktura oligarchiczna, a nie demokratyczna Ryc. Najpopularniejsze witryny internetowe w Polsce według Mapy Internetu /R. Enikiejew/ Właściwości połączeń w obrębie sieci WWW
  • 5. www.magdalenaszpunar.com ● wyszukiwarki indeksują jedynie około 1% wszystkich informacji zgromadzonych w Sieci ● szacuje się, że sieć głęboka gromadzi 500 razy więcej informacji, niż sieć płytka ● 73% badanych deklaruje, że informacje wyłuskiwane przez szperacze są wiarygodne i dokładne ● 66% uważa, że wyszukiwarki są obiektywnym i rzetelnym źródłem informacji ● technologia definiująca /Jay Bolter/ ● „kształtujemy nasze narzędzia, a potem one kształtują nas” /Marshall McLuhan/ Ograniczenie horyzontu użytkownika
  • 7. www.magdalenaszpunar.com ● zasada najmniejszego wysiłku (the principle of least effort) → szybko i efektywnie dotrzeć do interesujących treści ● zasada minimaksu → osiągnięcie celu jak najmniejszym kosztem ● wyniki proponowane przez wyszukiwarki → trafne, adekwatne i satysfakcjonujące Specyfika zachowań informacyjnych online
  • 8. www.magdalenaszpunar.com ● główna przyczyna: mechanizmy wyszukująco-indeksujące ● połączone ze sobą hierplinkami strony można zobrazować za pomocą struktury grafu ● struktura grafu nie jest dokładnie znana, opracowanie algorytmu, który wyszuka i zindeksuje wszystkie strony internetowe jest trudne ● boty (pająki, crawlery) przeczesują internet metodą grafu co sprawia, że nie docierają do stron do których nie prowadzą żadne linki, po wtóre każdy z nich wybiera różne drogi, co sprawia, że automaty różnych wyszukiwarek rejestrują odmienne zbiory danych ● crawlery „nie widzą” stron prywatnych (zasoby chronione hasłem); zasobów ograniczających działanie botów np. poprzez CAPTCHA ● znaczenie ma także to, czy strona jest zbudowana w statycznym HTML-u, czy bazuje także na treściach dynamicznie pobieranych z serwerów WWW w technologii Flash, czy Ajax Przyczyny istnienia ukrytego internetu
  • 9. www.magdalenaszpunar.com ● Immanentna cecha internetu na tle innych mediów → rozproszona topologia, brak wyraźnego centrum → coraz wyraźniej widoczna topologia oparta o superwęzły/węzły strategiczne ● Apogeum demokratyzacji informacji → model raczej oligarchiczny, niż demokratyczny i egalitarny ● Brak właściciela → dominacja gigantów internetowych, zawłaszczanie przestrzeni internetu, komercjalizacja ● Brak kontroli → filtrowanie, cenzurowanie treści online, inwigilacja jednostek, zanik prywatności, PRISM ● Przełamanie informacyjnego monopolu mediów masowych → monopol koncernów medialnych, egocasting ● Aktywna rola odbiorców – użytkowników → hipoteza opóźnienia kulturowego, reguła 1%, reprodukowanie zachowań typowych dla mediów masowych – bierność, pasywność Utopie internetu a rzeczywistość