Vzhledem k faktu, že je velmi těžké najít reálnou a jednoznačnou definici Web 2.0, nabízíme v následujících kapitolách jeho vymezení založené na charakteristice služeb a jejich aplikací. Výčet si neklade za cíl být vyčerpávající a opírá se o základní teze, které publikoval O’Reilly a které byly později dalšími autory doplněny a revidovány. Zároveň platí, že jednotlivá Web 2.0 aplikace (služba) nemusí mít všechny tyto charakteristiky.
Archiv rubriky Základní vlastnosti Web 2.0
Web jako platforma
Web jako platforma (Web as Platform) byl původně obchodní model navržený společností Netscape, jednou z typických společností, které ovlivňovaly vývoj internetu v době Webu 1.0. Netscape se snažila se svým (tenkrát velmi používaným) prohlížečem převzít kontrolu nad tím, jaký obsah a aplikace budou uživatelé používat při navigaci internetem – stejně tak, jako měl Microsoft pod kontrolou PC trh desktopových aplikací. Jejich „webtop“ měl nahradit klasickou uživatelskou „plochu“ (desktop), kterou nabízel operační systém. Tento „webtop“ by nabízel informace a aplikace od poskytovatelů obsahu, kteří by si nakoupili vysokorychlostní servery od společnosti Netscape.
O’Reilly dává do kontrastu k tomuto modelu přístup společnosti Google. Ta začala nabízet nativní webové aplikace poskytované jako službu zákazníkům, platícím jak přímo, tak nepřímo. Google je také jasná ukázka přístupu „věčné betaverze – perpetual beta“ – jeho aplikace nemají žádné pevné verzování nebo pravidelné vydávání a jejich funkcionality jsou aktualizované průběžně. Takový druh aplikací nevyžaduje portování na jiné systémové platformy a díky webovému prostředí nevyžaduje ani klasickou distribuci ve formě instalačních souborů, jak je známe u tradičních desktopových softwarů.
Někteří vizionáři si dokonce myslí, že by časem bylo možné programové vybavení instalované na dnešních PC zcela nahradit právě webovými aplikacemi (Antoš, 2007b).
Zčásti je tento proces přesunu práce z desktopu na web viditelný již dnes, například balík kancelářských aplikací Google Docs and Spreadsheets (s mnohými alternativami), sada nástrojů Microsoft Live nebo nedávno uvedený „webový Photoshop“ společnosti Adobe na úpravu fotografií. Byl by to v jistém slova smyslu návrat k tenkým klientům a terminálům. Kritici často namítají, že provozovat na webu plnohodnotné aplikace s množstvím funkcionalit, jak je známe z desktopů, není možné. Novátorská firma 37signals však dokazuje, že ne vždy je podstatné nabídnout plnou sadu funkcionalit. Na základě výzkumů postupů, které lidé při práci nejvíce používají, nabízí aplikace, které „dělají přesně to, co potřebujete, a nic navíc“.1
O’Reilly dále říká, že v minulosti Microsoft dokázal vítězit nad svými rivaly právě svou platformou – při masovém nasazení Windows nebylo nic jednoduššího než naprogramovat balík kancelářských aplikací tak, aby fungoval v dokonalé symbióze s operačním systémem. Stejný příklad bychom mohli najít i na poli internetových prohlížečů, kde celkové zakomponování do operačního systému bylo ještě markantnější (viz princip „uzamčení“ v kapitole o síťových efektech). V dnešní době se ale střet neodehrává mezi aplikacemi na platformě operačního systému (aplikace vs. konkurenční aplikace), ale o jednu úroveň výš – tedy přímo mezi platformami (operační systém vs. web jako dvě platformy). S tím také souvisí, že internet a www už nejsou pouze doménou osobních počítačů, silnými hráči se stávají také mobilní telefony, PDA nebo konzole2 s vlastními operačními systémy. A cílem je, aby uživatelé, díky webovým aplikacím běžícím pouze v prohlížeči, nepoznali rozdíl, ať už pracují na svém osobním počítači nebo mobilním telefonu. To bude vyžadovat větší důraz na dodržování standardů jak na straně webu, tak na straně klientů, což dnes rozhodně není pravidlem. Jako důsledek této nedisciplinovanosti uveďme příklad velmi časté rozdílné interpretace kaskádových stylů u dnešních prohlížečů. Více se problému budeme věnovat v kapitolách o technologiích.
- Zde by autor doporučil zhlédnout záznam přednášky „The Story of Ribbon“ z vývojářské konference Microsoftu, ve které je vysvětleno, co vedlo ke změně uživatelského rozhraní v balíku MS Office 2007. Bylo to zjištění, že největší masa uživatelů používá pouze základní funkcionality. ↩
- Či domácí spotřebiče ↩
Využití kolektivní inteligence
Velmi často uváděným a názorným příkladem využití kolektivní inteligence (Harnessing Collective Intelligence) je algoritmus Page Rank, kterým Google hodnotí „důležitost“ indexovaných stránek. Namísto pouhého zjišťování relevance použitím názvu, metainformací (tag meta), četností slov či struktury stránky je zkoumáno, v jaké míře a odkud se na danou stránku odkazuje. Základní premisa je jednoduchá: čím více zdrojů na danou stránku odkazuje, tím by měla být důležitější1.
Podobně funguje, jak zmiňuje O’Reilly, kolaborativní systém Cloudmark pro filtrování spamu. Na základě vstupů od uživatelů v podobě e-mailových zpráv označených jako spam vyhodnocuje ostatní zprávy, které mají podobný charakter. Vyhodnocená data jsou pak poskytována systémům, které je využívají pro filtraci e-mailových zpráv.
Kolektivní inteligence je v tomto kontextu kolaborativní přístup, který díky integraci, spolupráci a vzájemné důvěře vede k větší míře komplexnosti a porozumění. Zásadní v tomto ohledu je právě integrace a spolupráce umožněná počítačovými systémy, které dokáží vhodně spojit a vyhodnotit jednotlivé prvky tak, aby ve výsledku přinesly větší užitek velkému počtu uživatelů, kteří jsou zároveň uživateli i tvůrci.
Kolektivní inteligence může být využívána v prostředí „otevřených systémů“, ale zdá se, že docela dobře podporuje obchodní modely některých komerční společností. Příkladem komerčního využití je například firma Amazon, která začala používat kolektivní inteligenci svých uživatelů tak, že jim umožnila vkládat k prodávaným produktům uživatelské recenze a hodnocení. To doplňuje celý systém prodeje o významnou přidanou hodnotu. Částečně je tak vyvážena velká nevýhoda internetového obchodu, tj. nemožnost reálného „osahání“ zboží jako v tradičním obchodě. Z podobného principu těží i internetové tržiště eBay, kde je hledisko reputace uživatelů (ať už prodávajících či kupujících) určující pro uskutečnění nákupu. Pokaždé, když je prostřednictvím eBay uzavřen nákup, je nakupující požádán o názor, zda byla jeho zkušenost s prodávajícím pozitivní, neutrální či negativní – přičemž je možno použít i slovní hodnocení pro více detailů. Stejně je hodnocen i nakupující prodejcem. Tím se snaží eBay navodit mezi uživateli jistotu a důvěru.
- To byla základní myšlenka algoritmu Page Rank. Dnes je ovšem hodnoceno daleko širší spektrum informací. Problémem, jak ovlivňovat pozici ve výsledcích vyhledávačů se zabývá disciplína SEO – Search Engines Optimization. ↩
Obsah vytvářený uživatelem
Uživatelem vytvářený obsah (User Generated Content) znamená v souvislostech Web 2.0 obsah, který (1) je veřejně dostupný v prostředí internetu, (2) vzniká neprofesionální cestou a (3) s určitou dávkou kreativity (Participate, 2007). V některých případech se pro jeho pojmenování používají i označení jako vlastní či osobní publikování (self-creating) nebo sebevyjádření (self-expresion). Tento druh obsahu vznikal na internetu od jeho počátků, nicméně masově se takový fenomén rozšířil až na sklonku devadesátých let po rozšíření dostupných aplikací (např. blogy, YouTube) a nástrojů (např. levné kamery, digitální fotoaparáty). Důležitým aspektem takto vzniklých obsahů je, že jsou k dispozici zdarma a bez přímých plateb jeho poskytovatelům. To je umožněno změnami v procesu jejich vzniku. Oproti tradičním médiím, ve kterých je k publikaci nutný celý aparát „profesionálů“, zde zůstává vše v režii uživatele – amatéra. Toto si samozřejmě uvědomila i tradiční média a snaží se upravit své ekonomické modely tak, aby byly konkurenceschopné. Jasně viditelné je to například u týdeníku Respekt, který kromě tradičního obsahu nabízí svým čtenářům i prostor pro vyjádření ve formě blogů, nebo u zpřístupnění televizního archivu BBC, se kterým se dá dále pracovat.
Další příklad je možnost komentovat zpravodajské články například na serveru idnes.cz. Zde ovšem dochází k nepříjemnému jevu, který bychom mohli nazvat informační zahlcení: velké množství „nekvalitních“ a nerelevantních příspěvků znehodnocuje přínos těch několika málo kvalitních (viz kapitola o Long tail). V samém důsledku to vede k úplné eliminaci příspěvků kvalitních, protože jejich potenciální autoři nemají zájem, aby jejich příspěvky byly ztraceny či znehodnoceny balastem1.
Rozsah uživatelem generovaného obsahu může být od komentářů na zpravodajském serveru, přes vložení videa až k „velké“ publikační činnosti, kdy jednotlivci vydávají samostatné zprávy (tzv. občanský žurnalizmus) či přímo knihy. Zásadní v tomto případě je sociální propojenost internetu. Uživatelé mají možnost navzájem své příspěvky komentovat, případně „remixovat“ do jiných podob. Značnou roli v šíření hrají vybudované sociální sítě, ve kterých dochází při šíření k síťovému efektu (viz dále).
Při publikování v prostředí Web 2.0 aplikací je třeba zmínit ještě jeden aspekt, a tím je určité potlačení autorské pozice. V případě blogů nemusí být totiž z hlediska čtenáře nejhodnotnější vždy primární zdroj, ale kupříkladu komentář pod článkem nebo navazující příspěvek na jiném blogu, obohacený o další informace (např. video z YouTube). Ovšem autor sám může být zároveň tím, kdo je schopen jako čtenář objevit další informace, případně jiný pohled na věc. Z autora se zároveň stává i konzument.
Pokud bychom pro názornost použili teorii komunikace, pak existuje interpersonální komunikace, kde je možná interakce ve dvou směrech: od vysílatele k příjemci a nazpátek (model one-to-one); v prostředí klasických (mas)médií probíhá komunikace jedním směrem (např. televize), ale k většímu množství příjemců (model one-to-many). V tomto případě nemá recipient možnost přímé interakce – reakce pak může probíhat na úrovni interpersonální komunikace (divák volá rozhořčeně do redakce televizního vysílání, která většinou jeho přímou reakci nevysílá). „Nová“ média, internet a zvláště Web 2.0 kombinují obě možnosti. Vysílatel informace je v přímém kontaktu s recipienty, kteří se zároveň mohou stát vysílateli (model many-to-many) (Gillmor, 2004).
Počítačový expert a bloger Jeremy Chone komunikační model many-to-many dále rozkládá na jednotlivé části v souvislosti s vývojem webu. Umísťuje na osy grafu proměnné počtu konzumentů a producentů informací.
V začátcích webu bylo vzhledem k nedostupnosti internetu a jednoduchých nástrojů pro publikaci málo producentů, kteří produkovali obsah pro narůstající počet příjemců (few-to-many). V průběhu času se kvůli masovějšímu rozšíření internetových přípojek zvyšuje počet jak producentů, tak i příjemců, křivka ovšem více stoupá u příjemců. Producenty jsou většinou společnosti, které prostřednictvím webu nabízejí své služby (many-to-everybody) – ať už jsou to statické informace či dynamické služby generující se dle přání příjemce (např. telefonní seznam). V dalším období (Web 2.0) se obě křivky začínají opět přibližovat, když roste počet producentů. Z příjemců se stávají i producenti informací (everbody-to-everybody) (Chone, 2005).
Uživatelem generovaný obsah bývá terčem kritiků Web 2.0, kteří tvrdí, že uživatelé toho vlastně moc nevytvářejí (tzn. že se křivky ve výše zobrazeném grafu ve skutečnosti nepřibližují a počet příjemců výrazně převyšuje počet producentů) (Rylich, 2007). Řada výzkumů to potvrzuje, některé ale už méně výrazně.
Například společnost Hitwise objevuje pravidlo 99/12, když zjistila3, že obsah serveru je vytvářen pouhými 0,18 % jeho uživatelů, u Wikipedie jsou to 4,38 % uživatelů (Tancer, 2007).
Jakob Nielsen na základě výpočtů z volně dostupných čísel (např. počet blogů vs. počet uživatelů internetu atd.) dochází k podobným výsledkům při stanovení pravidla 90/9/1, kdy:
- 90 % uživatelů konzumuje, ale nijak nepřispívá,
- 9 % uživatelů přispívá, ale pouze čas od času,
- 1 % uživatelů přispívá hodně a tvoří značnou část obsahu4 (Nielsen, 2006).
Společnost Forrester se při výzkumu v roce 2006 (Li, 2007) dotázala přibližně 10 000 amerických dospělých a mladistvých na jejich participaci v aplikacích umožňujících sociální interakci. Výsledky zobrazuje na „sociálním žebříku“, kde jednotlivé příčky představují vyšší míru účasti (účast za měsíc, s možností výskytu jedince na více pozicích na žebříku v ten samý okamžik).
Z celkové online populace ve Spojených státech:
- 13 % jsou Tvůrci (Creators), kteří publikují na blogu, mají vlastní webové stránky nebo přispěli na YouTube alespoň jednou za měsíc. Jsou poměrně mladí – v průměru 39 let.
- 19 % jsou Kritici (Critics) komentují na blozích a vkládají uživatelské recenze a hodnocení (např. na Amazonu). Jsou v průměru starší než Tvůrci.
- 15 % jsou Sběrači (Collectors), kteří tagují zdroje a ukládají je takto označené do aplikací s možností sociální interakce (např. oblíbené položky přes Del.icio.us).
- 19 % jsou Připojovatelé (Joiners), využívají aplikace pro vytváření sociálních sítí (MySpace, Facebook) a jsou ze všech skupin nejmladší. 56 % z nich čte blogy a 30 % z nich na blogy také přispívá.
- 33 % jsou Diváci (Spectators), např. pasivní čtenáři blogů.
- 52 % jsou neaktivní (Inactive) žádnou formou sociální interakce; v průměru starší než 50 let.
![]()
Obrázek 3 – Žebřík účasti uživatelů dle společnosti Forrester
Zajímavé je též demografické rozložení uživatelů, které jasně ukazuje dominanci mladé generace:
![]()
Obrázek 4 – Demografické rozložení používání sociálních aplikací
- Cest k nápravě je mnoho, ať už je to povinná registrace nebo moderování diskuze. V tomto případě by však mohl být server naopak nařčen z porušování svobody slova. ↩
- V souvislosti s ekonomickým pravidlem 80/20 (např. 80 % bohatství světa, je v rukou 20 % populace) a pravidlem 90/10 (platí pro výpočetní techniku, kdy např. 90 % času běhu programu obstarává 10 % jeho kódu). ↩
- Bohužel metodiku výpočtu neuvádí. ↩
- Pokud bychom umístili počet příspěvků a počet přispívajících na graf, zjistíme, že se jedná o mocninné rozložení, o kterém bude řeč později, viz kapitola Long Tail. ↩
Wiki systémy
Na důvěře jsou založeny i publikační systémy typu wiki, soubory stránek, jejichž obsah může být editován samotnými uživateli (správu systému lze řídit i přidělenými právy). Při každé úpravě je uloženo, kdo a kdy úpravu provedl, a zároveň je zachována i původní verze, takže uživatel má možnosti procházet celou retrospektivu vývoje a případně se vrátit k původnímu znění. Zde je patrná paralela s vývojem komunitních projektů založených na otevřeném zdrojovém kódu – open source, kdy máme možnost sledovat postup programovacích prací v CVS1 aplikacích a systémem práv je určeno, kdo jaké programové kódy může editovat. K dispozici je celá řada wiki softwarů pro mnohé platformy, většina z nich je k dispozici zdarma. Zřejmě nejpoužívanější je MediaWiki vyžadující k chodu podporu PHP a MySQL nebo PostgreSQL.
MediaWiki také pohání asi nejznámější wiki aplikaci – encyklopedii Wikipedia. Ta podle údajů z dubna 2008 obsahuje přes 10 miliónů článků ve více než 253 jazycích, které byly zadány a editovány pouze dobrovolnými přispěvateli2.
Velká svoboda a otevřenost je předmětem největší kritiky systému. Panuje velká obava, že možnost volné editace vede ke snížení odborné úrovně publikovaných hesel a k diktátu masového vkusu (Zbiejczuk, 2007). S tím souvisí i záměrný vandalizmus nebo zamlžení, které ohrožují nejen pro Wikipedii, ale všechny Web 2.0 aplikace, na nichž se mohou podílet sami uživatelé.
Vandalizmus dokazuje příklad z poměrně nedávné doby, kdy student Virgil Graffith napsal program Wikiscanner, který dokáže dle rozsahů IP adres určovat, z jakých míst jsou jednotlivé články na Wikipedii upravovány. Vyšlo kupříkladu najevo, že záhadně mnoho výmazů kritiky u hesel týkajících se scientologie pochází z počítačů této církve atd. Seznam nejpovedenějších odhalení se zveřejňuje na blogu časopisu Wired . Ukazují se tak největší slabiny otevřeného přístupu. Ale u velmi často navštěvovaných hesel nebývá záměrný vandalizmus, díky nastaveným právům, tak častý a u méně populárních bývá velmi rychle odhalen a napraven.
Jak již bylo zmíněno v úvodu této kapitoly, wiki systémy nejsou pouze encyklopedie typu Wikipedia. Značné uplatnění nalézají v korporátní sféře, kde bývají nasazeny pro intranetové aplikace nebo správu dokumentace. Velmi silné jsou pro tzv. knowledge management. V kapitole o blozích ve společnostech nabízím případovou studii, která tuto skutečnost dokresluje.
- Concurrent Versions System nebo Concurrent Versioning System ↩
- Když jsem rozepsal v srpnu 2007 tuto práci, měl jsem uvedené číslo 8 miliónů článků ve 250 jazycích. To svědčí o obrovské rychlosti, kterou je encyklopedie plněna. Zdroj dat: heslo Wikipedia ↩
Tagování
Uživatelské anotování zdrojů klíčovými slovy se asi poprvé objevilo u desktopových aplikací pro ukládání internetových záložek (bookmarks) a fotografií. Tento způsob manuálního předmětového třídění se nazývá tagování.
V prostředí webu byly prvními zástupci služby Del.icio.us, Flickr a Annotea. Annotea je derivát jazyka RDF pro anotaci webových zdrojů – pro uložení metadat (např. klíčová slova, komentáře, chyby, opravy atd.) o zdroji je používán speciální jazyk. Pro práci s tímto jazykem je pak třeba speciálních interpretů: Amaya jako samostatný specializovaný prohlížeč nebo řada zásuvných modulů pro obyčejné prohlížeče.
Flickr je už typická Web 2.0 sociální aplikace pro práci s fotografiemi a Del.icio.us je online sociální systém pro ukládání záložek (bookmarks). Díky častému použití tagů ve spojitosti se sociálními aplikacemi se také někdy používá označní kolaborativní tagování (collaborative tagging) nebo sociální indexace (social indexing) či folksonomie (folksonomy)1.
Pojem folksonomie poprvé použil Thomas Vander Wal v jedné e-mailové konferenci, když spolu s kolegy hledal výstižné označení pro klasifikaci, která vzniká při použití tagů:
„Folksonomie je výsledek osobního volného přiřazování předmětových hesel k informacím a objektům (čímkoliv s URL) pro následné osobní vyhledání. Toto přiřazování (tagování) se provádí v sociálním prostředí (sdíleném a otevřeném pro ostatní). Tagování je prováděno osobou, která dané informace zpracovává.“ (Vander Wal, 2005)
Vander Wal vnímá toto tagování spíše než jako kategorizaci jako reprezentaci osobního významu daného zdroje pomocí vlastního slovníku. Tag v tomto prostředí znamená propojení mezi zdrojem a jeho konzumentem.
- Slovní hříčka se slovy folk a taxonomy. ↩
Typologie tagování
Při detailnějším prozkoumání systémů nalezneme různé druhy klasifikací podle způsobu, jak tagy vznikají a jak s nimi daná aplikace pracuje. Lze vypozorovat podobnosti s tradičními metodami věcného pořádání informací. Někdy uživatel může použít volně tvořená klíčová slova, někdy se z tagů vytváří soubor autorit či slovník, v němž může vyhledávat. Jakob Voß nabízí detailní typologii (Marlow, 2006; Voß, 2007):
Prvním hlediskem jsou tagovací oprávnění (tagging rights), kdy se rozlišuje, jaké typy zdrojů může uživatel tagovat:
- Vlastní tagování (self-tagging) – uživatelé mohou tagovat pouze zdroje, které sami vytvořili, např. Technorati.
- Řízené tagování (permission-based) – uživatelé mohou tagovat pouze některé zdroje (např. uživatelé v relaci – Přátelé atd.), např. Flickr.
- Volné tagování (free-for-all) – uživatelé mohou tagovat všechny zdroje od kohokoliv, např. Del.icio.us.
Podle umístění a vzniku obsahu zdroje (source of resources):
- Uživatelem vytvořený obsah (user-generated content) – uživatelé mohou tagovat obsah, který sami vytvořili, např. YouTube.
- Nabízený obsah (provided content) – uživatelé mohou tagovat obsah, který nabízí (generuje) aplikace, např. Last.fm.
- Externí obsah (external resources) – uživatelé mohou tagovat zdroje, které nejsou součástí aplikace, např. Del.icio.us.
Podle způsobu, jakým aplikace doporučuje tagy (tagging feedback):
- Naslepo (blind) – aplikace nezohledňuje dříve zadané tagy (např. jinými uživateli), např. Technorati.
- Viditelně (viewable) – dříve zvolené tagy (jinými uživateli) ve vztahu ke zdroji jsou k dispozici.
- Doporučeně (suggested) – tagy doporučuje aplikace automaticky na základě algoritmu.
Podle způsobu agregace (tag aggregation):
- Set-model – každý tag je u jednoho zdroje při použití více uživateli uložen pouze jednou, např. YouTube.
- Bag-mode – pokud je tag u jednoho zdroje použit vícekrát více uživateli, je počet zadání sčítán, např. Del.icio.us.
Zda je při volbě tagu uživatel omezen, jaké tagy může používat (vocabluary control):
- Bez omezení (unrestricted vocabluary) – tagy jsou zadávány volně.
- Řízeným slovníkem (managed vocabluary – tagy jsou voleny kupříkladu z řízeného slovníku či tezauru, do kterého lze případně vložit nové předmětové heslo, např. Wikipedia.
- Řízeně bez možnosti editace (fixed vocabluary) – aplikace využívá slovníky třetích stran, které není možné editovat přímo v jejím prostředí.
Jakým způsobem jsou tagy navzájem propojeny (vocabulary connectivity):
- Bez provázání (unrelated tag) – tagy nejsou nijak provázány.
- Asociačně (associative) – tagy jsou propojeny přes soubor autorit.
- Hierarchicky (hierarchical) – tagy jsou voleny z klasifikace, která je uspořádána hierarchicky.
- Vícečetné hierarchie (multi-hierarchical) – tagy jsou voleny z tezaurů nebo fazetových klasifikací, které mohou i nemusí být v hierarchii.
- Ontologicky (typed) – volně volené tagy jsou svázány ontologicky.
Jakým způsobem jsou propojeny jednotlivé zdroje (resource connectivity):
- Odkazově (links) – mezi jednotlivými zdroji existují propojení, např. URL odkazy stránek na Del.icio.us.
- Skupinově (groups) – jednotlivé zdroje jsou hierarchicky sdruženy do skupin, např. fotografie na Flickru.
- Žádné propojení (none) – zdroje nejsou navzájem propojeny.
Zda je uživateli nabízena možnost automatického otagování zdroje, například pomocí obsahové analýzy (Automatic tag):
- Automatické tagy (Auto-tags) – tagy jsou generovány aplikací pomocí automatické obsahové analýzy zdroje nebo z povahy zdroje (např. video soubor – tag video, zvukový soubor – tag zvuk).
- None – bez automatiky.
Ve většině aplikací jsou tagy tvořeny „od oka“ a vlastně i bez většího zájmu o systémovost. Proto se vyskytují problémy jako špatný zápis (např. množné číslo, jiný pravopis či chyby), synonymita, homonymita či rozdílná úroveň významu (někdo pro otagování použije pouze obecné slovo hudba, jiný uživatel použije slovo dechovka), či prostě rozdílná úroveň vzdělání a zkušeností uživatele (Braun et al, 2007). Pro velké systémy, jako je například YouTube, je značným problémem též mnohojazyčnost, protože uživatelé tagují zdroj ve svých rodných jazycích.
Raketový nástup uživatelského a sociálního tagování vedl k drtivé kritice tradičních systémů pro věcné pořádání informací, kterou odstartoval v roce 2005 Clay Shirky svým článkem, v němž poukázal na některé nedostatky klasifikačních systémů (jak knihovnických, tak například třídění v katalogových vyhledávačích) (Shirky, 2005; Merholz, 2005). Dle dosavadního vývoje lze usuzovat, že tradiční systémy nebudou nahrazeny, ale že uživatelské tagy mohou být jejich zajímavým doplňkem (např. tagování vyhledaných zdrojů přes OPAC).
Mnoho systémů skupinu tagů agreguje do tzv. tag clouds – kdy je významnost určitého pojmu vypočítávána četností jeho výskytu – ta může být reprezentována velikostí nebo barevností písma. Takové shluky tagů pak reprezentují charakteristiku popisované entity a zároveň mohou sloužit k další navigaci nebo filtraci, kdy klikem na vybraný tag zobrazíme všechny entity, které jsou s tagem v relaci (resp. kontextu).
Datová základna
Zásadní význam pro Web 2.0 služby má práce s daty, která při jejich používání poskytují uživatelé. O’Reilly dává ve své práci za příklad společnost Google, o které říká, že její hlavní kompetencí je právě správa obrovské databáze – říká, že systém má o to větší hodnotu, čím je větší šíře dat a schopnost je spravovat (O’Reilly, 2005b). Dalším příkladem výtěžnosti datové základny je Amazon (a mnohé další obchody) a jeho schopnost doporučovat další produkty k nákupu. Systém ukládá všechny nákupy a je schopen pomocí agregace a jakéhosi „data miningu“ doporučovat uživateli jiný vhodný nákup (pokud se vám líbí toto, tak by se vám mohlo také hodit toto). Zde se automaticky otevírá otázka, jak mohou společnosti s těmito daty nakládat. Kupříkladu webová aplikace pro správu elektronické pošty Gmail využívá automaticky analyzovaná data z uživatelových e-mailů k zobrazování kontextové a „personalizované“ reklamy. Právní otázkou je také, komu vlastně uživatelem vytvořená data patří. Uživatelé proto před použitím většiny služeb musí potvrdit základní právní ujednání. Problémem jsou pak rozdílné pohledy na legislativu v jednotlivých zemích, které vznikají díky globální povaze internetu, pro který hranice neexistují (např. server je umístěn v USA, ale uživatel je z EU) (Anderson, 2007).
Síťové efekty
V kapitole věnované síle kolektivní inteligence byl zmiňován algoritmus Page Rank, který vyhodnocením vzájemných odkazů jednotlivých stránek stanovuje jejich hodnotu (užitek) pro zpřesnění výsledků fulltextového vyhledávání. Čím více uživatelů nalinkuje pomocí odkazů jednotlivou stránku, tím má tato stránka pravděpodobně i pro ostatní uživatele větší užitek. Tento princip, kdy pro stávající uživatele narůstá hodnota služby tím víc, čím víc nových uživatelů začne službu používat (za podmínky, že mezi uživateli existuje možnost interakce – vazba), se nazývá síťový efekt. Dalším a velmi výstižným příkladem může být fax nebo mobilní telefon. Pokud se do sítě připojí nový uživatel, nejen že z toho profituje on sám, ale nepřímo i ostatní uživatelé, protože mohou volat na číslo, na které předtím nemohli. Jinými slovy: pokud zařízení vlastní málo uživatelů, užitná hodnota pro tyto uživatele není příliš vysoká, protože je jen málo uživatelů, se kterými se můžeme spojit, a výrazně roste, pokud uživatelů přibývá.
Matematicky se snažil tento princip vyjádřit v osmdesátých letech Bob Metcalfe, když chtěl vysvětit svým zákazníkům, proč potřebují nakupovat více ethernetových karet. Jeho základní hypotéza (později nazvaná jako Metcalfův zákon) byla, že zatímco náklady na síť rostou lineárně s počtem přípojek, její hodnota roste čtvercem počtu uživatelů (kvadraticky). V síti s n uzly může každý navázat (n-1) spojení, celkový užitek sítě je tedy n(n-1), což je přibližně n². Pokud bychom náklady na síť a takto vypočítaný užitek umístili na graf, v určitém bodě se křivky protnou a hodnota sítě pro uživatele převýší náklad. (Donát, 2001)
V posledních letech byl tento zákon podroben kritice, protože je zaměřen příliš technologicky (kalkuluje s počtem potencionálních spojení jednotlivých zařízení, které neodpovídá reálnému počtu spojení mezi uživateli). Bob Brisco se ho snažil reformulovat s ohledem na užitek jednotlivých spojení (tvrdí, že ne všechna mají stejnou hodnotu). V jeho podání lze užitek sítě s n uzly vyjádřit logaritmicky log(n). Laicky řečeno ve vztahu k telefonům: některé kontakty, jež máme uloženy ve svých adresářích, jsou pro nás důležitější než jiné.
David P. Reed zase tvrdí, že užitek rozsáhlých sítí, zvláště sociálních, roste exponenciálně množstvím připojených uzlů – jednotlivé uzly je možné seskupovat do podskupin, kdy může být vytvořeno v síti s n uzly až 2ⁿ-n-1 spojení, tedy přibližně 2ⁿ (Hendler, 2007).
Jedna nevýhoda, která se objevuje v souvislosti se vznikem síťových efektů, je možnost „uvěznění“ uživatelů v takové síti. Jako příklad lze použít třeba dominantní postavení kancelářského balíku MS Office. Vzhledem k tomu, že až do doby nedávno minulé používal k ukládání vlastní neveřejný a nestandardizovaný formát souborů, nebylo možné je používat v jiných kancelářských balících (a pokud ano, bylo nutné k přečtení formátu použít reverzní inženýrství) a Microsoft zase nepodporoval téměř žádné jiné cizí formáty. To pak znamenalo, že uživatelé byli nuceni používat MS Office, aby všichni byli schopni navzájem otevírat své soubory1.
Tedy čím více lidí začne používat určitý produkt (např. pro snadnou výměnu dat), tím hůře se později přechází na jiný produkt, protože by pro uživatele klesl užitek ze sítě. Tím se de facto mohou stát produkty „průmyslovými“ standardy. Velmi často bývají uváděny i různé „formátové“ souboje – jako Betamax vs. VHS, Blueray vs. HDDVD.
Je evidentní, že v prostředí Web 2.0 jde o síťový efekt, v němž nejsou jednotlivá propojení technologická (počet síťových karet), ale sociální (uživatelé) či sémantická (tagy).
Pomocí speciálních aplikací dochází k propojení jednotlivých uživatelů, kteří mezi sebou sdílí vlastní obsah (viz kapitola Obsah vytvářený uživatelem). Důsledek sociálních či komunitních propojení, kdy dochází k síťovým efektům, je dobře pozorovatelný na úspěchu videí na serveru YouTube. Uživatel vystaví na serveru zajímavé video, které publikuje na svém blogu (YouTube umožňuje vložit video pomocí otevřeného API přímo do příspěvku, takže se zdá, jako by bylo přímo součástí zobrazené webové stránky s příspěvkem) či pouze zašle e-mailem upozornění užší skupině uživatelů, která ho, pokud je video zaujme, šíří lavinovitě dál například pomocí svých blogů, kde ho mohou obohatit a „remixovat“ svým komentářem (viz kapitola o identifikaci a vyhledávání v blozích), což přináší hypotetickou přidanou hodnotu (užitek) pro všechny ostatní.
Síťový efekt lze pozorovat i u open source – principu otevřeného a komunitního vývoje aplikací, který je také jedním ze spouštěcích mechanismů, který stál u zrodu toho, čemu dnes říkáme Web 2.0. Více vývojářů spojí své síly k vytvoření aplikace, která bude mít díky tomu větší užitnou hodnotu. Pokud spojí v týmu síly například specialista na grafické prostředí aplikací s dokonalou znalostí uživatelských potřeb a chování s vynikajícím programátorem se značnou znalostí programovacích principů, užitek z aplikace bude hypoteticky vyšší, než kdyby ji vyvíjel každý sám.
- Nyní již, snad i díky fenoménu Web 2.0, začal Microsoft používat v nových verzích otevřený formát souborů, jehož standardizace byla právě schválena. ↩
Vytváření sociálních sítí
Základním prvkem aplikací, které podporují vznik virtuálních sociálních sítí, je vznik veřejného nebo částečně veřejného uživatelského profilu, se kterým je svázán seznam jiných uživatelů s nějakým spojením na majitele profilu – tzv. Přátelé1. Tento seznam Přátel je viditelný i pro ostatní uživatele, kterým nabízí možnost ho procházet a zkoumat sociální spojení daného uživatele (Boyd, 2007). Ačkoliv původní myšlenka je zobrazení sociální sítě Přátel v přímé spojitosti s uživatelem, další přidanou hodnotu nabízejí tyto aplikace ve spojení s umělou inteligencí, pomocí které bývají na základě podobnosti dat, která se váží k profilu, vyhodnocována možná nová spojení na Přátele s podobnou charakteristikou (viz doporučující systém v popisu služby Last.fm).
Většina systémů nabízí vnitřně možnost zasílání zpráv jiným uživatelům či vkládání delších příspěvků v podobě blogů či žurnálů. Uživatelé tak nejsou nuceni používat žádné jiné prostředky pro komunikaci. Zprávy či příspěvky jiných se zobrazují po přihlášení v rámci profilu, který slouží jako komunikační portál.
Bližší popis „velkých“ služeb, jako jsou MySpace, Friendster či Facebook je mimo rozsah této práce, jistě by si zasloužily hlubší analýzu v podobě navazující práce hlavně z hlediska sociologického. Jednotlivé aspekty využití sociálních sítí v rámci speciálních aplikací budou popisovány v kapitole s popisem Web 2.0 aplikací (zejména Last.fm). Pro představu uvedu pouze základní popis dvou základních služeb, a sice MySpace a Facebook.
MySpace
Služba MySpace byla spuštěna v roce 2003, od roku 2005 ji vlastní společnost Fox Broadcasting. Podle údajů z Wikipedie patří mezi pět nejvíce navštěvovaných sídel na celém světě. Značnou popularitu si vydobyla, zvláště v ČR, částí zaměřenou na hudbu. Po přihlášení do této části má každý možnost vložit do systému několik mp3 souborů, které se stanou součástí jeho profilu. V mnoha případech zde bývají uveřejňovány zatím nevydané písně, takže uživatelé mají možnost „nahlédnout muzikantům přímo do kuchyně“. Další informační hodnotu má kalendář plánovaných akcí, kterých se hudebník zúčastní. Uživatel nemusí být nutně pouze fyzická osoba, takže jsou nabízeny profily kapel a klubů. Systém je též částečně otevřen pro zásuvné moduly třetích stran (API), takže stránku lze obohatit například o seznam skladeb prodávaných mp3 obchodem s možností přímého nákupu.
Kontroverzní vlastností je možnost personalizovat vzhled profilu pomocí HTML a kaskádových stylů. Autor této práce se například kvůli této vlastnosti aplikaci vyhýbá velkým obloukem. Není totiž výjimkou, že profilová stránka má při načítaní přes 1MB. O přístupnosti takových stránek pro speciální zařízení (čtečky pro nevidomé nebo i mobilní telefony) je lépe pomlčet.
Vlastností, která v důsledku může ohrozit i reálné vztahy mezi lidmi, je nutnost nějakým způsobem třídit Přátele. MySpace zobrazuje na hlavní profilové stránce výběr tzv. „Top“ Přátel a je nutné rozhodnout, kteří to budou. Nabízí se pak otázka, kdo je větší Přítel a kdo menší (Boyd, 2006b).
Facebook
Původní určení aplikace, která byla spuštěna v roce 2005, bylo vytváření sociálních akademických sítí. V roce 2006 byla otevřena pro širokou veřejnost. Oproti MySpace nabízí subjektivně lepší grafické rozhraní. Kromě základních vlastností jako vytváření hlavní skupiny Přátel má uživatel po registraci například možnost připojit se k sítím (networks) vztahujícím se k jeho osobě. Tak je například možné připojit se k síti (i bývalých) studentů Univerzity Karlovy nebo k síti svého zaměstnavatele. Tyto sítě mohou být v relaci s vytvářenými skupinami (groups, česky by asi znělo lépe klub), například „Jinonický bufet fan club“, který má v současné době kolem 450 členů.
Facebook sice nemá zcela otevřené API, ale nabízí vývojářům Facebook Framework, který mohou za pomoci speciálního jazyka použít k doprogramování nových součástí systému. Pro širší souvislosti lze nabídnout oslavný článek Davida Antoše na serveru Lupa (Antoš, 2007a).
- Jelikož povaha virtuálního přátelství je odlišná od skutečného, uvádí se většinou s velkým písmenem na začátku. ↩