Archiv tagů komunity

Využití kolektivní inteligence

Velmi často uváděným a názorným příkladem využití kolektivní inteligence (Harnessing Collective Intelligence) je algoritmus Page Rank, kterým Google hodnotí „důležitost“ indexovaných stránek. Namísto pouhého zjišťování relevance použitím názvu, metainformací (tag meta), četností slov či struktury stránky je zkoumáno, v jaké míře a odkud se na danou stránku odkazuje. Základní premisa je jednoduchá: čím více zdrojů na danou stránku odkazuje, tím by měla být důležitější1.

Podobně funguje, jak zmiňuje O’Reilly, kolaborativní systém Cloudmark pro filtrování spamu. Na základě vstupů od uživatelů v podobě e-mailových zpráv označených jako spam vyhodnocuje ostatní zprávy, které mají podobný charakter. Vyhodnocená data jsou pak poskytována systémům, které je využívají pro filtraci e-mailových zpráv.

Kolektivní inteligence je v tomto kontextu kolaborativní přístup, který díky integraci, spolupráci a vzájemné důvěře vede k větší míře komplexnosti a porozumění. Zásadní v tomto ohledu je právě integrace a spolupráce umožněná počítačovými systémy, které dokáží vhodně spojit a vyhodnotit jednotlivé prvky tak, aby ve výsledku přinesly větší užitek velkému počtu uživatelů, kteří jsou zároveň uživateli i tvůrci.

Kolektivní inteligence může být využívána v prostředí „otevřených systémů“, ale zdá se, že docela dobře podporuje obchodní modely některých komerční společností. Příkladem komerčního využití je například firma Amazon, která začala používat kolektivní inteligenci svých uživatelů tak, že jim umožnila vkládat k prodávaným produktům uživatelské recenze a hodnocení. To doplňuje celý systém prodeje o významnou přidanou hodnotu. Částečně je tak vyvážena velká nevýhoda internetového obchodu, tj. nemožnost reálného „osahání“ zboží jako v tradičním obchodě. Z podobného principu těží i internetové tržiště eBay, kde je hledisko reputace uživatelů (ať už prodávajících či kupujících) určující pro uskutečnění nákupu. Pokaždé, když je prostřednictvím eBay uzavřen nákup, je nakupující požádán o názor, zda byla jeho zkušenost s prodávajícím pozitivní, neutrální či negativní – přičemž je možno použít i slovní hodnocení pro více detailů. Stejně je hodnocen i nakupující prodejcem. Tím se snaží eBay navodit mezi uživateli jistotu a důvěru.

  1. To byla základní myšlenka algoritmu Page Rank. Dnes je ovšem hodnoceno daleko širší spektrum informací. Problémem, jak ovlivňovat pozici ve výsledcích vyhledávačů se zabývá disciplína SEO – Search Engines Optimization.

Wiki systémy

Na důvěře jsou založeny i publikační systémy typu wiki, soubory stránek, jejichž obsah může být editován samotnými uživateli (správu systému lze řídit i přidělenými právy). Při každé úpravě je uloženo, kdo a kdy úpravu provedl, a zároveň je zachována i původní verze, takže uživatel má možnosti procházet celou retrospektivu vývoje a případně se vrátit k původnímu znění. Zde je patrná paralela s vývojem komunitních projektů založených na otevřeném zdrojovém kódu – open source, kdy máme možnost sledovat postup programovacích prací v CVS1 aplikacích a systémem práv je určeno, kdo jaké programové kódy může editovat. K dispozici je celá řada wiki softwarů pro mnohé platformy, většina z nich je k dispozici zdarma. Zřejmě nejpoužívanější je MediaWiki vyžadující k chodu podporu PHP a MySQL nebo PostgreSQL.

MediaWiki také pohání asi nejznámější wiki aplikaci – encyklopedii Wikipedia. Ta podle údajů z dubna 2008 obsahuje přes 10 miliónů článků ve více než 253 jazycích, které byly zadány a editovány pouze dobrovolnými přispěvateli2.

Velká svoboda a otevřenost je předmětem největší kritiky systému. Panuje velká obava, že možnost volné editace vede ke snížení odborné úrovně publikovaných hesel a k diktátu masového vkusu (Zbiejczuk, 2007). S tím souvisí i záměrný vandalizmus nebo zamlžení, které ohrožují nejen pro Wikipedii, ale všechny Web 2.0 aplikace, na nichž se mohou podílet sami uživatelé.

Vandalizmus dokazuje příklad z poměrně nedávné doby, kdy student Virgil Graffith napsal program Wikiscanner, který dokáže dle rozsahů IP adres určovat, z jakých míst jsou jednotlivé články na Wikipedii upravovány. Vyšlo kupříkladu najevo, že záhadně mnoho výmazů kritiky u hesel týkajících se scientologie pochází z počítačů této církve atd. Seznam nejpovedenějších odhalení se zveřejňuje na blogu časopisu Wired . Ukazují se tak největší slabiny otevřeného přístupu. Ale u velmi často navštěvovaných hesel nebývá záměrný vandalizmus, díky nastaveným právům, tak častý a u méně populárních bývá velmi rychle odhalen a napraven.

Jak již bylo zmíněno v úvodu této kapitoly, wiki systémy nejsou pouze encyklopedie typu Wikipedia. Značné uplatnění nalézají v korporátní sféře, kde bývají nasazeny pro intranetové aplikace nebo správu dokumentace. Velmi silné jsou pro tzv. knowledge management. V kapitole o blozích ve společnostech nabízím případovou studii, která tuto skutečnost dokresluje.

  1. Concurrent Versions System nebo Concurrent Versioning System
  2. Když jsem rozepsal v srpnu 2007 tuto práci, měl jsem uvedené číslo 8 miliónů článků ve 250 jazycích. To svědčí o obrovské rychlosti, kterou je encyklopedie plněna. Zdroj dat: heslo Wikipedia

Síťové efekty

V kapitole věnované síle kolektivní inteligence byl zmiňován algoritmus Page Rank, který vyhodnocením vzájemných odkazů jednotlivých stránek stanovuje jejich hodnotu (užitek) pro zpřesnění výsledků fulltextového vyhledávání. Čím více uživatelů nalinkuje pomocí odkazů jednotlivou stránku, tím má tato stránka pravděpodobně i pro ostatní uživatele větší užitek. Tento princip, kdy pro stávající uživatele narůstá hodnota služby tím víc, čím víc nových uživatelů začne službu používat (za podmínky, že mezi uživateli existuje možnost interakce – vazba), se nazývá síťový efekt. Dalším a velmi výstižným příkladem může být fax nebo mobilní telefon. Pokud se do sítě připojí nový uživatel, nejen že z toho profituje on sám, ale nepřímo i ostatní uživatelé, protože mohou volat na číslo, na které předtím nemohli. Jinými slovy: pokud zařízení vlastní málo uživatelů, užitná hodnota pro tyto uživatele není příliš vysoká, protože je jen málo uživatelů, se kterými se můžeme spojit, a výrazně roste, pokud uživatelů přibývá.

Matematicky se snažil tento princip vyjádřit v osmdesátých letech Bob Metcalfe, když chtěl vysvětit svým zákazníkům, proč potřebují nakupovat více ethernetových karet. Jeho základní hypotéza (později nazvaná jako Metcalfův zákon) byla, že zatímco náklady na síť rostou lineárně s počtem přípojek, její hodnota roste čtvercem počtu uživatelů (kvadraticky). V síti s n uzly může každý navázat (n-1) spojení, celkový užitek sítě je tedy n(n-1), což je přibližně . Pokud bychom náklady na síť a takto vypočítaný užitek umístili na graf, v určitém bodě se křivky protnou a hodnota sítě pro uživatele převýší náklad. (Donát, 2001)

V posledních letech byl tento zákon podroben kritice, protože je zaměřen příliš technologicky (kalkuluje s počtem potencionálních spojení jednotlivých zařízení, které neodpovídá reálnému počtu spojení mezi uživateli). Bob Brisco se ho snažil reformulovat s ohledem na užitek jednotlivých spojení (tvrdí, že ne všechna mají stejnou hodnotu). V jeho podání lze užitek sítě s n uzly vyjádřit logaritmicky log(n). Laicky řečeno ve vztahu k telefonům: některé kontakty, jež máme uloženy ve svých adresářích, jsou pro nás důležitější než jiné.

David P. Reed zase tvrdí, že užitek rozsáhlých sítí, zvláště sociálních, roste exponenciálně množstvím připojených uzlů – jednotlivé uzly je možné seskupovat do podskupin, kdy může být vytvořeno v síti s n uzly až 2ⁿ-n-1 spojení, tedy přibližně 2ⁿ (Hendler, 2007).

Jedna nevýhoda, která se objevuje v souvislosti se vznikem síťových efektů, je možnost „uvěznění“ uživatelů v takové síti. Jako příklad lze použít třeba dominantní postavení kancelářského balíku MS Office. Vzhledem k tomu, že až do doby nedávno minulé používal k ukládání vlastní neveřejný a nestandardizovaný formát souborů, nebylo možné je používat v jiných kancelářských balících (a pokud ano, bylo nutné k přečtení formátu použít reverzní inženýrství) a Microsoft zase nepodporoval téměř žádné jiné cizí formáty. To pak znamenalo, že uživatelé byli nuceni používat MS Office, aby všichni byli schopni navzájem otevírat své soubory1.

Tedy čím více lidí začne používat určitý produkt (např. pro snadnou výměnu dat), tím hůře se později přechází na jiný produkt, protože by pro uživatele klesl užitek ze sítě. Tím se de facto mohou stát produkty „průmyslovými“ standardy. Velmi často bývají uváděny i různé „formátové“ souboje – jako Betamax vs. VHS, Blueray vs. HDDVD.

Je evidentní, že v prostředí Web 2.0 jde o síťový efekt, v němž nejsou jednotlivá propojení technologická (počet síťových karet), ale sociální (uživatelé) či sémantická (tagy).

Pomocí speciálních aplikací dochází k propojení jednotlivých uživatelů, kteří mezi sebou sdílí vlastní obsah (viz kapitola Obsah vytvářený uživatelem). Důsledek sociálních či komunitních propojení, kdy dochází k síťovým efektům, je dobře pozorovatelný na úspěchu videí na serveru YouTube. Uživatel vystaví na serveru zajímavé video, které publikuje na svém blogu (YouTube umožňuje vložit video pomocí otevřeného API přímo do příspěvku, takže se zdá, jako by bylo přímo součástí zobrazené webové stránky s příspěvkem) či pouze zašle e-mailem upozornění užší skupině uživatelů, která ho, pokud je video zaujme, šíří lavinovitě dál například pomocí svých blogů, kde ho mohou obohatit a „remixovat“ svým komentářem (viz kapitola o identifikaci a vyhledávání v blozích), což přináší hypotetickou přidanou hodnotu (užitek) pro všechny ostatní.

Síťový efekt lze pozorovat i u open source – principu otevřeného a komunitního vývoje aplikací, který je také jedním ze spouštěcích mechanismů, který stál u zrodu toho, čemu dnes říkáme Web 2.0. Více vývojářů spojí své síly k vytvoření aplikace, která bude mít díky tomu větší užitnou hodnotu. Pokud spojí v týmu síly například specialista na grafické prostředí aplikací s dokonalou znalostí uživatelských potřeb a chování s vynikajícím programátorem se značnou znalostí programovacích principů, užitek z aplikace bude hypoteticky vyšší, než kdyby ji vyvíjel každý sám.

  1. Nyní již, snad i díky fenoménu Web 2.0, začal Microsoft používat v nových verzích otevřený formát souborů, jehož standardizace byla právě schválena.