Archiv tagů sociální sítě

Vytváření sociálních sítí

Základním prvkem aplikací, které podporují vznik virtuálních sociálních sítí, je vznik veřejného nebo částečně veřejného uživatelského profilu, se kterým je svázán seznam jiných uživatelů s nějakým spojením na majitele profilu – tzv. Přátelé1. Tento seznam Přátel je viditelný i pro ostatní uživatele, kterým nabízí možnost ho procházet a zkoumat sociální spojení daného uživatele (Boyd, 2007). Ačkoliv původní myšlenka je zobrazení sociální sítě Přátel v přímé spojitosti s uživatelem, další přidanou hodnotu nabízejí tyto aplikace ve spojení s umělou inteligencí, pomocí které bývají na základě podobnosti dat, která se váží k profilu, vyhodnocována možná nová spojení na Přátele s podobnou charakteristikou (viz doporučující systém v popisu služby Last.fm).

Většina systémů nabízí vnitřně možnost zasílání zpráv jiným uživatelům či vkládání delších příspěvků v podobě blogů či žurnálů. Uživatelé tak nejsou nuceni používat žádné jiné prostředky pro komunikaci. Zprávy či příspěvky jiných se zobrazují po přihlášení v rámci profilu, který slouží jako komunikační portál.

Bližší popis „velkých“ služeb, jako jsou MySpace, Friendster či Facebook je mimo rozsah této práce, jistě by si zasloužily hlubší analýzu v podobě navazující práce hlavně z hlediska sociologického. Jednotlivé aspekty využití sociálních sítí v rámci speciálních aplikací budou popisovány v kapitole s popisem Web 2.0 aplikací (zejména Last.fm). Pro představu uvedu pouze základní popis dvou základních služeb, a sice MySpace a Facebook.

MySpace
Služba MySpace byla spuštěna v roce 2003, od roku 2005 ji vlastní společnost Fox Broadcasting. Podle údajů z Wikipedie patří mezi pět nejvíce navštěvovaných sídel na celém světě. Značnou popularitu si vydobyla, zvláště v ČR, částí zaměřenou na hudbu. Po přihlášení do této části má každý možnost vložit do systému několik mp3 souborů, které se stanou součástí jeho profilu. V mnoha případech zde bývají uveřejňovány zatím nevydané písně, takže uživatelé mají možnost „nahlédnout muzikantům přímo do kuchyně“. Další informační hodnotu má kalendář plánovaných akcí, kterých se hudebník zúčastní. Uživatel nemusí být nutně pouze fyzická osoba, takže jsou nabízeny profily kapel a klubů. Systém je též částečně otevřen pro zásuvné moduly třetích stran (API), takže stránku lze obohatit například o seznam skladeb prodávaných mp3 obchodem s možností přímého nákupu.

Kontroverzní vlastností je možnost personalizovat vzhled profilu pomocí HTML a kaskádových stylů. Autor této práce se například kvůli této vlastnosti aplikaci vyhýbá velkým obloukem. Není totiž výjimkou, že profilová stránka má při načítaní přes 1MB. O přístupnosti takových stránek pro speciální zařízení (čtečky pro nevidomé nebo i mobilní telefony) je lépe pomlčet.

Vlastností, která v důsledku může ohrozit i reálné vztahy mezi lidmi, je nutnost nějakým způsobem třídit Přátele. MySpace zobrazuje na hlavní profilové stránce výběr tzv. „Top“ Přátel a je nutné rozhodnout, kteří to budou. Nabízí se pak otázka, kdo je větší Přítel a kdo menší (Boyd, 2006b).

Facebook
Původní určení aplikace, která byla spuštěna v roce 2005, bylo vytváření sociálních akademických sítí. V roce 2006 byla otevřena pro širokou veřejnost. Oproti MySpace nabízí subjektivně lepší grafické rozhraní. Kromě základních vlastností jako vytváření hlavní skupiny Přátel má uživatel po registraci například možnost připojit se k sítím (networks) vztahujícím se k jeho osobě. Tak je například možné připojit se k síti (i bývalých) studentů Univerzity Karlovy nebo k síti svého zaměstnavatele. Tyto sítě mohou být v relaci s vytvářenými skupinami (groups, česky by asi znělo lépe klub), například „Jinonický bufet fan club“, který má v současné době kolem 450 členů.

Facebook sice nemá zcela otevřené API, ale nabízí vývojářům Facebook Framework, který mohou za pomoci speciálního jazyka použít k doprogramování nových součástí systému. Pro širší souvislosti lze nabídnout oslavný článek Davida Antoše na serveru Lupa (Antoš, 2007a).

  1. Jelikož povaha virtuálního přátelství je odlišná od skutečného, uvádí se většinou s velkým písmenem na začátku.

Last.fm

Last.fm je sociální webovou aplikací pro sdílení hudebních preferencí jednotlivých uživatelů. Pomocí speciálního software (nebo zásuvného modulu pro desktopové audio přehrávače) zaznamenává identifikační prvky skladeb, které uživatel poslouchá. Vzniklý seznam je následně algoritmicky porovnáván se seznamy jiných uživatelů a na základě shody a podobnosti jsou uživateli doporučovány další skladby, které by pro něj mohly být zajímavé. Základní premisou je, že pokud se v portfoliu dvou uživatelů objeví tytéž skladby/tíž intepreti, je dost pravděpodobné, že jejich vkus by se mohl shodovat i v případě dalších skladeb/interpretů z jejich portfolií. Uživatelé Last.fm si tak můžou navzájem rozšiřovat obzory, a to s nejvyšší pravděpodobností ve směru, kterým si je rozšiřovat doopravdy chtějí1.

Uživatelé se mohou navzájem přidávat do Přátel, sdružovat se do skupin. Systém automaticky generuje žebříčky nejposlouchanějších interpretů v různých časových obdobích. Tyto žebříčky jsou vypočítávány na základě dat od uživatele, skupiny uživatelů nebo země původu uživatele, ale také u jednotlivých interpretů. Systém také automaticky generuje žebříčky interpretů a skladeb, jejichž poslouchanost se v aktuálním týdnu nejvíce zvýšila (tzv. Hype Tracks, Hype Artists).

Výsledky doporučujícího algoritmu jsou pro uživatele generovány z dat jeho poslechů za poslední týden nebo celkově. Je důležité poznamenat, že má-li být systém účinný, je třeba ho nejdříve „naplnit“ větší sadou dat. Skladby, které aplikace automaticky doporučí, lze poslouchat pomocí automaticky generovaného streamu – rádia (nebo přímo stažením celé skladby, pokud je k dispozici). Uživatel si tak může ověřit, zda se mu doporučované skladby opravdu líbí a má si je „obstarat“ (ať už to znamená cokoliv).

Uživatel se ovšem nemusí spoléhat pouze na seznam doporučených interpretů, systém mu nabízí také, na základě podobnosti, seznam uživatelů s podobným vkusem – Neighbours. Jejich profily s jejich žebříčky a seznamy poslouchaných skladeb mohou sloužit k další hudební edukaci uživatele.
Pomocí algoritmu je také doporučován seznam akcí (např. koncerty), které se konají v blízkosti místa bydliště uživatele. Neuvedenou akci lze také doplnit. U každé akce je možné podchytit účast nebo neúčast, což se následně objeví Přátelům v jejich profilu. U každé akce lze prohlížet seznam účastníků.

Profil se také automaticky vytváří každému poslouchanému interpretu a uživatelé mají možnost doplnit jeho popis. Pro editaci je použito vnitřního wiki, kdy systém zaznamenává veškerou historii změn a nabízí prostor k diskuzi o těchto změnách. U každé entity systému (uživatelé, interpreti, jednotlivé skladby, akce, videa) je možné vést diskuzi pomocí krátkých zpráv – Shoutboxu a lze ji také „otagovat“. Tyto tagy je možné použít k pozdějšímu vyhledání.

Aplikace je velice komplexní a výčtem jejích funkcionalit bychom zabrali mnoho stran textu (tvoření vlastních rádií, možnost interního žurnálu atd.), pokusili jsme se „vypíchnout“ pouze ty podstatné a relevantní vzhledem k předchozímu textu. Pro její fungování je zásadní princip vytěžování kolektivní inteligence, kdy jsou na základě uživatelem dodaných dat generována jiná pro něj „prospěšná“ data.

Objevuje se také velká nevýhoda všech systémů, které jsou závislé na vstupech od uživatelů. Mnohdy totiž uživatelé zadávají interpreta a názvy skladeb pod různými jmény. Například uživatel posílá jméno v některé z následujících verzí: Dvořák; Dvorak; Antonín Dvořák; Antonin Dvorak, což pak vede k znehodnocení výsledků. V takových případech se nabízí uživatelům možnost hlasování o správnosti jména. Horší je to v momentě, kdy se na jedné skladbě podílí více interpretů nebo se jedná o remix skladby původní.
V systému se objevují AJAX prvky, ale pouze při zadávání formulářových dat, plugin pro Adobe Flash je nutný pouze pro sledování videí a poslech rádia. Jako RSS feed je možné přihlásit seznam posledních poslouchaných skladeb jednotlivých uživatelů a stejně tak všechny žebříčky. Do systému není možné přihlásit se pomocí OpenID ani jiné podobné služby, při přihlášení je použit zabezpečený protokol HTTPs.

Systém má otevřené API pro další využití . Zajímavé použití je například na serveru MusicPortl, kde se při zadání jména interpreta kombinují výsledky vyhledávání z Last.fm, Amazonu, Flickru, YouTube a dalších. Nebo propojení Amazonu a poslouchaných interpretů na Last.fm, kdy je výsledkem RSS feed vycházejících desek dle vašich preferencí. Bohužel výsledek je trochu diskvalifikován příliš úzkou nabídkou Amazonu, v jehož katalogu nejsou ve velké míře zastoupeni evropští producenti.

  1. Uživatel A poslouchá Beatles, Rolling Stones a The Kinks, uživatel B poslouchá také Beatles, Rolling Stones a The Who. Je tedy pravděpodobné, že se uživateli A budou líbit The Who a uživateli B The Kinks.

Bandzone

Bandzone je český projekt pro vytváření sociálních sítí kapel a posluchačů. V našem výčtu ho uvádíme, abychom ukázali, že aplikace tohoto typu reálně fungují. Systém zdaleka není tak komplexní jako např. Last.fm nebo MySpace či Facebook. Kapela či Fanoušek si založí registrací svůj profil, do kterého si mohou přidávat své oblíbené Kapely (i Kapela má možnost přidat spřízněnou kapelu) či Přátele. Kapela i Fanoušek mohou vést kratší žurnál o novinkách, kapela může přidávat nové koncerty a zveřejnit čtyři mp3.

Když autor této práce zjišťoval u člena jedné kapely okresního formátu, zda jim jejich dvouletá prezence na tomto serveru něco přinesla, bylo mu sděleno, že přinesla řadu nových příležitostí ke hraní a nástroj pro oslovení více neanonymních fanoušků, ale i kontakty na kapely, se kterými lze aktivně spolupracovat (společné hraní, zkušenosti s kluby atd.).

Služba využívá pouze principů vytváření sociálních sítí. AJAX se používá při navigaci v Profilu, ale funguje bezproblémově ve všech běžných prohlížečích. RSS, otevřené API, princip kolektivní inteligence ani OpenID nebyl neobjeven.

Blogy v číslech

Populární vyhledávač blogů Technorati vydával pravidelně ústy svého CEO Davida Sifryho zprávy o stavu blogosféry1. V dubnu 2007 indexovala 70 miliónu blogů při průměrném přírůstku 120 tisíc denně (Sifry, 2007). Toto číslo zahrnuje i splogy (spam blogy, viz dále). Dnes Technorati dle údajů v About us uvádí, že indexuje přibližně 112,8 miliónů blogů. Toto obrovské číslo ovšem kontrastuje s výzkumem společnosti Perseus2, která v roce 2003 analyzovala 3 634 blogů na osmi nejvýznamnějších blogovacích službách se zjištěním, že 66 % všech blogů bylo záhy (za 1–2 měsíce) po svém spuštění opuštěno (Perseus, 2004).

Počet blogů indexovaných vyhledávačem Technorati, údaje z dubna 2007
Obrázek 11 – Počet blogů indexovaných vyhledávačem Technorati, údaje z dubna 2007

Heather Green na blogu časopisu BusinessWeek uvádí zpřesňující čísla, která Sifry ve zprávě z dubna 2007 neuvádí (ale data pocházejí také z Technorati, ovšem na speciální vyžádání autorky): 15,5 miliónů aktivních blogů, tedy těch, které byly aktualizovány alespoň jednou v posledních 90 dnech. Na obrázku č. 12 můžeme vysledovat, že počet blogů sice stále roste, nicméně rychlost jejich vzniku se zpomalila, což by mohlo znamenat, že blogy zaznamenaly svůj vrchol v průběhu roku 2006 (Green, 2007). Přední analytická společnost Gartner predikovala vrchol v roce 2007 a ustálení na počtu 100 miliónů blogů (s údajem o již 200 miliónech opuštěných blogů) (Gartner, 2008).

Další data z dubnové zprávy Technorati: počet denních příspěvků je 1,5 miliónu a dle grafu mírně klesá. Nejvíce zastoupený jazyk je japonština se 37 procenty, následuje angličtina se 33 procenty.

V červnu 2006 společnost Pew Internet & American Life Project odhadovala ve Spojených státech „blogerskou populaci“ na 12 miliónů dospělých Američanů, což v té době představovalo asi osm procent všech dospělých uživatelů internetu. Počet čtenářů, kteří blogy čtou alespoň někdy, byl odhadován na 57 miliónů dospělých (39 % amerických uživatelů internetu), počet pravidelných čtenářů byl nižší (Lenhrat, 2006).

Obrázek 12 – Počet blogů aktualizovaných alespoň jednou za posledních 90 dní
Obrázek 12 – Počet blogů aktualizovaných alespoň jednou za posledních 90 dní

Mezi blogy lze vysledovat také Long tail ve vztahu ke čtenářům. Několik málo blogů se může pochlubit vysokou návštěvností a vysokým povědomím o jejich existenci a s tím související největší citovaností ostatními blogery. Někdy bývají označované jako A blogy a jejich autoři jako A blogeři. Naproti tomu je vysoký počet „malých“ blogů s téměř žádnou čteností, případně s malým počtem čtenářů rekrutujících se většinou z řad přátel, spolužáků nebo spolupracovníků – tzv. nanopublikem. Lze se domnívat, že velmi časté opouštění blogů zmiňované o něco výše způsobují lidé z tohoto nanopublika, když přecházejí z blogů na sociální aplikace typu Facebook a MySpace, které lépe vyhovují jejich potřebám.

  1. State of Blogosphere, poslední vydaná v dubnu 2007 se jmenuje State of Live Web.
  2. Dnes společnost Vovici, http://www.vovici.com.

Identifikace a vyhledávání informací na blozích

Identifikace a vyhledávání informací na blozích
Při rychlosti, kterou se dokáže šířit informace blogosférou, je podstatná role speciálních vyhledávačů v blozích a aplikací pro „popularizaci obsahu“. Takových služeb je celá řada, proto si zkusme na příkladech alespoň popsat jejich základní funkcionality. Jednou pro všechny společnou je vytvoření seznamu populárních příspěvků v blogosféře, který informuje uživatele, o čem se aktuálně nejvíc píše. Takový druh aplikace se nazývá memetracker.
Jednoznačná výhoda speciálních vyhledávacích služeb je především v rychlém zaindexování obsahu. Běžné crawlery nespecializovaných vyhledávačů nenavštěvují webová sídla v pravidelných intervalech a nemusí zaindexovat všechny jejich stránky, takže nemohou ve výsledcích hledání nabídnout vždy aktuální informace.

Blogdex
Průkopníkem na tomto poli byl, dnes už nefunkční, Blogdex. V rámci univerzitního výzkumu byl navržen algoritmus, který vyhodnocoval blogové zdroje podle počtu citací jinými blogy a zároveň aktuálností těchto citací. Blogy byly indexovány automaticky pomocí crawleru. Výsledkem tohoto algoritmu byl zmíněný seznam, který sloužil blogerům jednak k ověření, jak si stojí jejich blog mezi jinými, ale také jako zdroj aktuálních témat a inspirace pro psaní vlastních příspěvků. Blogdex skončil v květnu 2006, přesto je dobré jej zmínit jako první aplikaci svého druhu.

Technorati
Velmi podobně funguje speciální vyhledávač Technorati, který již byl zmíněn v souvislosti s odhadem velikosti blogosféry o něco výše. Pro indexování blogových zdrojů využívá speciální funkcionalitu tzv. pingu. Jde o mechanizmus, pomocí kterého publikační systém upozorňuje indexační server, že byl uveřejněn nový příspěvek. Indexační server ihned po upozornění může příspěvek indexovat. Tím se snižuje doba, za kterou se příspěvky mohou objevit ve výsledcích vyhledávání. Vyhledávač Technorati nevyužívá pro indexaci samotné příspěvky, ale používá ke stažení informací agregační formáty RSS nebo ATOM.

Jednotlivé blogy jsou hodnoceny ze dvou hledisek. Z hlediska autority (Authority), což je počet ostatních blogů citujících blog (počet blogů, které odkazují na blog) za posledních šest měsíců. A s ohledem na pozici (Rank), což je počet blogů, které dělí blog od toho s nejvyšší autoritou. Tedy máme-li nejvyšší autoritu (nejvyšší číslo), máme i nejvyšší pozici (č. 1) (Carroll, 2007). Za pomoci těchto výpočtů je stanoveno pořadí Top 100 (nejlepších 100) dle jejich autority.

Pohybovat se můžeme v systému (mimo jiné) v rámci šesti základních kategorií (např. Technology), které se dále mohou dělit na podkategorie (např. Gadgets). Hledání je možné, krom fulltextu, přes tagy, které jsou automaticky převzaty ze zdroje nebo jsou zadávany uživateli. U tagů je k dispozici graf četnosti jejich výskytu za posledních třicet dní a seznam příbuzných tagů pro zpřesnění hledání. Výsledky lze řadit podle jejich čerstvosti nebo dle pozornosti jim věnované.

Technorati prošlo za rok 2007 několika bouřlivými změnami, které, subjektivně hodnoceno, celému systému neprospěly. Jednotlivé navigační stránky se znepřehlednily a uživatel není řádně informován, co si má vlastně v systému počít. Do ústraní také ustoupil ze všech indexovaných zdrojů generovaný tag cloud, jenž vypovídal velmi dobře o aktuálních trendech (nyní pouze seznam nejvíce hledaných pojmů). Křivka statistiky návštěvnosti vyhodnocovaná službou Alexa od začátku roku 2007 vytrvale klesá. 1
Technorati se na svých stránkách hlásí k podpoře otevřeného software a nabízí API s možností využití dat ze svého systému.

Digg
Memetracker Digg využívá k sestavení žebříčku populárních příspěvků vstupy od uživatelů. Každý uživatel má možnost vložit zajímavý odkaz na příspěvek, který se zařadí na Upcoming seznam, kde mají registrovaní uživatelé možnost hlasovat, zda chtějí zařadit odkaz do seznamu populárních odkazů. Tam je zařazen ve chvíli, kdy dosáhne určitého počtu hlasů. Při sestavování žebříčku je též brán ohled na dobu vzniku příspěvku, což znamená, že jako první v seznamu nemusí být nutně ten s největším počtem hlasů. V ČR funguje podobná služba linkuj.cz.

Jednotlivé odkazy jsou zařazovány dle typu (zprávy, videa, obrázky, podcasty) a pak do šesti základních kategorií s dalšími podkategoriemi a jsou zobrazeny ve formě tzv. článku (Article) s krátkým popisem a možností komentování. Digg je také sociální sítí, kde je možné vytvořit si seznam Přátel, jimi vložené odkazy se pak zobrazují zvýrazněně.

Digg dává možnost uživatelům hlasovat proti příspěvku (doslova pohřbít – Bury it). Jeho původní funkcí bylo jakési „samočištění“, aby se zamezilo vkládání spamu či nesmyslných odkazů. V kritice této služby bývá zmiňováno, že se objevuje klasický Long tail: malý počet uživatelů generuje nejvíc odkazů, které se objevují v populárním seznamu. Což v důsledku vede k jednostrannosti příspěvků. Projevuje se také princip „uzamčení“ (viz kapitola o sítových efektech), kdy se populární příspěvky stávají ještě populárnější.

Digg dává k dispozici otevřené API a sadu nástrojů pro hlasování přímo na straně blogu.

  1. Což nemusí být nutně důsledek změn na Technorati, ale kupříkladu toho, že se velké vyhledávací společnosti naučily lépe indexovat blogy.