Už se stalo jakýmsi nepsaným zvykem, že v prostředí internetu se určitá technologie používá zcela pro něco zcela jiného, než bylo její původní určení. Syndikování – tedy publikování části obsahu jiných stránek – není nic nového. Již v polovině devadesátých let se pro syndikování používaly pokročilé technologie – například strojová analýza HTML kódu; nevýhoda použití těchto technologií spočívala v nutnosti časté úpravy skriptů při změně kódů. Pro mnoho Web 2.0 aplikací se stalo samozřejmostí syndikování pomocí metadat ve formě tzv. feedů.
Zmatek jménem RSS
První pokus s použitím metadat pro syndikaci vyústil ve specifikaci Meta Content Framework firmy Apple, za nímž stál Ramanathan V. Guha. Meta Content Framework byl nasazen v aplikaci ProjectX (HotSauce) pro reprezentaci zdrojů v 3D prostředí. S návratem Steva Jobse do Apple byl tento zajímavý projekt bohužel zastaven.
Guha po zastavení projektu přešel do firmy Netscape, kde se setkal s vývojáři jazyka XML. Výsledkem bylo přepsání Meta Content Framework jako aplikace XML – tak se zrodil základ jazyka pro popis zdrojů – Resource Description Format (RDF), který byl přijat po úplném dopracování konsorciem W3C v roce 1997 jako standard. Přibližně ve stejné době přichází Microsoft se specifikací Channel Definition Format (CDF), který používá ve svém prohlížeči Internet Explorer 4, ale časem technologie upadá v zapomnění.
V roce 1999 firma Netscape vydává první verzi RSS 0.9 (RDF Site Summary), kterou používá ve svém portále My Netscape, tato specifikace byla derivátem jazyka RDF. Záhy je ale přepracována Danem Libbym, který formát zjednodušuje (opouští specifikaci RDF) a přidává části syndikačního formátu, který již dříve na svých stránkách používal David Winer, vzniká tak verze RSS 0.91 (Rich Site Summary). Po akvizici Netscape společností AOL je ale vývoj ze strany této korporace zastaven, dokonce ze stránek Netscape mizí DTD (Document Type Definition) tohoto formátu (později je obnoven).
To vedlo k ustanovení skupiny RSS-DEV, která měla ve vývoji formátu pokračovat. V roce 2000 tato skupina vydává novou verzi RSS 1.0, která se vrací k RDF a šířeji podporuje soubory metadat (Dublin Core). Bohužel tato verze není zpětně kompatibilní s řadou RSS 0.9x. Aby zmatku nebylo málo, Winer oznamuje, že pokračuje ve vývoji řady 0.91, o které tvrdí, že je intelektuálním vlastnictvím jeho společnosti UserLand Software. Z tohoto vývoje vzešlo několik dalších verzí a vyústilo ve vydání RSS 2.0 (Really Simple Syndication), které umožňovalo další rozšíření formátu pomocí XML (Bednář, 2006; Dočekal, 2003).
ATOM
Zmatek v RSS formátech vedl odbornou internetovou veřejnost k názoru, že je potřeba vytvořit nový formát, který by byl nezávislý na jakékoliv společnosti, mohl by být nasazen kýmkoliv, mohl být volně rozšiřitelný a hlavně, který by byl čistě a jasně vymezen . V roce 2003 Sam Ruby (je také autorem programovacího jazyka Ruby, kterému mnozí předpovídají velkou budoucnost na poli internetových aplikací) zřídil v prostředí wiki komunikační platformu pro diskuzi o takovém formátu. Přes počáteční porodní bolesti se zrodil formát ATOM 0.2 rychle následovaný verzí ATOM 0.3, který podpořila společnost Google jeho implementací do svých produktů. V roce 2005 organizace IETF schválila Atom Syndication Format 1.0 jako standard RFC 42871.
Hlavními rozdíly oproti RSS je možnost publikace nejen textových (HTML) informací, ale také XML či informací kódovaných pomocí Base-64 (kódování pro binární data, například video, dokumenty atd.).
Ben Hammersley ve své prezentaci pro O’Reilly Emerging Technology Conference zmiňuje také určitou ztrátovost informací při použití RSS. Říká, že v okamžiku publikace zdroje už s určitostí známe jeho název, tvůrce, dobu vzniku, jeho obsah i kde se nachází – není tedy důvod tato data při agregaci nepoužít. Přesně tato pole jsou při použití specifikace ATOM povinná, u RSS 2.0 informace o tvůrci, datu i jednoznačném identifikátoru (URI) v základních povinných polích schází. (Hammersley, 2005).
Zdá se, že v boji formátů dnes přesto vítězí RSS 2.0, i když není výjimkou, že servery zpřístupňují data v několika syndikačních formátech najednou.
Dlužno podotknout, že dnes už je zkratka RSS užívána jako obecné označení syndikace v kterémkoliv formátu.
Agregace obsahu
K masovému rozšíření syndikačních formátů přispěla i možnost agregace poskytovaného obsahu pomocí čteček – tvz. agregátorů (feed aggregators, feed readers). Aplikace v prostředí podobném e-mailovému klientu v určitém intervalu kontrolují, zda na server nepřibyly nové informace. Analogie s e-mailovým klientem není úplně náhodná – syndikační formáty v určitém směru nahradily e-mailové newslettery , které se s nadměrným rozšířením spamu staly jako nástroj pro komunikaci nepoužitelné.
Čtečky mohou stahovat obsah z více možných zdrojů a nabízejí další možnosti jeho filtrování. Tato vlastnost čteček se časem promítla i do samotných serverů – již tam je možné (před)vybrat, které informace budou odebírány. Dnes jsou čtečky zabudovány již do všech hlavních prohlížečů na trhu. Speciální možností jsou webové čtečky, kde se obsah v duchu webu jako platformy agreguje přímo na serveru aplikace. Velmi často jsou tyto čtečky zabudovány do blogovacích aplikací, takže jednotlivé blogy mohou být obohaceny i o informace z jiných zdrojů.
Objevuje se také debata, zda šířit pomocí syndikačních formátů celý obsah (tedy nejen krátký sumář) jednotlivých příspěvků. Plný obsah je pak možné pohodlně číst po stažení i na speciálních zařízeních (mobilní telefony, mp3 přehrávače atd.) v režimu offline. Hlavními argumenty pro jsou velmi snadná navigace a jednotné rozhraní pro čtení příspěvků z jednotlivých zdrojů. Proti stojí vyšší zátěž na připojení serverů (data jsou pravidelně stahována v krátkých intervalech).
Šíření speciálního obsahu
Pro šíření audionahrávek formou syndikačních formátů se vžil název podcasting2. Tyto nahrávky mohou být speciální čtečkou (např. Ziepod) staženy a automaticky uloženy do hardwarového mp3 přehrávače3. Analogicky k tomu existují ještě videocasty (je šířeno video) nebo photofeedy (jsou šířeny fotografie).
Feedburner
Feedburner je aplikace pro poskytovatele obsahu ve formě některého ze syndikačních formátů, který znovu publikuje s přidanou hodnotou. Tou je především možnost sledování, kolik lidí je přihlášeno k odběru, automatický ping (viz kapitola o identifikaci blogů) nebo přihlášení k odběru syndikovaného obsahu e-mailem. Je možné také do feedu nechat automaticky přidávat kontextovou reklamu. Pro odběratele pak především naformátování syrového XML feedu do grafické podoby, automatické překódování do různých formátů (RSS vs. Atom) dle aplikace, která si ho vyžádala.
Od roku 2007, kdy byla služba koupena společností Google, jsou její funkce dostupné zdarma. Služba má otevřené API pro možnost využití v dalších aplikacích.
- Vedle tohoto formátu je navržen také Atom Publishing Protocol (APP nebo AtomPub) pro vytváření a aktualizaci webových zdrojů na bázi HTTP protokolu. Zatím nebyl schválen žádnou autoritou jako standard. ↩
- Označení vzniklo spojením slov cast = broadcast, vysílání, pod = iPod, dle velmi oblíbeného mp3 přehrávače společnosti Apple. ↩
- U nás kupříkladu pořad Radia 1 Odvážné palce nebo ČRo ↩
Trackbacks & Pingbacks 1
[…] Technorati Velmi podobně funguje speciální vyhledávač Technorati, který již byl zmíněn v souvislosti s odhadem velikosti blogosféry o něco výše. Pro indexování blogových zdrojů využívá speciální funkcionalitu tzv. pingu. Jde o mechanizmus, pomocí kterého publikační systém upozorňuje indexační server, že byl uveřejněn nový příspěvek. Indexační server ihned po upozornění může příspěvek indexovat. Tím se snižuje doba, za kterou se příspěvky mohou objevit ve výsledcích vyhledávání. Vyhledávač Technorati nevyužívá pro indexaci samotné příspěvky, ale používá ke stažení informací agregační formáty RSS nebo ATOM. […]
Vložit komentář