Archiv rubriky Použití standardů a přístupnost významných blogů

Použití standardů a přístupnost významných blogů

Pokud jsme v předešlých kapitolách nastínili, že základními principy blogů i Web 2.0 aplikací jsou vysoká míra otevřenosti a uživateli generovaný obsah, je podstatné, aby tyto principy mohl využít každý, například i ten, který je nucen v důsledku svého zdravotního stavu používat vybavení speciální.
Otázka používání standardů a přístupnosti (accessiblity) při vytváření webových stránek je jedním z nejvíce diskutovaných problémů mezi webmastery. Na počátku všech problémů stojí velmi překotný vývoj webu v devadesátých letech minulého století, kdy ustoupila do pozadí původní myšlenka webové stránky jako celistvého dokumentu, který byl propojen s ostatními pomocí hypertextových odkazů. S postupující komercionalizací webu a s ní spojenými marketingovými aspekty byly do stránek přidávány elementy, které spíše než obsahovou funkci plnily funkci prezentační, s jejich použitím mohly být stránky uživatelsky přitažlivější. Protože se vývojáři jednotlivých prohlížečů snažili (např. Microsoft, Netscape) vyhovět těmto trendům co nejrychleji a protože konsorcium W3C1 nebylo schopné na tyto trendy rychle reagovat, byla do zobrazovacích jader prohlížečů implementována vlastní jednostranná řešení. Výsledkem byla vzájemná nekompatibilita při zobrazování jednotlivých zdrojů.

Bylo by asi dobré poznamenat, že se konsorcium vůbec v průběhu vývoje nechovalo příliš racionálně. Například navrhované standardy a jejich vývojové stupně postrádají logické návaznosti (nekompatibilita CSS, CSS2 a budoucího CSS3 atd.).

Počátek nového století (poté co splaskla internetová bublina a poté co se objevilo množství nových technologií) znamená návrat k původním myšlenkám webu. Je kladen důraz na oddělení formátovací části stránek od obsahové a dodržování sémantických vlastností jednotlivých značkovacích jazyků. Tím je umožněno například rozdílné zobrazení (naformátování) na mobilním zařízení při zachování stejného obsahu (tzn. fyzicky existuje jeden HTML/XHTML, XML dokument a větší množství instrukcí v podobě CSS souborů pro konečné zformátování). Dodržení sémantiky je vhodné zvlášť u systémů pro automatickou obsahovou analýzu – zejména u vyhledávačů, které jsou pak schopny zohlednit „důležitost“ jednotlivých prvků stránek2. Neméně důležité jsou pak sémantická struktura a oddělení formátování pro různé čtečky (např. pro zrakově postižené – screen readers) a optimalizace pořadí aktivních prvků stránky (hyperlinky, formuláře) pro snadnou navigaci v obsahu stránky bez pomoci myši (např. klávesou Tab) (Gibson, 2007).

Zároveň se objevuje opět princip „uzamčení“, kdy jsou výrobci prohlížečů bohužel nuceni zachovávat možnost zobrazení i nestandardizovaných obsahů, kterých je v prostředí internetu (kvůli zmíněnému překotnému vývoji) stále mnoho (mrtvé a již neaktualizované stránky se zajímavým obsahem). Autoři stránek tedy nejsou ničím nuceni, aby standardy dodržovali.

Bohužel stále není na světě standard, který by dokázal oddělit hlavní obsah stránky (ve smyslu hlavního podstatného sdělení) například od navigačních prvků nebo prvků doplňkových (např. stejná hlavička nebo zobrazení kontaktní adresy na všech stránkách sídla). Toho se možná dočkáme, například při použití mikroformátů, až v tzv. sémantickém webu (někdy bývá označován jako Web 3.0) (Skenák, 2007).

Zásadním dokumentem pro tvorbu webových stránek, který se po přelomu století objevil, je soubor doporučení pro tvorbu webových zdrojů Manifest Dogma W4 sepsaný skupinou českých vývojářů kolem výrazné osobnosti českého internetu Petra Staníčka (Pixy). Ačkoliv tento Manifest vznikl v roce 2003 a může se zdát zastaralý, autor této práce jej považuje za nadčasový a nepřekonaný. V dokumentu se například doporučuje striktní dodržování standardů značkovacích jazyků konsorcia W3C při plném zachování sémantických významů jednotlivých značek (tagů – například nepoužívání tabulek k formátování vzhledu stránky) a využití alternativních popisů pro netextové informace použité na stránkách (například atribut alt v tagu img).

Podívejme se nyní na reálné aplikování těchto principů v prostředí blogů. Při výběru analyzovaných blogů byly použity osobní archiv odkazů, statistika Top100 vyhledávače Technorati (první dva) a statistika kategorie „Weblogy“ webového počitadla navrcholu.cz (první dva). Analýza kódu proběhla pomocí služby W3C Markup Validation Service (W3CV), validátoru kaskádových stylů W3C CSS Validator (W3CCSS), přístupnost byla testována službou Site Valet (SV). Doplňkově byl proveden test pro extrakci sémantiky službou Semantic Data Extractor (SDE). Analyzována byla vždy hlavní stránka bez uživatelských komentářů, které by mohly (ale správně neměly) výsledky ovlivnit v případě vložení nevalidního kódu komentujícím.

Techcrunch: Blog zabývající se internetem a novými technologiemi. Testováno 12. 4. 2008, 21.22.

  • W3CV: Použitý Doctype: XHTML 1.0 Transitional, 99 chyb – mnoho chyb způsobených nezakódováním speciálních znaků v URL adresách, ale objevují se i neplatné atributy, některé atributy scházejí úplně.
  • W3CCCS: 4 chyby.
  • SV: Stránka testem neprošla, ze zásadních chyb: chybí údaj o použitém jazyku, některé odkazy jsou otevírány do zvláštního okna prohlížeče bez předchozího upozornění uživatele, chybí textové alternativní popisy obrázků a objektů.
  • SDE: Test neproveden, nevalidní kód.

Engadget: Blog vlastněný společností AOL, zabývá se novými technologiemi. Testováno 12. 4. 2008, 23.06.

  • W3CV: Použitý Doctype: XHTML 1.0 Transitional, 164 chyb – např. není definován atribut type u javascriptových kódů, chybné kódování URL, chybějící uvozovky u atributů atd.
  • W3CCCS: 27 chyb.
  • SV: Stránka testem neprošla, ze zásadních chyb: tabulky nemají vyžadované záhlaví, chybí údaj o použitém jazyku, u některých formulářů chybí tlačítko pro odeslání, chybí metadata v záhlaví stránky (autor atd.).
  • SDE: Test neproveden, nevalidní kód.

Maxiorel.cz: Český magazínový blog o softwaru, poradenství a webových stránkách. Testováno 13. 4. 2008, 11.02.

  • W3CV: Použitý Doctype: XHTML 1.0 Transitional, 25 chyb – např. neukončené tagy, špatná sémantika (zdvojené tagy).
  • W3CCCS: Stránka je plně validní.
  • SV: Stránka testem neprošla, ze zásadních chyb: u formulářů chybí popis textových prvků pomocí
  • SDE: Test neproveden, nevalidní kód.

Marigold.cz: Osobní blog Patricka Zandla. Testováno 13. 4. 2008, 11.10.

  • W3CV: Použitý Doctype: XHTML 1.0 Transitional, 186 chyb – např. neukončené tagy, chybějící uvozovky u atributů, chybné kódování URL.
  • W3CCCS: 15 chyb.
  • SV: Stránka testem neprošla, ze zásadních chyb: chybějící záhlaví a popis u tabulek, pro formátování je užit tag font.
  • SDE: Test neproveden, nevalidní kód.

A List Apart: Magazínový blog o tvorbě www stránek. Testováno 13. 4. 2008, 11.25.

  • W3CV: Použitý Doctype: XHTML 1.0 Transitional, stránka plně validní.
  • W3CCCS: Stránka je plně validní.
  • SV: Stránka testem prošla s výhradami.
  • SDE: Sémantika byla analyzována, ovšem chybí některé navigační prvky.

Testovány byly i další náhodně vybrané blogy se stejnými výsledky. Jejich obsah ve velké většině není validní, výjimky tvoří pouze některé blogy, které se zabývají tvorbou webových stránek. V některých případech je nevalidita způsobena chybami v jed¬notlivých příspěvcích, v některých případech je nevalidní celá stránka. Nevalidita příspěvků by se snadno dala odstranit zabudováním vnitřního parseru do blogovací aplikace, jehož kontrolním mechanizmem by prošly všechny publikované příspěvky. Tím jsou nevalidní prvky buď automaticky opraveny, anebo nejsou publikovány. V případě nevalidity mimo příspěvky jde o nedbalost webmasterů, kteří zřejmě spoléhají na to, že většina prohlížečů obsah jejich blogů beztak zobrazí.

  1. Jehož hlavním posláním je vývoj standardů pro internet.
  2. Což je pak snadno „zneužitelné“ disciplínou SEO (optimalizace stránek pro vyhledávače). Je otázkou, nakolik by měl vyhledávač být strojový a nakolik by měl simulovat při posuzování důležitosti reálné zobrazení pro člověka/uživatele.