<?xml version="1.0" encoding="UTF-8"?>
<!-- generator="wordpress/2.3.3" -->
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	>

<channel>
	<title>Web 2.0 a blogy &#187; Identifikace a vyhledávání informací na blozích</title>
	<link>http://dp.pleska.net</link>
	<description>Ukázkový blog</description>
	<pubDate>Sun, 18 May 2008 21:04:49 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.3.3</generator>
	<language>cs</language>
			<item>
		<title>Identifikace a vyhledávání informací na blozích</title>
		<link>http://dp.pleska.net/identifikace-a-vyhledavani-informaci-na-blozich/</link>
		<comments>http://dp.pleska.net/identifikace-a-vyhledavani-informaci-na-blozich/#comments</comments>
		<pubDate>Sun, 20 Apr 2008 17:59:40 +0000</pubDate>
		<dc:creator>Nikola Pleska</dc:creator>
		
		<category><![CDATA[Blogy]]></category>

		<category><![CDATA[Identifikace a vyhledávání informací na blozích]]></category>

		<category><![CDATA[api]]></category>

		<category><![CDATA[blog]]></category>

		<category><![CDATA[identifikace]]></category>

		<category><![CDATA[sociální sítě]]></category>

		<category><![CDATA[vyhledávání]]></category>

		<category><![CDATA[Web 2.0]]></category>

		<guid isPermaLink="false">http://dp.pleska.net/identifikace-a-vyhledavani-informaci-na-blozich/</guid>
		<description><![CDATA[Identifikace a vyhledávání informací na blozích
Při rychlosti, kterou se dokáže šířit informace blogosférou, je podstatná role speciálních vyhledávačů v blozích a aplikací pro „popularizaci obsahu“. Takových služeb je celá řada, proto si zkusme na příkladech alespoň popsat jejich základní funkcionality. Jednou pro všechny společnou je vytvoření seznamu populárních příspěvků v blogosféře, který informuje uživatele, o [...]]]></description>
			<content:encoded><![CDATA[<p>Identifikace a vyhledávání informací na blozích<br />
Při rychlosti, kterou se dokáže šířit informace blogosférou, je podstatná role speciálních vyhledávačů v blozích a aplikací pro „popularizaci obsahu“. Takových služeb je celá řada, proto si zkusme na příkladech alespoň popsat jejich základní funkcionality. Jednou pro všechny společnou je vytvoření seznamu populárních příspěvků v blogosféře, který informuje uživatele, o čem se aktuálně nejvíc píše. Takový druh aplikace se nazývá memetracker.<br />
Jednoznačná výhoda speciálních vyhledávacích služeb je především v rychlém zaindexování obsahu. Běžné crawlery nespecializovaných vyhledávačů nenavštěvují webová sídla v pravidelných intervalech a nemusí zaindexovat všechny jejich stránky, takže nemohou ve výsledcích hledání nabídnout vždy aktuální informace.</p>
<p><strong>Blogdex</strong><br />
Průkopníkem na tomto poli byl, dnes už nefunkční, Blogdex. V rámci univerzitního výzkumu byl navržen algoritmus, který vyhodnocoval blogové zdroje podle počtu citací jinými blogy a zároveň aktuálností těchto citací. Blogy byly indexovány automaticky pomocí crawleru. Výsledkem tohoto algoritmu byl zmíněný seznam, který sloužil blogerům jednak k ověření, jak si stojí jejich blog mezi jinými, ale také jako zdroj aktuálních témat a inspirace pro psaní vlastních příspěvků. Blogdex skončil v květnu 2006, přesto je dobré jej zmínit jako první aplikaci svého druhu.</p>
<p><strong><a href="http://www.technorati.com">Technorati</a></strong><br />
Velmi podobně funguje speciální vyhledávač Technorati, který již byl zmíněn v souvislosti s odhadem velikosti blogosféry o něco výše. Pro indexování blogových zdrojů využívá speciální funkcionalitu tzv. pingu. Jde o mechanizmus, pomocí kterého publikační systém upozorňuje indexační server, že byl uveřejněn nový příspěvek. Indexační server ihned po upozornění může příspěvek indexovat. Tím se snižuje doba, za kterou se příspěvky mohou objevit ve výsledcích vyhledávání. Vyhledávač Technorati nevyužívá pro indexaci samotné příspěvky, ale používá ke stažení informací <a href="http://dp.pleska.net/agregacni-a-syndikacni-technologie">agregační formáty RSS nebo ATOM</a>.</p>
<p>Jednotlivé blogy jsou hodnoceny ze dvou hledisek. Z hlediska autority (Authority), což je počet ostatních blogů citujících blog (počet blogů, které odkazují na blog) za posledních šest měsíců. A s ohledem na pozici (Rank), což je počet blogů, které dělí blog od toho s nejvyšší autoritou. Tedy máme-li nejvyšší autoritu (nejvyšší číslo), máme i nejvyšší pozici (č. 1) (<a href="http://technorati.com/weblog/2007/05/354.html">Carroll</a>, 2007). Za pomoci těchto výpočtů je stanoveno pořadí <a href="http://www.technorati.com/pop/blogs">Top 100</a> (nejlepších 100) dle jejich autority.</p>
<p>Pohybovat se můžeme v systému (mimo jiné) v rámci šesti základních kategorií (např. Technology), které se dále mohou dělit na podkategorie (např. Gadgets). Hledání je možné, krom fulltextu, přes tagy, které jsou automaticky převzaty ze zdroje nebo jsou zadávany uživateli. U tagů je k dispozici graf četnosti jejich výskytu za posledních třicet dní a seznam příbuzných tagů pro zpřesnění hledání. Výsledky lze řadit podle jejich čerstvosti nebo dle pozornosti jim věnované.</p>
<p>Technorati prošlo za rok 2007 několika bouřlivými změnami, které, subjektivně hodnoceno, celému systému neprospěly. Jednotlivé navigační stránky se znepřehlednily a uživatel není řádně informován, co si má vlastně v systému počít. Do ústraní také ustoupil ze všech indexovaných zdrojů generovaný tag cloud, jenž vypovídal velmi dobře o aktuálních trendech (nyní pouze seznam nejvíce hledaných pojmů). <a href="http://www.alexa.com/data/details/traffic_details/technorati.com">Křivka statistiky návštěvnosti</a> vyhodnocovaná službou Alexa od začátku roku 2007 vytrvale klesá. <sup class='footnote'><a href='#fn-54-1' id='fnref-54-1'>1</a></sup><br />
Technorati se na svých stránkách hlásí k podpoře otevřeného software a nabízí API s možností využití dat ze svého systému.</p>
<p><strong><a href="http://www.digg.com">Digg</a></strong><br />
Memetracker Digg využívá k sestavení žebříčku populárních příspěvků vstupy od uživatelů. Každý uživatel má možnost vložit zajímavý odkaz na příspěvek, který se zařadí na Upcoming seznam, kde mají registrovaní uživatelé možnost hlasovat, zda chtějí zařadit odkaz do seznamu populárních odkazů. Tam je zařazen ve chvíli, kdy dosáhne určitého počtu hlasů. Při sestavování žebříčku je též brán ohled na dobu vzniku příspěvku, což znamená, že jako první v seznamu nemusí být nutně ten s největším počtem hlasů.  V ČR funguje podobná služba <a href="http://www.linkuj.cz">linkuj.cz</a>.</p>
<p>Jednotlivé odkazy jsou zařazovány dle typu (zprávy, videa, obrázky, podcasty) a pak do šesti základních kategorií s dalšími podkategoriemi a jsou zobrazeny ve formě tzv. článku (Article) s krátkým popisem a možností komentování. Digg je také sociální sítí, kde je možné vytvořit si seznam Přátel, jimi vložené odkazy se pak zobrazují zvýrazněně.</p>
<p>Digg dává možnost uživatelům hlasovat proti příspěvku (doslova pohřbít – Bury it). Jeho původní funkcí bylo jakési „samočištění“, aby se zamezilo vkládání spamu či nesmyslných odkazů. V kritice této služby bývá zmiňováno, že se objevuje klasický Long tail: malý počet uživatelů generuje nejvíc odkazů, které se objevují v populárním seznamu. Což v důsledku vede k jednostrannosti příspěvků. Projevuje se také princip „uzamčení“ (viz kapitola o sítových efektech), kdy se populární příspěvky stávají ještě populárnější. </p>
<p>Digg dává k dispozici otevřené API a sadu nástrojů pro hlasování přímo na straně blogu.</p>
<div class='footnotes'><div class='footnotedivider'></div><ol><li>Což nemusí být nutně důsledek změn na Technorati, ale kupříkladu toho, že se velké vyhledávací společnosti naučily lépe indexovat blogy. <span class='footnotereverse'><a href='#fnref-54-1' id='fn-54-1'>&#8617;</a></span></li></ol></div>]]></content:encoded>
			<wfw:commentRss>http://dp.pleska.net/identifikace-a-vyhledavani-informaci-na-blozich/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Trackbacky a pingbacky</title>
		<link>http://dp.pleska.net/trackbacky/</link>
		<comments>http://dp.pleska.net/trackbacky/#comments</comments>
		<pubDate>Sun, 20 Apr 2008 17:58:16 +0000</pubDate>
		<dc:creator>Nikola Pleska</dc:creator>
		
		<category><![CDATA[Blogy]]></category>

		<category><![CDATA[Identifikace a vyhledávání informací na blozích]]></category>

		<category><![CDATA[blog]]></category>

		<category><![CDATA[indentifikce]]></category>

		<category><![CDATA[vyhledávání]]></category>

		<category><![CDATA[Web 2.0]]></category>

		<guid isPermaLink="false">http://dp.pleska.net/trackback/</guid>
		<description><![CDATA[Trackback byl navržen pro snadnou identifikaci propojení (nebo citace, chcete-li) souvisejících webových stránek. Jeho specifikace vzešla od předního poskytovatele blogovacího software MovableType, společnosti SixApart. V případě, že  bloger A (1) cituje ve svém příspěvku (2) příspěvek blogera B, tak software blogera A automaticky zašle upozornění o citaci softwaru blogera B (3), který může u [...]]]></description>
			<content:encoded><![CDATA[<p>Trackback byl navržen pro snadnou identifikaci propojení (nebo citace, chcete-li) souvisejících webových stránek. Jeho specifikace vzešla od předního poskytovatele blogovacího software <a href="http://www.movabletype.com">MovableType</a>, společnosti SixApart. V případě, že  bloger A (1) cituje ve svém příspěvku (2) příspěvek blogera B, tak software blogera A automaticky zašle upozornění o citaci softwaru blogera B (3), který může u příspěvku blogera B vytvořit zpětný link (4) (<a href="http://seclab.cs.rice.edu/proj/trackback/papers/taking-trackback-back.pdf">Gerecht</a>, 2006). </p>
<p><img src="http://dp.pleska.net/wp-content/uploads/2008/04/trackbacks2.png" alt="Schéma trackback funkcionality" /><br />
Obrázek 15 – Schéma trackback funkcionality</p>
<p>Pro zaslání takového upozornění se používá požadavku POST protokolu HTTP s tím, že musí obsahovat minimálně URL/URI původce požadavku. Další volitelná pole pro zaslání jsou název a krátký výtah v HTML formátu. Po přijetí takového požadavku může být zobrazen na straně citovaného zdroje speciálně formátovaný komentář s těmito zaslanými informacemi. Tím jsou bloger a jeho čtenáři upozorněni na další související zdroje zabývající se např. stejným tématem.</p>
<p>V praxi je velmi často zneužíváno programových rozhraní pro automatický příjem trackbacků pro zasílání spamu, kdy je blog zneužíván automatickým uveřejňováním odkazů k ošálení algoritmů jako Page Rank ke zlepšení viditelnosti ve vyhledávačích. V roce 2005 bylo doporučeno, aby blogerské softwary uváděly při odkazování na stránky HTML tagem <code>&lt;a&gt;</code> parametr <code>"nofollow"</code> u atributu <code>rel</code>, a upozornily tím vyhledávač, že nemají s uvedeným URL dále pracovat.</p>
<p>Pingback funguje na podobném principu jako trackbacky s tím rozdílem, že namísto HTTP POST požadavku je vysílán speciálně formátovaný požadavek XML-RPC, který ovšem obsahuje pouze zdrojové URL/URI bez dalších informací. Hlavní určení je upozornit (tzv. ping) na nový příspěvek či na změnu zdroje na straně vysílatele. Speciální vyhledávače typu Technorati po obdržení takového požadavku navštíví poskytnuté URL/URI k jeho zaindexování. Aby bloger nebyl nucen vést v patrnosti všechny služby, které dokáží s jeho upozorněním pracovat, existují služby, které se postarají o rozeslání na více služeb najednou, například <a href="http://www.ping-o-matic.com">Ping-o-matic</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://dp.pleska.net/trackbacky/feed/</wfw:commentRss>
		</item>
	</channel>
</rss>
