Archiv tagů spam

Komentářový spam

Velkým problémem, se kterým se vlastník blogu musí vyrovnat, je značné množství komentářového spamu či spamu přicházejícího přes trackbacky. Automatičtí spamoví roboti parazitují na blozích tím, že se snaží k příspěvkům připojit nerelevantní komentář s URL adresou. Cílem může být pouze reklama určitých stránek (většinou neodolatelné nabídky na přípravky pro vylepšení anatomie), ale ve většině případů se jedná o případ tzv. spamdexingu, kdy se spameři snaží ovlivnit výsledky vyhledávání ve vyhledávacích službách. Z vlastní zkušenosti mohu uvést číslo na malém a neznámém blogu, kdy speciální filtr za rok provozu zablokoval přes 50 000 pokusů o komentářový spam.

Jednu z možností (nepříliš úspěšnou), jak bojovat proti spamerům, uvádím v kapitole o trackbacku, dalších možností je celá řada. Zmíním pouze dvě relativně nejúspěšnější. Nejvíce se asi osvědčila, ze subjektivního pohledu pro uživatele trochu obtěžující metoda, validace, kdy je zjišťováno, zda komentář zadává lidská bytost a ne spamový robot. Nejčastěji bývá použita technika CAPTCHA, která na straně serveru generuje náhodnou sadu znaků či číslic, která se uživateli objeví na obrazovce ve formě obrazové informace. Uživatel je nucen před odesláním svého komentáře přepsat tuto informaci do textového pole. Využívá se neschopnosti robotů (narozdíl od člověka) zobrazenou informaci „přečíst“. Další možností je již zmíněná filtrace komentářů za pomoci expertních systémů, např. Akismet. Při každém pokusu o vložení komentáře je jeho obsah porovnán se speciální databází „známých“ spamů a spamerů. V případě shody není pak publikován a je uložen v tzv. karanténě, dokud jej uživatel ručně neschválí nebo nesmaže. Zbývá dodat, že databáze Akismet vzniká pomocí „samoučícího se“ mechanizmu za vydatné pomoci blogerů a lze tedy pozorovat klasický síťový efekt: čím více lidí ho používá a učí, tím lépe pracuje. Počty zachyceného spamu jsou k nalezení na serveru Akismet.

Spam blogy aneb splogy

Ve své zprávě o stavu blogosféry z dubna 2007 vyhledávací služba Technorati uvádí, že každý den vzniká 3 000 až 7 000 nových spam blogů. Účel je stejný jako v případě komentářového spamu – zviditelnění ve vyhledávačích. Z velké části parazitují na web-based aplikacích (Blogger, LiveJournal), kde se automaticky (nebo ručně) registrují jako falešní uživatelé a vytvářejí spamové příspěvky, případně generují falešná upozornění (spings) pro vyhledávací služby o změně obsahu. V mnohých případech je jako kamufláž používáno RSS feedů, pomocí nichž načítají spameři obsahy regulérních blogů, do kterých pak přimíchávají spam.