Spam de blog

Cet article est uneébaucheconcernantInternet.

Vous pouvez partager vos connaissances en l’améliorant (comment?) selon les recommandations desprojets correspondants.

Unspam de blogoupourriel dans un blogueest un commentaire affiché dans unblogqui a pour objectif, non pas de commenter l'article du blog, mais bien de faire la promotion d'une idée, d'un produit, d'unsite Webou d'afficher unhyperlienvers un site dans le but d'améliorer le positionnement de ce site dans les résultats desmoteurs de recherche.

Lorsque le spam dans un blogue contient un hyperlien dans le but de tromper les moteurs de recherche, il s'agit deréférencement abusifqui peut entraîner le déclassement ou la suppression du site des résultats de recherche si le moteur de recherche démasque la manœuvre.

Historique

Ce type de spam est apparu originellement dans leslivres d'or Internet,où des spammeurs inscrivaient deshyperliensvers les sites qu'ils voulaient promouvoir pour améliorer leur positionnement dans les résultats des moteurs de recherche, sans y inscrire de commentaires ou en incluant un commentaire générique commebeau site,félicitations pour ce site,etc.

En 2003, les spammer ont commencé à tirer avantage de l'introduction de commentaires ouverts dans les blogs commeMovable Typepour y inscrire des liens vers les sites qu'ils voulaient promouvoir. Jay Allen a alors créé unplug-ingratuit appeléMT-BlackListpour s'attaquer à cette pollution dans les blogsMovable Type^[1].

Aujourd'hui, les logiciels de blogs contiennent des algorithmes pour tenter de détecter et d'éliminer ces spams. L'apparition de ces algorithmes a déclenché une guerre entre les spammeurs et les blogs, les premiers tentent de contourner les défenses des blogs alors que ceux-ci tentent de bloquer les failles exploitées.

Mesures de prévention

Les mesures suivantes sont mises en place à différents degrés sur les blogs, les forums, les livres d'or, et les autres outils où les internautes sont invités à laisser des commentaires pour éliminer, ou à tout le moins, réduire les spams.

Interdiction d'hyperliens dans les commentaires

La très grande majorité des spams de blog contiennent deshyperliens.On peut éliminer ces commentaires indésirables en interdisant les hyperliens dans les commentaires. Malheureusement, cette technique réduit considérablement la qualité des commentaires.

Interdiction de commentaires en rafale

Les spammeurs soumettent parfois de multiples commentaires sur le même article ou soumettent des commentaires sur leurs propres commentaires^[2].Il est possible de bloquer certains de ces commentaires en rafale en interdisant les commentaires multiples en provenance de la mêmeadresse IP.

Cette mesure a toutefois des effets secondaires indésirables et elle n'est pas très efficace. En effet, cette mesure affectera aussi des utilisateurs légitimes situés derrière le mêmeserveur mandataire(proxy) qui veulent commenter le même article. De plus, les spammeurs peuvent soumettre leurs commentaires en simulant de fausses adresses IP et ainsi déjouer l'interdiction de commentaires en rafale^[3].

Une variante de cette mesure consiste à exiger un certain laps de temps entre deux commentaires, ce qui perturbe les bots informatiques qui soumettent un grand nombre de commentaires dans un court laps de temps.

Blocage de mots-clés

Le blocage demots-clésest une des méthodes les plus simples et les plus efficaces pour réduire le spam dans les blogs. En effet, une grande quantité de spams peut être éliminée simplement en bannissant les commentaires contenant des noms de produits pharmaceutiques populaires (Viagra,Cialis,etc.) ou des noms decasino en ligne.

Cette mesure est d'autant plus efficace que les spammeurs n'ont pas intérêt à modifier l'orthographede ces mots, car alors ils ne seraient pas reconnus par les moteurs de recherche.

Certains logiciels de blog permettent d'accéder à unflux RSSdes commentaires récents. En ajoutant un détecteur de mots-clés indésirables au lecteur de flux, un blogueur peut être avisé de commentaires contenant ces mots-clés et il peut les supprimer rapidement.

Utilisation de l'attributrel= "nofollow"

Article principal:nofollow.

Au début de 2005,Googlea annoncé que les hyperliens avec l'attributrel= "nofollow"seraient ignorés par son moteur de recherche, c'est-à-dire que ces liens ne seraient pas suivis et n'influenceraient pas le positionnement des résultats de recherche^[4].

Aujourd'hui, la plupart deslogicielsde blogs marquent les hyperliens des commentaires soumis par des internautes avec l'attributrel= "nofollow".Certains blogs plus sophistiqués n'incluent pas l'attribut dans les commentaires des internautes de confiance (par exemple, ceux qui sont inscrits au blogue depuis une longue période de temps).

Certains blogueurs n'apprécient pas l'ajout de l'attributrel= "nofollow"aux commentaires parce qu'ils estiment que

cet attribut diminue la valeur des commentaires légitimes^[5]
et, malgré l'ajout de cet attribut, les spammeurs continuent à insérer des spams dans les blogs dans le but d'inciter les lecteurs à visiter les sites publicisés par leurs commentaires.

Validation de l'humanité du commentateur

La très grande majorité des spams dans les blogs sont soumis par desbots informatiques(programmes informatiques) et non par des humains. Il est possible de réduire ces commentaires indésirables en obligeant le commentateur à résoudre un problème qui peut facilement être résolu par un humain, mais qu'un robot peut difficilement résoudre. Un testCAPTCHAest souvent utilisé à cet effet. Il s'agit d'un test où il faut copier une liste de lettres déformées. Un humain peut lire les lettres relativement facilement alors qu'un bot informatique peut difficilement le faire.

Malheureusement, leswebmestresont constaté que les commentaires légitimes diminuent lorsque des tests sont ajoutés au formulaire de soumission de commentaires. Comme les spams dans les blogs contiennent presque toujours des hyperliens, on peut réduire l'effet dissuasif des tests d'humanité en proposant un formulaire de commentaire sans test au visiteur et en le soumettant à un test uniquement si le commentaire qu'il a soumis contient un hyperlien.

Redirection d'URL

Plutôt que d'inclure l'hyperlien proposé directement dans un commentaire, le site peut inclure un hyperlien vers unscriptsur son site qui redirigera vers l'hyperlien proposé. L'hyperlien proposé sera alors sans effet sur l'algorithme de positionnement des résultats des moteurs de recherche. Cette solution a donc un effet semblable à l'attributrel= "nofollow".Cette méthode a l'avantage additionnel de permettre au script de compter le nombre de lecteurs cliquent sur des hyperliens externes lors de leur visite.

Utilisation de numéro de série

Les blogs peuvent inclure un numéro de série dans le formulaire de commentaire soumis à un visiteur et accepter un seul commentaire par numéro de série valide. Cela complique la vie des spammeurs qui génèrent des commentaires en rafale sans demander un formulaire de commentaire pour chaque commentaire soumis.

Modération des commentaires

Article principal:Modération d'informations.

Plusieurs blogsmodèrent les commentairesavant de les publier, c'est-à-dire que les commentaires sont revus et approuvés par un humain avant d'être affichés. D'autres blogs modèrent les commentaires après publication, c'est-à-dire que les commentaires sont affichés sans revue, mais un modérateur revoit régulièrement les commentaires et élimine les commentaires indésirables. Dans certains cas, les blogs demandent à leurs visiteurs d'agir comme modérateurs et de signaler les commentaires indésirables.

Il est évidemment possible d'utiliser une combinaison des mécanismes mentionnés précédemment. Par exemple, les commentaires d'un visiteur régulier ou enregistré peuvent être affichés sans revue alors que les commentaires d'un nouveau visiteur seront revus avant d'être publiés.

Enregistrement des commentateurs

La quasi_totalité des blogs n'acceptent des commentaires que des personnes enregistrées. Lors de l'enregistrement, divers tests peuvent être effectués pour s'assurer que le commentateur n'est pas unbot informatique:CAPTCHA,question de connaissance usuelle commequelle est la couleur de la neige?,envoi d'uncourrielavec demande de confirmation d'enregistrement, etc.

Certains administrateurs revoient même individuellement les demandes d'enregistrement avant de les autoriser. Dans ces cas, les administrateurs valident attentivement les demandes d'enregistrement provenant dedomaines(comme.ru,.br,.biz) ou de pays (comme laRussie) d'où proviennent beaucoup de spams.

Utilisation obligatoire d'Ajax

Certains blogs permettent uniquement la soumission de commentaires à travers une requêteAjax,donc d'une requête venant d'unepage Webet non d'unbot informatique.

Pour le moment cette technique est efficace. Toutefois, comme il s'agit d'une technique desécurité par l'obscurité,elle pourra être contournée lorsqu'elle deviendra populaire étant donné qu'il s'agit essentiellement d'une différente façon de coder le commentaire.

Techniques antispam spécifiques à des applications

Comme les spammeurs attaquent plus particulièrement les blogs populaires commeMovable TypeetMediaWiki,ces blogs ont développé leurs propres techniques antispam. Ces techniques incluent plusieurs des techniques mentionnées plus haut comme deslistes blanches,deslistes noireset des filtres et des tests. Le but de ces techniques est de bloquer les commentaires indésirables tout en ne compliquant pas la vie des visiteurs légitimes et en permettant les hyperliens qui constituent une partie importante des commentaires.

Approche coopérative

Une approche coopérative apparue vers 2004 donne aujourd'hui de bons résultats. Pour ne pas éveiller les soupçons, les spammeurs laissent souvent un seul hyperlien indésirable dans un blogue. Il est difficile pour le blogue de conclure que l'hyperlien est indésirable avec si peu d'information. Par contre, un programme informatique qui aurait accès à plusieurs des commentaires publiés par le spammeur identifierait rapidement la répétition des hyperliens indésirables et pourrait informer les blogs de supprimer les commentaires contenant ces hyperliens.

Cette approche coopérative a été implantée dans divers logiciels commeLinkSleeve^[6],Akismet^[7],etTypePad AntiSpam.

Source

(en)Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé«Spam in blogs»(voir la liste des auteurs).

Références

↑(en)«MT-Blacklist - A Movable Type Anti-spam Plugin», Jayallen.org(consulté le9 janvier 2012)
↑(en)«Matthew1471's ASP BlogX - 5 things you probably did not know about the spammers who spam your website», Blogx.co.uk,14 août 2008(consulté le9 janvier 2012)
↑IIsForInclude.org - Blog spam gets ramped up.
↑(en)«Links in HTML documents», W3.org(consulté le9 janvier 2012)
↑(en)Posted by jzawodn at May 30, 2006 06:59 AM, «Nofollow No Good? (by Jeremy Zawodny)», Jeremy.zawodny.com,30 mai 2006(consulté le9 janvier 2012)
↑(en)«SLV: Spam Link Verification», LinkSleeve(consulté le9 janvier 2012)
↑(en)«WordPress › Blog » WordPress 2», Wordpress.org(consulté le9 janvier 2012)

[1] (en)«MT-Blacklist - A Movable Type Anti-spam Plugin», Jayallen.org(consulté le9 janvier 2012)

[blogx.co.uk-2] (en)«Matthew1471's ASP BlogX - 5 things you probably did not know about the spammers who spam your website», Blogx.co.uk,14 août 2008(consulté le9 janvier 2012)

[http://iisforinclude.org/Romanasblog/?p=250-3] IIsForInclude.org - Blog spam gets ramped up.

[4] (en)«Links in HTML documents», W3.org(consulté le9 janvier 2012)

[5] (en)Posted by jzawodn at May 30, 2006 06:59 AM, «Nofollow No Good? (by Jeremy Zawodny)», Jeremy.zawodny.com,30 mai 2006(consulté le9 janvier 2012)

[6] (en)«SLV: Spam Link Verification», LinkSleeve(consulté le9 janvier 2012)

[7] (en)«WordPress › Blog » WordPress 2», Wordpress.org(consulté le9 janvier 2012)

[1]

[2]

[3]

[4]

[5]

[6]

[7]