





<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>ø Carnet Web d&#039;un Vieux Con ø &#187; spam</title>
	<atom:link href="http://www.pagasa.net/tag/spam/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.pagasa.net</link>
	<description>Quand l&#039;espoir vient de l&#039;optimisme</description>
	<lastBuildDate>Tue, 27 Jul 2010 13:12:10 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Blackhat: la grosse méchante bouillie</title>
		<link>http://www.pagasa.net/blackhat-mechante-bouillie/</link>
		<comments>http://www.pagasa.net/blackhat-mechante-bouillie/#comments</comments>
		<pubDate>Wed, 10 Feb 2010 19:58:34 +0000</pubDate>
		<dc:creator>Thibaut</dc:creator>
				<category><![CDATA[blackhat]]></category>
		<category><![CDATA[technique]]></category>
		<category><![CDATA[autogenere]]></category>
		<category><![CDATA[expérience]]></category>
		<category><![CDATA[scrapper]]></category>
		<category><![CDATA[spam]]></category>
		<category><![CDATA[trackback]]></category>

		<guid isPermaLink="false">http://www.pagasa.net/?p=1025</guid>
		<description><![CDATA[Il y a quelques années, un Blackhatter américain, génialissime nous gratifiait régulièrement de techniques innovantes, sorties tout droit d&#8217;une imagination débordante. Il m&#8217;a beaucoup inspiré dans certains de mes &#171;&#160;coups&#160;&#187; et dans sa démarche, je retrouve des qualités que j&#8217;apprécie tout particulièrement, comme le refus de l&#8217;establishment, l&#8217;extrême témérité du discours sur l&#8217;argent ainsi qu&#8217;un [...]]]></description>
			<content:encoded><![CDATA[<p>Il y a quelques années, un Blackhatter américain, génialissime nous gratifiait régulièrement de techniques innovantes, sorties tout droit d&#8217;une imagination débordante. Il m&#8217;a beaucoup inspiré dans certains de mes &laquo;&nbsp;coups&nbsp;&raquo; et dans sa démarche, je retrouve des qualités que j&#8217;apprécie tout particulièrement, comme le refus de l&#8217;establishment, l&#8217;extrême témérité du discours sur l&#8217;argent <span style="text-decoration: line-through;">ainsi qu&#8217;un langage de charretier</span>.</p>
<p>C&#8217;est en faisant un peu de tri l&#8217;autre jour sur une de mes machines infernales, que je suis retombé sur la relique de l&#8217;un de ces coups. Comme ceci remonte à 3 ans déjà, j&#8217;en profite pour vous dévoiler ce coup et y apporter une analyse. Avec le temps, on murit et on est certainement plus critique quand à ses expériences passées.</p>
<p>L&#8217;idée était toute simple et maintes fois réutilisée: automatiser la création d&#8217;un site, rediriger le trafic vers ma Money Page, l&#8217;URL qui me permet d&#8217;acheter des Petshops à ma petite fille, puis multiplier cela à l&#8217;infini.</p>
<p>La création se faisait tout simplement via un bête script en PHP: depuis un dictionnaire anglais, je construisais des phrases à partir de mots tirés aléatoirement. Cela faisait une belle grosse méchante bouillie, incompréhensible bien entendu par le commun des mortels; mais je m&#8217;en moquais, étant donné que ces pages n&#8217;étaient là que pour nourrir mes amis, les moteurs de recherche.</p>
<p>A l&#8217;époque, ce n&#8217;était pas grave d&#8217;avoir des pages avec des contenus irrationnels, plein de gens le faisaient; depuis lors, de nouvelles lois ont été votées par ceux qui font la pluie et le beau temps sur la cyber-planète.<br />
Dans une page, j&#8217;incorporais quelques liens vers d&#8217;autres pages qui se construisaient au fur et à mesure des visites. Si bien qu&#8217;au bout de quelques temps, je me suis retrouvé avec plusieurs centaines de pages auto générées.</p>
<p>Ces pages étaient quand même optimisées grâce à une astuce du très productif Blackhatter cité en début de l&#8217;article. Un agrégateur Web mettait à disposition une liste de blogs fraichement mis à jour, et il me suffisait d&#8217;aller récupérer régulièrement ces informations et de les utiliser pour construire mes pages. Ce qu&#8217;il faut savoir, c&#8217;est qu&#8217;un nombre impressionnant de scrapers utilisait cet agrégateur pour pratiquer en masse le spam à base de Trackback: vous publiez un article sur le viagra, et immédiatement la moitié de la planète des spammeurs vous pingeront avec comme espoir d&#8217;obtenir un retour sur leur Trackback. En clair, les spammeurs vous construisent gracieusement vos liens !</p>
<p>Parallèlement, un autre script construisait toutes les heures un feed RSS à partir du site auto généré, et lançait quelques pings vers des sites comme <a title="Pingomatic" href="http://www.pingomatic.com" target="_blank">pingomatic.com</a> afin de faire venir les moteurs de recherche.</p>
<p>Je ne peux pas dire que les liens se construisaient rapidement avec cette méthode; en fait, c&#8217;était bien en dessous de mes attentes et des affirmations du collègue.</p>
<p><span style="text-decoration: underline;">Proverbe Blackhat</span>: lorsque quelqu&#8217;un dévoile une nouvelle technique,<br />
c&#8217;est qu&#8217;elle est déjà périmée depuis belle lurette.</p>
<p>Néanmoins, j&#8217;arrivais à faire venir des visiteurs, essentiellement grâce à la longue traine et <a title="Blogsearch" target="_blank" href="http://blogsearch.google.com/?hl=en&amp;tab=wb">Blogsearch</a>. Les visiteurs étaient alors redirigés vers la money page, un produit &laquo;&nbsp;Rock&amp;Roll&nbsp;&raquo; à télécharger.</p>
<p>Je suis alors passé à la vitesse supérieure, en créant une grande quantité de sous-domaines. Dans les bons jours, j&#8217;arrivais à générer plusieurs centaines de visiteurs, toujours grâce à Blogsearch. En multipliant toujours les domaines, je serai rapidement arrivé au millier de visiteurs, j&#8217;en suis convaincu.</p>
<p>Un jour, j&#8217;ai eu la visite de la Quality Team, et une semaine après l&#8217;ensemble du domaine ainsi que tous les sous-domaines ont été blacklistés.</p>
<p>Le site hébergeant la money Page n&#8217;a pas été pénalisé, mais Google m&#8217;a demandé d&#8217;y retirer les Adsenses, car jugé trop &laquo;&nbsp;Rock&amp;Roll&nbsp;&raquo;. Pas porno, ni même érotique mais un peu limite quand même, je dois bien le reconnaitre après coup.</p>
<p>Au final, certes j&#8217;y ai gagné de l&#8217;argent, mais comme tout projet BlackHat, cela restera un simple coup et une expérience bien amusante.</p>
<p>Mais cela reste formateur, et j&#8217;ai appris beaucoup de choses:</p>
<p>- Tout d&#8217;abord, la durée: il se sera passé 3 mois entre le lancement du projet et le bannissement. Cela laisse quand même du temps pour faire rapidement de l&#8217;argent. Mais encore une fois, vivre sur ce genre de coup me laisse perplexe. Et puis, comme je l&#8217;ai déjà expliqué, je suis convaincu qu&#8217;un site banni peut avoir des conséquence sur le profiling d&#8217;un Webmaster par Google dans le futur.</p>
<p>- Des erreurs techniques: &laquo;&nbsp;oubli&nbsp;&raquo; du cloacking pour rediriger les visiteurs, et ne pas prévoir la venue prévisible de la Quality Team, en leur affichant un faux 404 ou plus marrant un compte désactivé pour spam :-)<br />
Ce qui me fait dire qu&#8217;il faut vraiment une bonne préparation, avoir un script impeccable que l&#8217;on teste longuement avant sa &laquo;&nbsp;mise en production&nbsp;&raquo;. Je ne vous explique pas la galère lorsque vous devez corriger un bug sur des centaines de sites !</p>
<p>- Une erreur fondamentale: utiliser le même nom de sous-domaine avec un nombre: machin01, machin02, etc. Ça sent quand même le spam à plein nez ! Et puis avoir des milliers de sous-domaines qui apparaissent comme cela, du jour au lendemain, avec plein de pages, cela reste assez bourrin. Il faut être plus subtil, utiliser plusieurs domaines pour se couvrir, et faire cela tout doucement, lentement, insidieusement.</p>
<p>- Le contenu &laquo;&nbsp;scrambled&nbsp;&raquo;, c&#8217;est bien fini, et d&#8217;après-moi, cela ne peut qu&#8217;accélérer le bannissement ou le spam-report</p>
<p>- Le spam à base de Trackback fonctionne encore, mais il faut faire quelques recherches pour bien les utiliser &#8230;</p>
<p>- Les liens sont toujours aussi compliqués et pénibles à construire.</p>
<p>- La longue traine est une excellente alternative à exploiter &laquo;&nbsp;puissamment&nbsp;&raquo;.</p>
<p>E Finita la Commedia !</p>
]]></content:encoded>
			<wfw:commentRss>http://www.pagasa.net/blackhat-mechante-bouillie/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Si j&#8217;étais de l&#8217;équipe qualité de Google</title>
		<link>http://www.pagasa.net/equipe-qualite-google/</link>
		<comments>http://www.pagasa.net/equipe-qualite-google/#comments</comments>
		<pubDate>Wed, 04 Nov 2009 18:10:30 +0000</pubDate>
		<dc:creator>Thibaut</dc:creator>
				<category><![CDATA[seo]]></category>
		<category><![CDATA[technique]]></category>
		<category><![CDATA[cialis]]></category>
		<category><![CDATA[equipe qualité google]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[indicateur]]></category>
		<category><![CDATA[qualité]]></category>
		<category><![CDATA[spam]]></category>
		<category><![CDATA[viagra]]></category>

		<guid isPermaLink="false">http://www.pagasa.net/?p=939</guid>
		<description><![CDATA[Dans l&#8217;incessante partie de cache-cache qui m&#8217;oppose à Google, j&#8217;ai récemment commencé à m&#8217;intéresser de plus près à la façon dont leur équipe qualité évolue et bannit les sites qui gagnent plein d&#8217;argent ne rentrent pas dans leur critère.
Il se fait que ma situation professionnelle m&#8217;a justement amené à travailler dans la qualité au sein [...]]]></description>
			<content:encoded><![CDATA[<p>Dans l&#8217;incessante partie de cache-cache qui m&#8217;oppose à Google, j&#8217;ai récemment commencé à m&#8217;intéresser de plus près à la façon dont leur équipe qualité évolue et bannit les sites qui <strike>gagnent plein d&#8217;argent</strike> ne rentrent pas dans leur critère.</p>
<p>Il se fait que ma situation professionnelle m&#8217;a justement amené à travailler dans la qualité au sein d&#8217;un très gros service informatique. Avec le temps, il m&#8217;est souvent arrivé de me dire que Google est certainement confronté aux mêmes problématiques que je rencontre tous les jours.</p>
<p>Mon travail consiste à évaluer les performances des différents prestataires informatiques évoluant au sein de l&#8217;entreprise. J&#8217;ai à ma disposition un gigantesque ensemble d&#8217;informations provenant de sources variées: fichiers, téléphones, bases de données, etc.</p>
<p>A partir de cela, je construis des indicateurs et fait des rapports, la plupart du temps sous forme de graphes et tableaux. Je fais aussi des analyses détaillées sur les chiffres que j&#8217;obtiens. Je peux aussi déclencher des alertes en fonction de critères bien précis. </p>
<p>La première chose à savoir, c&#8217;est que la production de ces indicateurs est généralement bien automatisée. En effet, des outils aussi géniaux que PHP, Oracle, Excel (Et oui !) ou encore XML permettent de traiter n&#8217;importe quel type de données. Mais la seconde chose que je constate, c&#8217;est qu&#8217;une bonne analyse ne pourra jamais être remplacée par un algorithme aussi puissant soit-il. </p>
<p>Je vous donne un exemple basique. Un technicien helpdesk gère une dizaine d&#8217;incidents par jour. Le technicien est bien noté et perçoit une prime en fonction du nombre d&#8217;incidents qu&#8217;il résout. Cette prime peut être automatiquement produite par un indicateur que je crée via un script qui va interroger la base de données des incidents. Un jour, je m&#8217;aperçois que cet indicateur s&#8217;est complètement effondré. Si je voulais agir à la manière d&#8217;un ordinateur, sa prime aurait dû être automatiquement réduite par l&#8217;algorithme. Mais après analyse, il s&#8217;avère que trois nouveaux techniciens sont arrivés au cours du mois  et qu&#8217;ils ont été pris en charge par le technicien senior. Celui-ci a bien évidemment été forcé de réduire sa tâche de travail opérationnel (son nombre de tickets) pour former les jeunes recrues. </p>
<p>Il en ressort donc que l&#8217;on ne peut pas appliquer systématiquement une pénalité sur la seule base d&#8217;un indicateur calculé: il faut parfois une analyse complémentaire pour obtenir un résultat fiable. </p>
<p>Maintenant, je profite de ma situation pour me mettre à la place de l&#8217;équipe qualité de Google, puisque nous faisons un travail similaire. Tout ce que je vous livre est le pur fruit de ma réflexion professionnelle et n&#8217;est donc que spéculation. Mais je pense que cela vous amènera à réfléchir plus longuement sur leur problématique <strike>pour mieux la contourner</strike>. </p>
<p>Pour évaluer le résultat d&#8217;une requête, j&#8217;ai tout d&#8217;abord une problématique de taille: la volumétrie absolument gigantesque de l&#8217;information à traiter.</p>
<p>Le premier point est que je ne peux me permettre de mettre derrière chaque expression un analyste qui va décortiquer les résultats: il me faut des indicateurs, des alertes et surtout trier l&#8217;information. Je ne vais pas partir arbitrairement sur quelques mots clés. Après tout, il est très difficile d&#8217;évaluer le comportement d&#8217;un Internaute lambda: dans la vie de tous les jours, il ne passe pas son temps à chercher des vidéos ou acheter du viagra. </p>
<p>Pour ce faire, je commence par créer un indicateur de vigilance par expression. Celui-ci se calculera en fonction de la dynamique des liens et surtout des alertes que j&#8217;aurais généré dans mes analyses des backlinks. Ce dont je m&#8217;aperçois, c&#8217;est qu&#8217;il existe une grosse pression dans la construction des liens sur certains mots clé. C&#8217;est là que vont se dégager les &laquo;&nbsp;achat viagra&nbsp;&raquo; et autre &laquo;&nbsp;cialis&nbsp;&raquo;, pourvoyeurs de très grosses quantités de liens. </p>
<p>Sur ce type d&#8217;expression, j&#8217;ai positionné mon indicateur à 5000. A côté du viagra, une longue traine comme &laquo;&nbsp;viagra pas cher à Douchy Les Mines&nbsp;&raquo; recevra une note de seulement 20.  Grâce à la vigilance, je sais désormais où je dois appuyer mes analyses et mes efforts pour lutter contre le spam. J&#8217;ai ainsi résolu mon problème de volumétrie. </p>
<p>L&#8217;indicateur de vigilance va devoir évoluer avec le temps; dans la seconde partie où je détaillerai le fonctionnement de mon autre indicateur, j&#8217;aurai la possibilité d&#8217;augmenter ma vigilance. Chaque mois verra aussi la diminution arbitraire de ma vigilance, ceci pour pallier à une anomalie du système que l&#8217;on appelle le Buzz. Celui-ci est le résultat d&#8217;une actualité exceptionnelle mais qui ne représente pas  véritablement un danger pour la pertinence des résultats: avec le temps, il finit par s&#8217;estomper. C&#8217;est le cas par exemple, d&#8217;un concours de référencement dont la vigilance va rapidement atteindre des sommets, avec un score de 4500 par exemple pour finir par dégringoler pratiquement à zéro quelques mois après la fin du concours.   </p>
<p>Mon second indicateur est la vélocité. Les liens naturels sont variés et se construisent doucement au fil du temps. Le fait de passer de un à plus de 1000 backlinks en l&#8217;espace de quelques jours est un déclencheur élémentaire d&#8217;alerte. A chaque ajout de backlink, ma vélocité va augmenter. Mais tout comme ma vigilance, elle va aussi diminuer lentement au cours des jours à cause de l&#8217;effet Buzz. </p>
<p>Si ma vélocité dépasse un seuil alors je peux commencer par lancer une analyse automatique des backlinks. Il n&#8217;est pas bien difficile de déterminer la qualité d&#8217;un lien: </p>
<p>- les nouveaux liens sont-il uniformes ou pas (même mot clé sur même URL)<br />
- combien d&#8217;OBL (liens sortants) sont présents sur la page ?<br />
- la page contient-elle des mots clés disposant d&#8217;une vigilance importante (Viagra, Cialis) ?<br />
- le lien est-il une ancre ou une url ?<br />
- l’âge du domaine<br />
- le profil du Webmaster (Voir <a href="http://www.pagasa.net/google-tu-ennuies/" title="Google, tu m'ennuies">Google, tu m&#8217;ennuies</a>)<br />
- etc. </p>
<p>A ce niveau, je peux déjà choisir de retirer automatiquement ou de pénaliser un site rien que sur quelques critères. Et si cela n&#8217;est pas probant, j&#8217;ai toujours la possibilité de me tourner vers la vigilance qui m&#8217;indique si je dois oui ou non engager une analyse manuelle. </p>
<p>Si l&#8217;une des analyses tranche en défaveur du sondé, qu&#8217;elle le déclare spammeur, alors la vigilance sera augmentée et assurera la pérennité de mon système de filtrage. </p>
<p>Voilà, vous avez désormais une idée de la façon dont j&#8217;aurai à gérer le filtrage si je faisais partie de l&#8217;équipe qualité de Google: en construisant un mécanisme composé de quelques indicateurs formant un scoring, et dans lequel l&#8217;analyse manuelle aurait toute sa place. Car comme, je vous l&#8217;ai déjà expliqué jamais un programme informatique ne sera capable de reproduire l&#8217;une des plus puissantes qualités de l&#8217;homme: le jugement. </p>
]]></content:encoded>
			<wfw:commentRss>http://www.pagasa.net/equipe-qualite-google/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Le Botnet Storm</title>
		<link>http://www.pagasa.net/botnet-storm/</link>
		<comments>http://www.pagasa.net/botnet-storm/#comments</comments>
		<pubDate>Fri, 10 Oct 2008 15:44:14 +0000</pubDate>
		<dc:creator>Thibaut</dc:creator>
				<category><![CDATA[blackhat]]></category>
		<category><![CDATA[technique]]></category>
		<category><![CDATA[attaque]]></category>
		<category><![CDATA[botnet]]></category>
		<category><![CDATA[ddos]]></category>
		<category><![CDATA[sécurité]]></category>
		<category><![CDATA[spam]]></category>
		<category><![CDATA[storm]]></category>

		<guid isPermaLink="false">http://www.pagasa.net/?p=244</guid>
		<description><![CDATA[Suite à l&#8217;attaque par mail dont j&#8217;ai été la victime, je me suis penché un peu plus en profondeur sur l&#8217;inquiétant phénomène Botnet qui est sans nulle doute la pire menace jamais créée sur Internet. 
Même si le chiffre me semble ridiculement bas, il existe une bonne dizaine de Botnets clairement identifiés par des &#171;&#160;chasseurs&#160;&#187; [...]]]></description>
			<content:encoded><![CDATA[<p>Suite à l&#8217;<a href="http://www.pagasa.net/attaque-par-mail-botnet-zombie/" title="Attaque par mail">attaque par mail</a> dont j&#8217;ai été la victime, je me suis penché un peu plus en profondeur sur l&#8217;inquiétant phénomène Botnet qui est sans nulle doute la pire menace jamais créée sur Internet. </p>
<p>Même si le chiffre me semble ridiculement bas, il existe une bonne dizaine de Botnets clairement identifiés par des &laquo;&nbsp;chasseurs&nbsp;&raquo; : le Kraken, composé de plus de 400000 machines capable de générer 9 milliards de spams par jour, le Srizbi autrefois responsable de 60% du spam sur Internet, etc.</p>
<p>Parmi tout cela, l&#8217;un de ces Botnet a retenu toute mon attention pour le très haut niveau de technicité employé dans son utilisation: il s&#8217;agit du Botnet Storm. </p>
<p>Le Storm, encore appelé Storm Worm, de part son étroite relation avec un cheval de Troie du même nom, a été identifié pour la première fois en Janvier 2007. Les médias prétendent que ce Botnet serait composé de 1 à 50 millions de machines, mais les experts estiment que &laquo;&nbsp;seulement&nbsp;&raquo; 160000 machines forment ce Botnet. </p>
<p>Bien entendu, il est très difficile de déterminer l&#8217;origine du Storm: certains pensent qu&#8217;il serait contrôlé directement depuis le sol Américain alors que d&#8217;autres estiment, qu&#8217;à l&#8217;instar de plusieurs de ces &laquo;&nbsp;confrères&nbsp;&raquo;, il serait Russe et même l&#8217;œuvre du sinistre Russian Business Network, une occulte organisation cyber-criminelle.    </p>
<p>Comme tous les autres Botnet, le but principal du Storm est de générer du spam de nature différente: fichiers PDF ou Excel contenant des images, enregistrement vocal de MP3, texte brut, et email d&#8217;hameçonnage (Phishing). Au mois de mars 2008, 20% des spams sur Internet proviendrait du Storm.<br />
Il est également à noter qu&#8217;une partie des machines est exclusivement dédiée à l&#8217;extension du Botnet, en envoyant par mail des chevaux de Troie chargés d&#8217;infecter les machines sur Internet.</p>
<p>Outre le spam, le Botnet est également capable de lancer des attaques <a href="http://fr.wikipedia.org/wiki/D%C3%A9ni_de_service" title="DDOS" target="_blank">DDOS</a> contre d&#8217;autres groupes et organisations mais aussi en direction de ceux qui le traquent.</p>
<p>Si le Storm est particulier, c&#8217;est que son anatomie est différente des autres Botnet. Au fil du temps, ces auteurs semblent s&#8217;être durement focalisés sur la survie de leur création, passant d&#8217;une organisation relativement simple et classique à quelque chose de beaucoup plus sophistiquée.</p>
<p>Dans un Botnet rudimentaire, vous trouvez toujours un serveur principal appelé Command and Control (C&#038;C) qui se charge de contacter et de contrôler ces milliers de machines contaminées sur tout le réseau. Pour casser ce type de Botnet, il suffit donc de trouver le C&#038;C et de le désactiver: les machines Zombies sont alors privées de toute commande à distance et rendues partiellement inoffensives.</p>
<p>Le Storm a une approche foncièrement différente et s&#8217;organise en différentes couches. Tout en haut de la pyramide, vous avez un C&#038;C tournant sous Apache, et vraisemblablement placé en Russie, selon les dires des experts. Au niveau inférieur, vous trouvez un proxy <a href="http://www.nginx.eu/" target="_blank" title="Nginx">Nginx</a> chargé de dissimuler la présence du C&#038;C.<br />
Au troisième niveau, vous trouvez une collection de Nginx qui masque le proxy principal du niveau supérieur.  Au quatrième niveau se trouvent les nœuds publiques qui agissent comme des <a href="http://fr.wikipedia.org/wiki/Reverse_proxy" title="Reverse Proxies" target="_blank">reverse proxies</a> et qui renvoient les communications vers le C&#038;C, agissant comme des serveurs DNS fast flux. La technique du fast flux consiste à associer un même nom de domaine à plusieurs IP différentes, et ce rapidement. Finalement, le dernier niveau se compose de milliers de machines serviles, réparties sur tout l&#8217;ensemble du réseau.</p>
<p>Le processus d&#8217;infection se fait généralement par mail mais peut aussi être déclenché via le réseau P2P. Lorsque la victime a cliqué sur le lien situé dans son mail, le programme va télécharger un fichier exécutable directement depuis un nœud du quatrième niveau. Une fois infectée, la machine compromise et le nœud s&#8217;échangent l&#8217;adresse IP du nouveau Zombie. L&#8217;information est alors envoyée au troisième niveau, puis au second pour finalement parvenir au C&#038;C.</p>
<p>Au deuxième et troisième niveau, les proxies Nginx écoutent le trafic P2P des réseaux <a href="http://fr.wikipedia.org/wiki/Overnet" title="Overnet" target="_blank">Overnet</a> et <a href="http://fr.wikipedia.org/wiki/EDonkey2000" title="eDonkeyr" target="_blank">eDonkey</a>. Overnet est un réseau à base de <a href="http://fr.wikipedia.org/wiki/Table_de_hachage_distribu%C3%A9e" title="table de hachage distribuée" target="_blank">table de hachage distribuée</a> (DHT) basé sur l&#8217;algorithme <a href="http://fr.wikipedia.org/wiki/Kademlia" title="Kademlia" target="_blank">Kademlia</a>. Il s&#8217;agit du même protocole utilisé par les anciennes versions de eDonkey. Depuis octobre 2007, le Storm a changé son protocole: non seulement il utilise Overnet pour communiquer, mais les dernières versions du programme utilisent désormais leur propre réseau P2P. Ce réseau est quasiment identique à Overnet si ce n&#8217;est que l&#8217;information qui y circule y est encryptée. </p>
<p>Pour identifier les nœuds ainsi que le contenu sur le réseau Overnet, l&#8217;algorithme DHT utilise une clé linéaire (Généralement 128 bits) . Tous les algorithmes DHT ont leur propre façon de calculer la distance logique entre deux nœuds ou entre un nœud et du contenu distribué.</p>
<p>Kademlia calcule la distance entre les nœuds en effectuant un ou exclusif entre leur hachage publié.<br />
Lorsqu&#8217;une machine souhaite trouver du contenu sur le réseau, elle calcule (ou reçoit) le hachage du contenu et recherche des machines adjacentes à elle même. Ces dernières répondent également en annonçant leurs propres machines adjacentes. Le processus est répété jusqu&#8217;à ce qu&#8217;une machine soit à même de répondre à la requête de la recherche du contenu.</p>
<p>C&#8217;est parce que le réseau Overnet fonctionne sur un modèle de distribution qu&#8217;il n&#8217;existe aucun annuaire des machines. La liste des machines actives ainsi que le contenu publié sont distribués en petits morceaux directement dans la mémoire de toutes les machines du réseau. C&#8217;est toujours l&#8217;absence d&#8217;annuaire centralisé ainsi que la nature dynamique de ce qui est stocké dans la DHT qui rend le Storm tellement résistant à son démantèlement. </p>
<p>En conclusion, je dirai qu&#8217;à la vue de tout ce que j&#8217;ai pu lire sur le sujet, ce botnet est un véritable chef d&#8217;œuvre de technologie au service du mal. Sa complexité et son architecture lui ont valu le privilège d&#8217;être le sujet de plusieurs études, voir même de thèses écrites par des chercheurs de haut niveau. Maintenant, loin de moi de vouloir faire l&#8217;apologie du cybercrime,  on ne peut que rester perplexe devant un tel déchainement de recherches techniques, de réflexions et d&#8217;efforts, surtout pour de si noirs desseins. </p>
]]></content:encoded>
			<wfw:commentRss>http://www.pagasa.net/botnet-storm/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Le Spam referer</title>
		<link>http://www.pagasa.net/le-spam-referer/</link>
		<comments>http://www.pagasa.net/le-spam-referer/#comments</comments>
		<pubDate>Fri, 12 Sep 2008 15:07:04 +0000</pubDate>
		<dc:creator>Thibaut</dc:creator>
				<category><![CDATA[blackhat]]></category>
		<category><![CDATA[prstorm]]></category>
		<category><![CDATA[referer]]></category>
		<category><![CDATA[spam]]></category>
		<category><![CDATA[spammeur]]></category>

		<guid isPermaLink="false">http://www.pagasa.net/?p=212</guid>
		<description><![CDATA[Sur votre beau site de tricot, vous avez récemment installé un programme qui vous permet de générer des statistiques Web. Lorsque l&#8217;on est un super hackerz-2-la-mort-ki-kill, on tourne sous Apache et on génère ses stats avec un machin comme AWStats.
C&#8217;est bien les stats, car elles vous donnent tout plein d&#8217;informations sur les gens qui viennent, [...]]]></description>
			<content:encoded><![CDATA[<p>Sur votre beau site de tricot, vous avez récemment installé un programme qui vous permet de générer des statistiques Web. Lorsque l&#8217;on est un super hackerz-2-la-mort-ki-kill, on tourne sous Apache et on génère ses stats avec un machin comme <a href="http://fr.wikipedia.org/wiki/AWStats" target="_blank" title="Awstats">AWStats</a>.</p>
<p>C&#8217;est bien les stats, car elles vous donnent tout plein d&#8217;informations sur les gens qui viennent, les robots, les mots clé utilisés, etc. En bref, un très bon outil qui vous permet de bien optimiser votre beau site de tricot. Vous savez désormais que la page la plus fréquentée de celui-ci est celle qui décrit votre week-end au festival du tricotin à Crottes-en-Pithiverais, dans le Loiret.</p>
<p>Dans la partie referer, autrement dit l&#8217;url de la page vue précédemment par le visiteur, vous constatez la présence de nombreux sites complètement inconnus de votre part. Eperdu de joie (Wouhaaa, des gens font des liens vers mon site !), vous les visitez et nulle part, vous ne trouvez trace de votre site.  Par ailleurs, ces sites n&#8217;ont strictement rien à voir avec le votre. On y parle de choses incompréhensibles comme &laquo;&nbsp;gambling&nbsp;&raquo;, &laquo;&nbsp;mortgage&nbsp;&raquo;, &laquo;&nbsp;viagra&nbsp;&raquo; et &laquo;&nbsp;loan&nbsp;&raquo;. Et en plus, ils sont en anglais, mais qu&#8217;est ce que c&#8217;est que ce binz ??</p>
<p>Vous êtes la malheureuse victime d&#8217;un spam referer, il ne vous reste plus qu&#8217;à aller vite pleurer sur un forum pour y épancher votre colère, à dire tout le mal que vous pensez de ce que l&#8217;on s&#8217;est permit de vous faire, à proposer que l&#8217;on fasse voter une loi contre le spam referer, à en appeler à la cour européenne de justice, à blablablablabla &#8230;, interdit, blablablabla &#8230;, illégal, blablablabla &#8230;, <a href="http://www.pagasa.net/site-de-ucques.php" target="_blank">maison à gagner</a>&#8230;, blablablabla &#8230; </p>
<p>Alors, c&#8217;est quoi ce machin de spam referer ? c&#8217;est tout simplement une petite technique Blackhat pour faire tout plein de liens vers un beau site qui vend des pilules radis. Des pilules radis, qu&#8217;est-ce que c&#8217;est encore que cette histoire ? Et bien à l&#8217;instar du radis, les pilules sont rouges à l&#8217;extérieur et blanches à l&#8217;intérieur, un peu comme certains politiciens ;-)</p>
<p>L&#8217;idée, c&#8217;est d&#8217;aller visiter votre site de tricot en faisant croire que vous venez d&#8217;un autre site, donc que vous arrivez au moyen d&#8217;un lien extérieur. Après ce lien apparaitra dans vos statistiques, et si ces dernières sont visibles, alors elles seront indexées par les moteurs de recherche, ce qui implique l&#8217;obtention d&#8217;un backlink vers le site du spammeur, tout bénéf, quoi. Mais c&#8217;est du spam, ça ! Oui, bien sur, et en plus c&#8217;est mal ! </p>
<p>Un programme comme PRStorm utilise cette technique: en bombardant une multitude de sites avec un referer fabriqué de toute pièce, et ce pendant plusieurs heures, un spammeur peut facilement générer plusieurs centaines de backlinks.</p>
<p>Vous voulez des preuves ? Facile, il suffit d&#8217;utiliser l&#8217;arme absolue sur Internet pour récupérer des statistiques publiques; faites cela en lançant cette <a href="http://www.google.com/search?num=100&#038;hl=en&#038;q=%22Sep+2008%22+%22Created+by+awstats%22+intitle%3A%27Statistics+of%22+inurl%3Aawstats&#038;btnG=Search" target="_blank">requête</a>. Ici, on cherche l&#8217;empreinte (Footprint) de AWStats, et on se focalise sur la période de septembre 2008. On peut être plus restrictif en précisant par exemple un mot clé particulier afin de travailler uniquement sur la niche qui nous intéresse. Et puis bien entendu, il n&#8217;y a pas  qu&#8217;AWStats comme logiciel de statistiques. Il suffit d&#8217;isoler l&#8217;empreinte du logiciel et rien ne vous empêche d&#8217;utiliser d&#8217;autres moteurs comme Yahoo ou Live par exemple.</p>
<p>Une fois que vous avez récolté des milliers d&#8217;URLs, vous n&#8217;avez plus qu&#8217;à lancer un simple wget, ou générer du <a href="http://www.pagasa.net/je-vous-envoie-du-trafic-de-m/">trafic de M</a> (encore !) en direction du site. Ici, les statistiques de www.tartopom.com sont spammées par l&#8217;infâme Pagasa:</p>
<p><i># wget –referer=http://www.pagasa.net www.tartopom.com </i></p>
<p>Bien sûr, il manque plein de choses: un faux UserAgent et puis quelques proxy pour ne pas trop se faire  remarquer. </p>
<p>Et la boucle, hein la boucle ? Parce que là, tu nous donnes l&#8217;instruction juste pour une seule URL. Mais moi, j&#8217;ai acheté <a href="http://www.google.com/search?num=100&#038;q=biggest+URL+list+prstorm&#038;btnG=Rechercher&#038;meta=lr%3D" target="_blank">1500000 URL</A> à utiliser et toi, tu nous dis pas comment faire pour utiliser toutes les URL. C&#8217;est simple, vous prenez Excel ou Calc et vous faites du copier-coller, un peu comme pour le trafic de M. </p>
<p>Voilà, à noter tout de même qu&#8217;il s&#8217;agit d&#8217;une technique assez ancienne et que les dernières versions des programmes de statistiques ont tendance à supprimer les URL des referer; il reste toutefois largement de quoi faire.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.pagasa.net/le-spam-referer/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Attaque par mail: botnet et zombie</title>
		<link>http://www.pagasa.net/attaque-par-mail-botnet-zombie/</link>
		<comments>http://www.pagasa.net/attaque-par-mail-botnet-zombie/#comments</comments>
		<pubDate>Sat, 23 Aug 2008 12:07:11 +0000</pubDate>
		<dc:creator>Thibaut</dc:creator>
				<category><![CDATA[blackhat]]></category>
		<category><![CDATA[mail]]></category>
		<category><![CDATA[technique]]></category>
		<category><![CDATA[attaque]]></category>
		<category><![CDATA[botnet]]></category>
		<category><![CDATA[mailbomb]]></category>
		<category><![CDATA[spam]]></category>
		<category><![CDATA[virus]]></category>
		<category><![CDATA[zombie]]></category>

		<guid isPermaLink="false">http://www.pagasa.net/?p=147</guid>
		<description><![CDATA[Il y a quelques jours, j&#8217;ai subi une attaque par mail assez violente. J&#8217;en profite pour la détailler, et y apporter des commentaires. C&#8217;est toujours intéressant de connaitre les techniques des méchants, et puis au cas où je l&#8217;aurai oublié, le mail c&#8217;est mon dada ;-)
Tout d&#8217;abord, j&#8217;ai reçu en l&#8217;espace de 2 minutes près [...]]]></description>
			<content:encoded><![CDATA[<p>Il y a quelques jours, j&#8217;ai subi une attaque par mail assez violente. J&#8217;en profite pour la détailler, et y apporter des commentaires. C&#8217;est toujours intéressant de connaitre les techniques des méchants, et puis au cas où je l&#8217;aurai oublié, <a href="http://www.pagasa.net/category/mail/" title="Mail et Sendmail">le mail c&#8217;est mon dada</a> ;-)</p>
<p>Tout d&#8217;abord, j&#8217;ai reçu en l&#8217;espace de 2 minutes près de 400 mails, et à ce jour, je continue d&#8217;en recevoir sporadiquement mais en très faible quantité. Ce n&#8217;est pas à proprement parler du spam, ni du mail-bombing, mais des bounces (des échecs de livraison). Quelqu&#8217;un a utilisé mon adresse publique (sendmail arobase pagasa point net) pour envoyer des courriers non sollicités, et je ne fais que recevoir les erreurs.</p>
<p>La première chose que j&#8217;ai constaté est que nous ne sommes plus dans le chemin classique d&#8217;expédition du spam. Il y a quelques années, le spammeur utilisait traditionnellement un <a href="http://www.pagasa.net/les-relais-ouverts/" title="Relai ouvert">relai ouvert</a>, un serveur SMTP non sécurisé pour envoyer ses millions de mails. Il n&#8217;était alors pas bien difficile de fermer le relai et de passer à autre chose. Cette technique aurait tendance à diminuer mais au vue du nombre de tests que j&#8217;ai quotidiennement sur <a href="http://www.pagasa.net/test-smtp/" title="Tester un serveur SMTP">http://www.pagasa.net/test-smtp/</a>, elle n&#8217;a pas encore complètement disparu.</p>
<p>Aujourd&#8217;hui, ce sont bien des centaines de machines qui sont utilisées pour spammer. Ces machines forment un botnet, un réseau de PCs compromis par des failles de sécurité et pilotés à distance via IRC ou par des requêtes HTML (POST par exemple, pour moins éveiller les soupçons).</p>
<p>Dans mon cas, pratiquement toutes les machines que j&#8217;ai repérées sont référencées sur les listes noires comme zombie ou proxy ouverts. Si vous avez un doute sur votre propre machine, vous pouvez tester votre adresse IP via mon script <a href="http://www.pagasa.net/blacklist/" title="blacklist">Blacklist</a>. </p>
<p>Ce qui est ennuyeux avec cette histoire, c&#8217;est qu&#8217;il n&#8217;y a aucun moyen d&#8217;arrêter le spam en cours, et d&#8217;un autre côté, on peut difficilement remonter jusqu&#8217;au spammeur en lui même: il faut isoler le zombie et l&#8217;inspecter méthodiquement; et encore, on a assez peu de chance de retrouver quoique ce soit: un vrai spammeur ne laisse pas beaucoup de pièces à conviction derrière lui et il n&#8217;est pas impossible qu&#8217;il chaine ses opérations en faisant piloter un zombie par un autre :-O</p>
<p>Je n&#8217;ose pas imaginer le jour où des attaques de grandes envergures seront déclenchées; j&#8217;ai d&#8217;ailleurs même déjà l&#8217;impression que <a href="http://www.generation-nt.com/georgie-russie-conflit-cyberattaque-piratage-internet-actualite-136631.html" target="_blank" title="Cyberattaque">c&#8217;est déjà commençé</a>. Les botnets sont sans nulle doute la plus grave menace qui pèse sur l&#8217;intégrité de l&#8217;Internet.</p>
<p>Au cours de mes investigations, j&#8217;ai remarqué que le zombie jouait le rôle d&#8217;un agent de transfert (MTA): il est capable d&#8217;extraire le MX (<a href="http://fr.wikipedia.org/wiki/Enregistrement_Mail_eXchanger" title="Mail Exchanger", target="_blank">Mail Exchanger)</a>, ce qui lui permet de communiquer directement avec sa destination, sans passer par un serveur SMTP tiers, celui de son FAI, bien entendu :-)</p>
<p>Mais parfois le zombie détecte la présence d&#8217;un serveur SMTP déjà installé en local et l&#8217;utilise pour transporter son mail. J&#8217;ai pu ainsi repérer quelques Exchanges piratés. Les entêtes que j&#8217;ai récupérés prouvent bien une utilisation locale et non un relayage.</p>
<p>En ce qui concerne le spam en lui même, il est destiné à un public russe et peut se présenter sous deux formes:<br />
- Un message écrit en russe, à connotation sexuelle, et invitant à télécharger un Flash sur <a href="http://www.imageshack.us/" title="Imageshack" target="_blank">Imageshack</a>. Un passage à l&#8217;antivirus n&#8217;a rien donné pour l&#8217;instant. Je suppose qu&#8217;il s&#8217;agit d&#8217;un cheval de Troie, exploitant une faille Flash et permettant ainsi à la machine d&#8217;incorporer le botnet.<br />
- Le spam en lui même: une invitation au séminaire &laquo;&nbsp;UNE VOITURE DANS VOTRE ORGANISATION: comptabilité, fiscalité de l&#8217;exploitation&nbsp;&raquo; donné par un certain Семенихин В.В, le 26 août 2008. (Merci Google). Aucune URL n&#8217;est présente, juste un numéro de téléphone. Curieux, tout de même de spammer pour un séminaire. (Tentative de discrédit par un concurrent ?)</p>
<p>La chose qui est certaine, c&#8217;est que l&#8217;Internet est devenu très dangereux.<br />
<center><br />
<blink><br />
<font size=+1><br />
Vous êtes un <a href="http://www.adminoob.com/" target="_blank" title="Administrateur debutant">administrateur débutant</A> ?<br />
</font><br />
</blink><br />
</center></p>
]]></content:encoded>
			<wfw:commentRss>http://www.pagasa.net/attaque-par-mail-botnet-zombie/feed/</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>Scraper</title>
		<link>http://www.pagasa.net/scraper/</link>
		<comments>http://www.pagasa.net/scraper/#comments</comments>
		<pubDate>Sun, 20 Jan 2008 14:06:01 +0000</pubDate>
		<dc:creator>Thibaut</dc:creator>
				<category><![CDATA[blackhat]]></category>
		<category><![CDATA[scraper]]></category>
		<category><![CDATA[scraping]]></category>
		<category><![CDATA[seo]]></category>
		<category><![CDATA[spam]]></category>

		<guid isPermaLink="false">http://mig.pagasa.net/scraper/</guid>
		<description><![CDATA[Notre petit périple au pays du Blackhat nous a conduit à voir comment créer un lien avec un site populaire au moyen d&#8217;une injection d&#8217;URL. Je vous ai également parlé de ces spammeurs de liens qui gagnent beaucoup d&#8217;argent grâce à des techniques de programmation sophistiquées. Et finalement, je vous ai fait une petite démonstration [...]]]></description>
			<content:encoded><![CDATA[<p>Notre petit périple au pays du Blackhat nous a conduit à voir comment créer un lien avec un site populaire au moyen d&#8217;une <a href="http://www.pagasa.net/injection-durl/">injection d&#8217;URL</a>. Je vous ai également parlé de ces <a href="http://www.pagasa.net/entretien-avec-un-spammeur-de-liens/">spammeurs de liens</a> qui gagnent beaucoup d&#8217;argent grâce à des techniques de programmation sophistiquées. Et finalement, je vous ai fait une petite démonstration sur l&#8217;art de <a href="http://www.pagasa.net/spammeur/">spammer</a> subtilement Google. A ce jour, je n&#8217;ai d&#8217;ailleurs toujours pas été blacklisté chez eux sur le mot clé que je visais: <a href="http://www.google.fr/search?hl=fr&amp;q=spammeur&amp;btnG=Recherche+Google&amp;meta=" target="_blank">spammeur.</a> Comme c&#8217;est étrange, on nous aurait menti ou alors je travaille peut être chez Google ?</p>
<p>Après ces petites histoires qui nous ont tous bien amusé, je m&#8217;attaque à un autre sujet qui se situe toujours dans la mouvance Blackhat: le scraping. Pour cela, je me ferai aider par un assistant dont on entend beaucoup parler en ce moment:<br />
Sébastien Chabal, le fameux joueur de rugby qui fait le désespoir des coiffeurs.</p>
<p>Le scraper est celui (la personne ou le programme) qui fait le scraping. Je vais expliquer en quoi cela consiste un peu plus tard.<br />
Dans mes autres articles, je me suis focalisé sur la manière de populariser mes sites. Néanmoins, lorsque je crée 1000 sites, si je n&#8217;ai pas trop de problèmes à les faire connaître, j&#8217;ai tout de même un souci de taille: où vais-je donc trouver tout le contenu ?<br />
Car pour être rentable, je dois créer des dizaines, voir même des centaines de pages par site. En clair, il me faut des millions de pages à faire digérer par Google.</p>
<p>Je pourrai engager un indien qui m&#8217;écrirait des dizaines d&#8217;articles pour quelques dollars, mais cela demande du temps: chercher, poster, négocier, payer, uploader, etc. Bref, cela finirait par me coûter un peu cher et mon ROI ne serait certainement pas atteint.</p>
<p>Finalement, comme je m&#8217;y connais un peu en programmation, j&#8217;ai décidé de faire travailler un peu ma machine, c&#8217;est tellement plus simple et surtout moins fatiguant.<br />
En cherchant un peu, je me suis rendu compte de deux choses.</p>
<p>Tout d&#8217;abord, tous les jours, des milliers de personnes blogguent des petites bafouilles sur leur vie, leur petites misères et leur passion. Dans ce gigantesque amas d&#8217;écrits de plus ou moins bonne facture, je dispose d&#8217;un énorme vivier de contenu extrêmement dynamique que je vais récupérer pour mon propre intérêt.</p>
<p>Ensuite, tous les moteurs de recherche ont leur <a href="http://news.google.fr/" target="_blank">rubrique d&#8217;actualités</a> qui contient également une montagne d&#8217;écrits qui m&#8217;intéressent (On dira plutôt qui intéresse notre ami Google). Maintenant, on pourrait se demander pourquoi ne pas prendre tout simplement des résultats conventionnels de requêtes que l&#8217;on mettra en forme.<br />
Non, car les blogs et les actualités évoluent plus rapidement que les bêtes SERPS et risque de beaucoup plus intéresser Google, toujours avide de nouvelles informations et prêt à surgir à chaque mise à jour de mon site.</p>
<p>Donc, pour résumer, moi le scraper, je vais aller piquer du contenu chez les bloggeurs et dans les rubriques d&#8217;actualité. Je vais ensuite tout remettre en forme et ajouter des Adsense ou des liens d&#8217;affiliation dans les pages ainsi générées. C&#8217;est cela le scraping: voler les informations des autres pour construire son propre site.</p>
<p>En guise de démonstration, je vous ai concocté rapidement une petite page scrapée sur notre chevelu national: l&#8217;inénarrable <a href="http://www.pagasa.net/scripts/sebastien-chabal.php">Sébastien Chabal</a>.</p>
<p>J&#8217;ai commencé par mettre une petite photo sympa, histoire d&#8217;amadouer mes &laquo;&nbsp;victimes&nbsp;&raquo;. Ce sera d&#8217;ailleurs la seule partie statique, tout le reste étant généré à la volée. Ensuite, on trouve un bloc texte, plus ou moins incompréhensible dans lequel on retrouve Sébastien. Ces machins là viennent de mon scraping sur les blogs. Je n&#8217;ai pas trop retravaillé le texte, d&#8217;où les caractères cabalistiques et puis les quelques textes étrangers qui se sont immiscés, mais peu importe ce qui compte, c&#8217;est de donner à manger à Google. La page se termine sur des nouvelles scrapées sur Yahoo.</p>
<p>Voilà, pas mal, non ? En fait, c&#8217;est nul à crever, mais c&#8217;est juste une démonstration pour que toi, mon troll préféré, comprennent comment s&#8217;y prend le scraper; mais sache qu&#8217;il n&#8217;y a que quelques lignes de codes vite programmées entre deux bières.</p>
<p>Il y a beaucoup de façon d&#8217;améliorer la bête. Tout d&#8217;abord, je peux récupérer une base de données contenant des expressions toute faites, dotées d&#8217;une sémantique irréprochable. Ensuite, j&#8217;y insère mon mot clé, vous savez le joueur de rugby qui casse des mâchoires. Eventuellement, je fais quelques retouches en utilisant des synonymes. Je fais une extraction sur une dizaine d&#8217;expressions. Le sens n&#8217;aura certainement ni queue ni tête (hum, vous pouvez être parfois très surpris du résultat), mais Google n&#8217;y verra rien du tout. Après, je peux insérer une petite vidéo toujours récupérée sur Google, histoire de cosmétiser la page.</p>
<p>Et finalement, j&#8217;insère sur la page quelques liens comme suit:<br />
sebastien-chabal-rugby-02.php, sebastien-chabal-coupe-monde-03.php, chabal-sebastien-joueur-04.php qui à chaque fois vont être une page différente dont le contenu sera scrapé comme pour la première page. La seule différence notable est que pour l&#8217;index, je scrape seulement sur le mot clé primaire, ici &laquo;&nbsp;chabal&nbsp;&raquo;, et que plus je m&#8217;enfonce dans le site, et plus je serai précis: je cherche à me positionner sur &laquo;&nbsp;sebastien chabal&nbsp;&raquo;, puis sur &laquo;&nbsp;sebastien chabal rugby&nbsp;&raquo;, etc. Au total si la niche est suffisamment riche, alors je peux espérer créer facilement des milliers de pages à la volée.</p>
<p>Pour terminer, on va encore me soulever la question de l&#8217;éthique, de la morale, des droits d&#8217;auteurs,  du contenu dupliqué, etc.</p>
<p>Sur le fond, il n&#8217;y a franchement rien de moral, c&#8217;est clair: on fait de l&#8217;argent grâce au travail des autres. Je ne m&#8217;étendrai pas sur le sujet, le scraper a ses principes, ses objectifs et les moyens qu&#8217;il met en oeuvre pour y arriver. La technologie permet certes d&#8217;engranger rapidement des bénéfices conséquents, mais à long terme, je doute de la viabilité de ce qui ne sera jamais construit sur un business model cohérent.</p>
<p>Maintenant, comme le disait assez justement Sam: il n&#8217;y a rien de personnel dans tout cela.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.pagasa.net/scraper/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Spammeur</title>
		<link>http://www.pagasa.net/spammeur/</link>
		<comments>http://www.pagasa.net/spammeur/#comments</comments>
		<pubDate>Wed, 19 Dec 2007 22:16:10 +0000</pubDate>
		<dc:creator>Thibaut</dc:creator>
				<category><![CDATA[blackhat]]></category>
		<category><![CDATA[seo]]></category>
		<category><![CDATA[spam]]></category>
		<category><![CDATA[spammeur]]></category>

		<guid isPermaLink="false">http://mig.pagasa.net/spammeur/</guid>
		<description><![CDATA[Dans l&#8217;hypothèse où je serai un spammeur cherchant à bien me positionner sur Google, j&#8217;aurai à ma disposition plusieurs possibilités. Je vous propose ici une petite démonstration.
Tout d&#8217;abord, je pourrai me contenter de faire comme un spammeur de liens, à savoir, générer des tonnes et des tonnes de liens vers mon site. Mais à la [...]]]></description>
			<content:encoded><![CDATA[<p>Dans l&#8217;hypothèse où je serai un spammeur cherchant à bien me positionner sur Google, j&#8217;aurai à ma disposition plusieurs possibilités. Je vous propose ici une petite démonstration.</p>
<p>Tout d&#8217;abord, je pourrai me contenter de faire comme un <a href="http://www.pagasa.net/entretien-avec-un-spammeur-de-liens/">spammeur de liens</a>, à savoir, générer des tonnes et des tonnes de liens vers mon site. Mais à la longue, il y a beaucoup de chances que je me fasse éjecter de Google, et perdre ainsi tous le bénéfice lié à mon activité de spammeur. 10000 nouveaux liens par jour, c&#8217;est bien, mais impossible de ne pas se faire repérer.</p>
<p>Une autre alternative plus discrète, qui demande moins de travail est de bourrer ma page du mot clé qui m&#8217;intéresse. Mais ce n&#8217;est pas non plus sans risque. Il faut faire preuve de subtilité.</p>
<p>Pour ce faire, je commence par utiliser un générateur qui me crée un petit texte tout simple comme celui-ci par exemple:</p>
<p><strong>Spammeur</strong></p>
<p>&laquo;&nbsp;Bienvenu sur ce site de spammeur. Ceci est du spam généré par un logiciel. Le but de ce texte est de vous montrer que je suis un spammeur. Ce texte ne contient que du spam. Mon site de spammeur va surement être banni par Google. J&#8217;ai copié ce spam partout sur mon site. Mes pages sont remplies de propos de spammeur. Vous ne pouvez pas imaginer à quel point je spam.&nbsp;&raquo;</p>
<p>L&#8217;inconvénient de ce genre de texte, c&#8217;est qu&#8217;il est, somme toute, assez facile à détecter par Google.</p>
<p>On peut essayer de modifier la façon dont il est présenté, grâce à nos entêtes favorites (ou presque):</p>
<p><font size="+1">Entête 1</font></p>
<p>Ce site de spammeur ne parle que du spam</p>
<p><font size="+1">Entête 2</font></p>
<p>Les spammeurs ne devraient pas exister, pas plus que le spam</p>
<p>Ce qui est intéressant ici, c&#8217;est que l&#8217;on a amélioré la présentation en scindant les propos du spammeur en paragraphes, ce qui casse l&#8217;aspect automatique du texte et le rend beaucoup plus humain, donc mieux perceptible pas notre ami Google.</p>
<p>Après, je peux noyer mon mot clé dans des pseudos commentaires.</p>
<p><font size="+1"> Commentaires (5) </font></p>
<p>Charles:<br />
Tu n&#8217;es qu&#8217;un spammeur</p>
<p>Kathy:<br />
Mais puisque je vous dis que vous n&#8217;êtes qu&#8217;un spammeur</p>
<p>Elizabeth:<br />
Spam ou spammeur, telle est la question</p>
<p>André:<br />
Franchement, je ne savais pas que tu étais un spammeur.</p>
<p>Philippe:<br />
J&#8217;ai vu ton site de spammeur, franchement, il est bien.</p>
<p>Honnêtement, ce n&#8217;est pas de ma faute, si mes lecteurs sont eux même des spammeurs; j&#8217;ai donc peu de chance d&#8217;être banni.</p>
<p>Et finalement, j&#8217;essaye de faire passer mes élucubrations de spammeur dans une liste:</p>
<p>- Malgré ce que vous pensez, je ne suis pas un spammeur.<br />
- Ici, je casse la liste pour ne pas me faire repérer.<br />
- Spammeur, spam, spammer, spammeurs.<br />
- Texte crée par un spammeur.<br />
- Et voilà, une autre cassure.</p>
<p>La conclusion de cette petite démonstration vous sera prochainement communiquée.</p>
<p><u>Lundi 14 avril, 14:30</u> &#8211; Nous sommes quelques mois plus tard et je suis désormais 3ème.<br />
<u>Lundi 13 août 2007, 20:18</u> &#8211; Au cas où vous l&#8217;auriez pas remarqué, je cherchais à me positionner sur le mot-clé &laquo;&nbsp;<a href="http://www.google.fr/search?q=spammeur&#038;hl=fr" target="_blank">spammeur</a>&laquo;&nbsp;.<br />
<u>Samedi 11 août 2007, 10:34</u> &#8211; 5ème sur Google. Mission réussie: je reste sur la première page des SERPS, et Google ne m&#8217;a même pas viré.<br />
<u>Mardi 10 juillet 2007, 11:15</u> &#8211; Mes premiers résultats: 7ème sur Google. Ce n&#8217;est pas mal, au vue de la rude concurrence.<br />
<u>Samedi 7 juillet 2007, 11:00</u> &#8211; La page a été indexée par Google.<br />
<u>Jeudi 5 juillet 2007, 18:12</u> &#8211; Le <a href="http://www.google.fr/search?q=site%3Awww.pagasa.net" target="_blank">snippet du site</a>, l&#8217;extrait de la page affiché en descriptif du résultat de recherche, vient d&#8217;être modifié par Google. C&#8217;est rapide, il n&#8217;a fallu que trois heures.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.pagasa.net/spammeur/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Entretien avec un spammeur de liens</title>
		<link>http://www.pagasa.net/entretien-avec-un-spammeur-de-liens/</link>
		<comments>http://www.pagasa.net/entretien-avec-un-spammeur-de-liens/#comments</comments>
		<pubDate>Wed, 19 Dec 2007 22:12:42 +0000</pubDate>
		<dc:creator>Thibaut</dc:creator>
				<category><![CDATA[blackhat]]></category>
		<category><![CDATA[entretien]]></category>
		<category><![CDATA[lien]]></category>
		<category><![CDATA[seo]]></category>
		<category><![CDATA[spam]]></category>
		<category><![CDATA[spammeur]]></category>

		<guid isPermaLink="false">http://mig.pagasa.net/entretien-avec-un-spammeur-de-liens/</guid>
		<description><![CDATA[(D&#8217;après un article original de Charles Arthur)
Il n&#8217;y a rien de personnel dans tout cela.
Sam, appelons-le Sam, préfère conserver son anonymat. Il habite à Londres dans une maison jumelée disposant de trois salles de bain, conduit une jaguar et possède sa propre société. Mais cette dernière ne fait pas dans le show-business comme l&#8217;explique Sam. [...]]]></description>
			<content:encoded><![CDATA[<p>(D&#8217;après un article original de Charles Arthur)<br />
Il n&#8217;y a rien de personnel dans tout cela.</p>
<p>Sam, appelons-le Sam, préfère conserver son anonymat. Il habite à Londres dans une maison jumelée disposant de trois salles de bain, conduit une jaguar et possède sa propre société. Mais cette dernière ne fait pas dans le show-business comme l&#8217;explique Sam. Spammer les sites Web et les blogs pour propulser en tête des moteurs de recherches ses sites PPC (Pilules, porno et casinos), voila le business de Sam.</p>
<p>Et ce business, Sam le fait très bien. Il pourrait le faire juste pour rigoler, mais cela n&#8217;a rien à voir avec une plaisanterie. Il prétend pouvoir gagner des millions avec ce business. Sam est un spammeur de liens convaincu. Expérimenté en <a href="http://perl.enstimac.fr/" target="_blank">Perl</a>, <a href="http://articles.mongueurs.net/magazines/linuxmag56.html" target="_blank">LWP</a> et <a href="http://www.phpfrance.com/" target="_blank">PHP</a>, la première expérience de Sam en matière de programmation remonte à ses 13 ans lorsqu&#8217;il vendit un bout de programme à une société de jeux. Aujourd&#8217;hui, il est âgé de 32 ans et nous parle sous le couvert de l&#8217;anonymat.</p>
<p>Comment s&#8217;y prennent-ils ces spammeurs de liens, (c&#8217;est ainsi qu&#8217;ils sont appelés génériquement), et aussi pourquoi ? Sont-ils les mêmes que les spammeurs de mails ? Que pensent-ils de leur activité d&#8217;un point de vue éthique ? Et comment peut-on les arrêter ? Si vous êtes affectés par ce genre de spam, parce que vous avez un blog, ou un site Web, ou que comme 99% des Internautes, vous tombez par hasard sur le sujet, Sam tient à rappeler qu&#8217;il n&#8217;y a rien de personnel derrière tout cela. Ce n&#8217;est pas vous qui êtes visés personnellement. Les spammeurs de liens utilisent une faiblesse qui émergea au moment où Google en termina avec l&#8217;ancienne méthode des spammeurs qui utilisaient de gigantesques fermes de liens qui pointaient les unes sur les autres afin d&#8217;améliorer leur classement dans les moteurs de recherches.</p>
<p>C&#8217;était au mois de Décembre 2003: Google mit en place ce que l&#8217;on a appelé « <a href="http://www.webrankinfo.com/forums/viewtopic_6004.htm" target="_blank">l&#8217;update Florida</a> ». L&#8217;algorithme qui mesurait le classement de popularité d&#8217;un site fut modifié : désormais les liens dits de « complaisance » étaient dévalués. Donc si vous aviez une ferme de liens avec différents noms pointant excessivement les uns sur les autres alors votre classement dégringolait, explique Sam.</p>
<p>C&#8217;est alors que les spammeurs de liens, qui préfèrent utiliser le terme «optimisateur de moteurs de recherche» , passablement en colère que désormais ce soit le moteur de recherche lui même qui fasse l&#8217;optimisation, se tournèrent vers d&#8217;autres exutoires, gratuits de surcroit, et passablement appréciés par Google à cause de la richesse de leur contenu : les blogs. Et plus spécialement les commentaires de blogs où les rédacteurs s&#8217;attendent plus à d&#8217;agréables remarques sur ce qu&#8217;ils ont écrit qu&#8217;à des liens sur des sites PPC. Mais bon, il n&#8217;y a rien de personnel dans tout cela.</p>
<p>« Il était déjà fréquent de spammer les commentaires des blogs avant l&#8217;update Florida, mais la pratique a explosé depuis lors, » explique Sam. « Tout ce dont nous avions besoin, c&#8217;est d&#8217;un site web qui autorise les interactions. Les galeries de photo, à base de <a href="http://gal.xenux.net/" target="_blank">PHPGallery</a>, qui autorisent les votes et les commentaires sont également des cibles faciles. Car la plupart d&#8217;entre elles autorise quiconque à laisser une remarque. »</p>
<p>Même pour un programmeur moyen, l&#8217;écriture d&#8217;un programme permettant de spammer les sites web vulnérables ainsi que les blogs, est une chose relativement aisée. Tout ce dont vous avez besoin est une liste immense de blogs, que l&#8217;on obtient en cherchant des mots clé, comme « <a href="http://www.wordpress-fr.net/" target="_blank">Wordpress</a> », « Movable Type » et « Blogger ».</p>
<p>Mais les gens comme Sam sont beaucoup plus efficaces. «Vous pouvez viser entre 20000 et 100000 blogs. Chaque spammer cherche non pas la qualité des sites mais la quantité de liens. Lorsqu&#8217;un nouveau format de blog fait son apparition, il faut à peine y consacrer plus de 10 minutes et développer une méthode pour spammer les commentaires. Un simple script d&#8217;une centaine de lignes et le spam peut commencer. Mais vous ne pouvez pas juste allumer votre PC et lui demander d&#8217;exécuter le script. Vous risquez d&#8217;être repéré par votre FAI et déconnecté; ou bien l&#8217;adresse IP de votre machine peut être bloquée définitivement par les blogs visés.</p>
<p>Alors, comme tous les autres spammeurs de liens, Sam utilise les milliers de <a href="http://proxy.org/" target="_blank">proxy</a> ouverts présents sur Internet. Ces machines sont, par accident (un administrateur étourdi) ou par conception (un architecte étourdi), utilisables par quiconque pour aller visiter n&#8217;importe quel site web. D&#8217;habitude conçu pour un usage interne, et permettant ainsi l&#8217;exposition frontale d&#8217;une seule machine sur Internet, les proxy sont assez difficiles à sécuriser complètement.</p>
<p>Les programmes de Sam utilisent des centaines de proxy qui vont docilement spammer des blogs et d&#8217;autres sites avec le contenu voulu. Ils ont l&#8217;habitude de viser plutôt les anciens articles, de sorte que les gens ne les repèrent pas, ce qui n&#8217;est pas le cas des moteurs de recherche qui vont systématiquement repérer les liens et les indexer. Et c&#8217;est ici qu&#8217;il y a une chose intéressante : les spammeurs de liens travaillent pour eux même et agissent de leur propre chef. Leur opérations ne sont pas destinées à une tiers partie, comme dans le cadre d&#8217;un spammeur de mail. (Est-ce que cela signifie que le business n&#8217;est pas encore mature ?)</p>
<p>Et voici pourquoi. Lorsque Sam spamme des tonnes de blogs et de sites avec des liens sur ses propres sites, qui sont eux-mêmes affiliés à de plus gros sites PPC, les gens qui sont à la recherche de pilules, casino ou pornographie, cliquent depuis ses sites sur ces liens qui les redirigent vers ces sites parents qui payent Sam pour chaque personne les visitant. Selon Sam, ces sites PPC peuvent espérer des revenus de l&#8217;ordre de 100 000 à 200 000 livres sterling par mois. Sam obtient un pourcentage non négligeable sur ces ventes.</p>
<p>Peut-être que le système d&#8217;affiliation est finalement une forme de délégation: tout en haut de la chaine, les sites obtiennent une multitude « d&#8217;ouvriers » qui se démènent pour attirer des visiteurs sur ces sites. Darwin comprendrait. Spammer des liens, malgré l&#8217;abus de ressources, est de loin la meilleure façon de procéder, tout comme couper du bois dans la forêt amazonienne ou indonésienne est la meilleure façon d&#8217;obtenir beaucoup plus de bois. Après tout, même si cela contribue grandement au réchauffement climatique de la communauté des bloggeurs, et bien la vie continue quand même sur la planète Internet. « Sam, pourquoi ne te contentes-tu pas d&#8217;acheter une publicité sur Google ? » Jamais vous n&#8217;obtiendrez un tel ratio de clic. En utilisant le spam, vous pouvez obtenir 6 à 7 fois plus de clics ; de plus les publicités sur les moteurs de recherche coutent beaucoup d&#8217;argent, parfois jusqu.à 20 livres le clic ! Ici, vous ne payez rien pour obtenir un résultat organique. « Mais qu&#8217;en est-il de la morale, vous utilisez la bande passante d&#8217;autrui et abusez l&#8217;espace des blogs en y insérant des messages commerciaux ? » « La question de la morale est une affaire personnelle. Tant que c&#8217;est légal, on continuera. Un argument pourrait être qu&#8217;un propriétaire de site accepte finalement implicitement le mécanisme, puisqu&#8217;il y autorise les commentaires. »</p>
<p>Quand Sam a commencé ses affaires, il avait comme objectif d&#8217;être dans les 6 premiers sur les moteurs de recherche, même si l&#8217;objectif suprême est toujours d&#8217;être le numéro un pour une phrase du site choisi. « Mais bien entendu, être numéro 2 ou 3, c&#8217;est déjà une réussite ». Curieusement, les rangs 8, 9 et 10 ont des meilleurs taux de conversion. Je ne sais pas pourquoi. Peut être parce les yeux s&#8217;y fixent lorsque l&#8217;on fait défiler la page. » Et le coût de tout cela ? Une fois que le code est écrit, pratiquement rien. « La bande passante est bon marché », dit-il. « Vous lancez votre programme le soir et vous revenez le matin pour voir comment ca s&#8217;est passé. »</p>
<p>Et le côté légal de toute cette activité ? C&#8217;est ici que Sam met beaucoup de distance entre lui et les spammeurs par mail, particulièrement ceux qui utilisent des virus faits sur mesure et qui transforment votre PC connecté à la DSL ou au câble en générateurs de spams. « J&#8217;utilise des serveurs proxy mal configurés, pas ceux qui ont été piratés et qui sont sous le contrôle d&#8217;un étranger. Mais je parle des 7 ou 8 meilleurs spammeurs de liens, et ils n&#8217;utilisent pas des PC zombies. Les gens qui spamment les blogs ne viendront pas au spam par mail. »</p>
<p>En utilisant des serveurs proxy, Sam argumente qu&#8217;il n&#8217;y a rien d&#8217;illégal. (Ce qui est apparemment exact dans le sens où la configuration de la machine n&#8217;a pas été modifiée) Par contre, l&#8217;envoi de virus et l&#8217;utilisation de bots est parfaitement illégal. L&#8217;argument de la moralité est réservé aux individus. La question de la légalité est un autre débat.</p>
<p>En fait, la loi pencherait plus en faveur de Sam. Il est difficile d&#8217;argumenter sur la différence entre une personne utilisant un ordinateur pour poster un commentaire et une personne utilisant un ordinateur qui utilise lui-même un ordinateur pour poster un commentaire. Récemment Google, Yahoo et MSN ont décidé de prendre en compte l&#8217;attribut « <a href="http://www.webrankinfo.com/actualites/200501-nofollow.htm" target="_blank">nofollow</a> » des liens hypertextes. (Empêchant ainsi aux moteurs de suivre les liens). Est-ce que cette initiative mettra un terme aux agissements de Sam et de ses comparses ? « Je ne pense pas que cela aura beaucoup d&#8217;effets à court, moyen et long terme. Les moteurs de recherche sont la cause du problème, on ne suit pas trop ce type de logique, et ils font cela pour apaiser la communauté des bloggeurs. Cela ne fonctionnera pas car la plupart des blogs et des formulaires sont bâtis avec les meilleures intentions du monde; mais même lorsque les gens se rendent compte que leur système a été corrompu, la plupart du temps, ils laissent pourrir la situation. Pour prendre en compte la nouvelle directive des moteurs de recherche, tous les systèmes devraient être mis à jour. La majorité ne le sera pas. Et les retro liens continueront d&#8217;être spammés.</p>
<p>Sam déclare que les spammeurs montent également leur propres blogs et référencient leur articles sur des millions de blogs, ce qui va immanquablement les ramener au spammeur. Mais comment empêcher les spammeur de poster leur liens ? Une bonne méthode est d&#8217;utiliser les captchas. Une personne peut surmonter ce type de test, mais pas un ordinateur incapable de lire une image comportant des chiffres ou des lettres déformées. « Même l&#8217;authentification de l&#8217;utilisateur peut être automatisée » (La commande Unix <a href="http://curl.haxx.se/" target="_blank">curl</a> est merveilleusement flexible)</p>
<p>« La façon la plus difficile de spammer est celle qui demande une authentification manuelle telle que les <a href="http://fr.wikipedia.org/wiki/Captcha" target="_blank">captchas</a>. Ou ceux qui demandent une réponse par email avec un lien de confirmation ; ceci peut toutefois être automatisé. Ceux qui vous demandent de vous enregistrer puis de cliquer sur des liens sont également difficiles à gérer. Et lorsque le bloggeur change le nom des répertoires où les fichiers sont habituellement stockés, alors c&#8217;est un véritable casse-tête car vous devez récupérer la liste des noms de répertoire. »</p>
<p>Pour Sam, chaque jour apporte de nouveaux challenges. Pas seulement de la part des bloggeurs en colère, encore moins des moteurs de recherche qui arrivent avec de nouveaux algorithmes, mais bien des spammeurs de liens. « C&#8217;est comme une course de 1500 mètres. Vous êtes un peu en avance et les autres vous rattrapent, » dit Sam. Mais il reste confiant et pense pouvoir rester dans les business de l&#8217;optimisation des moteurs de recherche pendant encore un bon moment.</p>
<p>Pourquoi ? Parce que la demande existe. « La réalité est que les gens achètent du viagra, veulent de la pornographie et jouer aux casinos. A partir du moment où les gens en veulent alors il y a moyen de faire de l&#8217;argent ». Et même si cela peut nous sembler suspect que la fin justifie les moyens, Sam s&#8217;en moque. Il vient d&#8217;ajouter quelques milliers de nouveaux blogs à sa liste et se prépare à les spammer.<br />
Mais il n&#8217;y a rien de personnel dans tout cela, n&#8217;est-ce pas ?</p>
]]></content:encoded>
			<wfw:commentRss>http://www.pagasa.net/entretien-avec-un-spammeur-de-liens/feed/</wfw:commentRss>
		<slash:comments>8</slash:comments>
		</item>
		<item>
		<title>Wikipedia met en place l&#8217;attribut nofollow</title>
		<link>http://www.pagasa.net/wikipedia-met-en-place-lattribut-nofollow/</link>
		<comments>http://www.pagasa.net/wikipedia-met-en-place-lattribut-nofollow/#comments</comments>
		<pubDate>Wed, 19 Dec 2007 22:05:32 +0000</pubDate>
		<dc:creator>Thibaut</dc:creator>
				<category><![CDATA[seo]]></category>
		<category><![CDATA[attribut]]></category>
		<category><![CDATA[lien]]></category>
		<category><![CDATA[nofollow]]></category>
		<category><![CDATA[spam]]></category>
		<category><![CDATA[wikipedia]]></category>

		<guid isPermaLink="false">http://mig.pagasa.net/wikipedia-met-en-place-lattribut-nofollow/</guid>
		<description><![CDATA[Wikipedia utilise désormais l&#8217;attribut « nofollow » sur tous ces liens externes. La raison évoquée est de frapper un grand coup dans la lutte contre les spammeurs de liens.
Les modifications semblent déjà avoir été mises en place depuis la mi-janvier. Un tel changement ne peut qu&#8217;affecter grandement les recherches sur Internet. Wikipedia avec ces millions [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://fr.wikipedia.org/wiki/Accueil" target="_blank">Wikipedia</a> utilise désormais l&#8217;attribut « nofollow » sur tous ces liens externes. La raison évoquée est de frapper un grand coup dans la lutte contre les <a href="http://www.pagasa.net/entretien-avec-un-spammeur-de-liens/">spammeurs de liens</a>.</p>
<p>Les modifications semblent déjà avoir été mises en place depuis la mi-janvier. Un tel changement ne peut qu&#8217;affecter grandement les recherches sur Internet. Wikipedia avec ces millions de pages, dont la plupart d&#8217;excellentes factures, pèse très lourd sur les résultats des moteurs de recherche. Google se base sur les liens pour mesurer la pertinence d&#8217;une page, et avec cette modification majeure, les liens externes de Wikipedia n&#8217;auront plus du tout le même impact.</p>
<p>A l&#8217;origine, l&#8217;attribut « nofollow » était destiné à lutter contre les spammeurs qui sévissaient sur les commentaires des blogs. Cette méthode est désormais utilisée sur les wikis : tout lien externe trouvé ne sera plus suivi par les moteurs de recherche.</p>
<p>En s&#8217;établissant comme un site d&#8217;autorité, Wikipedia a fait beaucoup de bien à la recherche sur Internet. Un très grand nombre de personnes ont contribué à son succès en créant un lien vers le Wiki depuis leur site, forum ou blog; cela a aboutit à la création d&#8217;un puissant réseau de liens qui a fait toute la réputation de Wikipedia. Maintenant, la relation est à sens unique : les Internautes donnent mais n&#8217;ont rien en retour, à savoir un lien depuis ce prestigieux site, ce qui contribue à enrichir la pertinence des résultats d&#8217;une recherche.</p>
<p>Il aurait sans doute été plus simple d&#8217;améliorer la modération de la rédaction, il y a tellement de bonnes volontés de ci, de là, prêtes à travailler et à donner du temps pour satisfaire la connaissance universelle.<br />
Dommage pour tout le monde.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.pagasa.net/wikipedia-met-en-place-lattribut-nofollow/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Les relais ouverts</title>
		<link>http://www.pagasa.net/les-relais-ouverts/</link>
		<comments>http://www.pagasa.net/les-relais-ouverts/#comments</comments>
		<pubDate>Thu, 13 Dec 2007 20:54:46 +0000</pubDate>
		<dc:creator>Thibaut</dc:creator>
				<category><![CDATA[mail]]></category>
		<category><![CDATA[faille]]></category>
		<category><![CDATA[messagerie]]></category>
		<category><![CDATA[relais ouverts]]></category>
		<category><![CDATA[sécurité]]></category>
		<category><![CDATA[spam]]></category>

		<guid isPermaLink="false">http://mig.pagasa.net/2007/12/13/les-relais-ouverts/</guid>
		<description><![CDATA[
Tester en ligne un serveur SMTP
  Il existe un problème de sécurité mal connu sur l&#8217;Internet: celui des serveur relais-ouvert. Ce problème concerne les serveurs de messagerie sortante ou SMTP; normalement lorsque l&#8217;on envoie un e-mail, on utilise un serveur SMTP destiné à un usage exclusif. Les personnes autorisées sont généralement celles qui sont [...]]]></description>
			<content:encoded><![CDATA[<p><center></p>
<h3><a href="http://www.pagasa.net/test-smtp/">Tester en ligne un serveur SMTP</a></h3>
<p></center>  Il existe un problème de sécurité mal connu sur l&#8217;Internet: celui des serveur relais-ouvert. Ce problème concerne les serveurs de messagerie sortante ou SMTP; normalement lorsque l&#8217;on envoie un e-mail, on utilise un serveur SMTP destiné à un usage exclusif. Les personnes autorisées sont généralement celles qui sont issues du même réseau (wanadoo.fr, skynet.be,&#8230;)En aucun cas, un serveur SMTP ne devrait pouvoir être utilisé par un utilisateur d&#8217;un autre réseau. La raison en est toute simple: quiconque sur Internet serait en mesure de l&#8217;utiliser.Le petit &laquo;&nbsp;axiome&nbsp;&raquo; suivant garantit l&#8217;intégrité d&#8217;un serveur SMTP:<br />
- le serveur SMTP fait partie du même réseau IP que son utilisateur,<br />
OU<br />
- le serveur SMTP envoie du courrier uniquement vers un utilisateur appartenant à son réseau IP.Bien sûr, il peut exister des serveurs intermédiaires destinés à repartir la charge des transactions SMTP. Maintenant, du fait d&#8217;un mauvais paramétrage, un serveur SMTP peut très bien accepter du courrier de n&#8217;importe quel utilisateur d&#8217;Internet vers n&#8217;importe quel autre utilisateur: le serveur SMTP est alors placé en position de relais-ouvert.</p>
<p>Ceci est très dangereux car la plupart des personnes générant du courrier non sollicité (encore appelé spam) utilisent ce genre de relais. Ils ont moins de chance de se faire repérer en utilisant un serveur tiers plutôt que celui de leur FAI (Fournisseur d&#8217;Accès Internet).</p>
<p>Pour information, les spammeurs envoient généralement des milliers voire des dizaines de milliers d&#8217;emails; on voit clairement le risque encouru lorsqu&#8217;un serveur est relais ouvert.</p>
<p>Nous allons maintenant tester manuellement un serveur SMTP afin de voir si oui ou non, celui-ci est un relais ouvert.<br />
La première chose à faire est d&#8217;extraire du DNS le MX (Mailer Exchanger), en fait le nom du serveur SMTP qui peut nous faire entrer sur un domaine de messagerie. Ceci se fait grâce à la commande NSLOOKUP:<br />
<strong> nslookup -q=mx domaine.fr 194.2.0.20 </strong></p>
<p>Le &laquo;&nbsp;-q=mx&nbsp;&raquo; indique que l&#8217;on s&#8217;intéresse uniquement au champs MX du DNS, le domaine.fr représente le domaine de messagerie et l&#8217;adresse IP est tout simplement le DNS que l&#8217;on interroge, ici celui d&#8217;Oleane.<br />
Le même résultat peut être obtenu avec la commande DIG:<br />
<strong> dig mx domaine.fr </strong></p>
<p>En retour, nous obtenons:<br />
<strong> mail.domaine.fr </strong></p>
<p>Nous pénétrons sur le serveur au moyen d&#8217;un simple telnet:<br />
<strong> telnet mail.domaine.fr 25 </strong></p>
<p>Le 25 correspond au numéro du port SMTP.  En réponse, nous obtenons quelque chose de semblable à ceci:<br />
<strong> 220 mail.domaine.fr Simple Mail Transfer Service Ready </strong></p>
<p>Le 220 indique que la connexion a été acceptée et qu&#8217;un dialogue SMTP peut commencer.<br />
Nous commençons par nous identifier:<br />
<strong> helo mamachine.domaine.com </strong><br />
ou<br />
<strong> ehlo mamachine.domaine.com </strong></p>
<p>Nous lui donnons notre adresse SMTP, lui indiquant la source du message:<br />
<strong> mail from: moi@mondomaine.com </strong></p>
<p>Attention, le domaine doit exister car bien souvent le serveur SMTP fait une requête DNS pour vérifier que celui-ci n&#8217;est pas factice. Certains serveurs demandent également d&#8217;utiliser une syntaxe quelque peu différente:<br />
<strong> mail from: &lt;moi@mondomaine.com&gt; </strong></p>
<p>Nous lui donnons l&#8217;adresse SMTP correspondant au destinataire du message:<br />
<strong> rcpt to: lui@sondomaine.com </strong><br />
ou<br />
<strong> rcpt to: &lt;lui@sondomaine.com&gt; </strong></p>
<p>Ici, il y a deux possibilités:<br />
<strong> 554 <lui@sondomaine.com>: Recipient address rejected: Relay access denied </lui@sondomaine.com></strong></p>
<p>Le code d&#8217;erreur 554 indique que le serveur SMTP n&#8217;accepte pas le relais.</p>
<p><strong> 250 OK </strong></p>
<p>Le code de retour 250 autorise le relais: le serveur est donc un relais ouvert. On ne peut toutefois en être absolument sûr car certains serveurs peuvent rejeter le relayage après le dialogue SMTP.</p>
<p>Vous avez la possibilité de tester en ligne si un serveur est relais ouvert ou non en cliquant <a href="http://www.pagasa.net/test-smtp/">ici</a>.<br />
Le programme consiste à tester plusieurs formes de relayage possible. Le résultat est toutefois à prendre au conditionnel car certains serveurs SMTP feignent d&#8217;accepter du courrier mais l&#8217;effacent par la suite. Toutefois, le fait d&#8217;échouer sur le premier test indique tout de même une grosse faille potentielle.</p>
<p>Ce <a href="http://www.pagasa.net/telecharge/chksmtp.pl">petit programme Perl</a> effectue une dizaine de tests sur un serveur SMTP donné. Il faut, bien sûr, se trouver à l&#8217;extérieur du réseau sur lequel se trouve ce serveur.<br />
Attention, suivant le serveur que vous utilisez, le programme peut vous indiquer qu&#8217;il est relais-ouvert mais en fait il n&#8217;en est rien, car le message est rejeté en interne après la clôture de la transaction SMTP.</p>
<p>Si vous voulez être absolument sûrs que le serveur est un relais ouvert, remplacez les deux variables $domaine et $test dans la fonction tst() respectivement par votre domaine de messagerie ainsi que par votre compte POP.</p>
<p><u>Exemple:</u><br />
$domaine=&nbsp;&raquo;wanadoo.fr&nbsp;&raquo;;<br />
$test=&nbsp;&raquo;jacques.vanpiperzen&nbsp;&raquo;;</p>
<p>Si le serveur est effectivement relais alors vous recevrez prochainement du courrier.<br />
Le programme demande une adresse IP ou un nom de machine comme argument; il y aurait moyen de l&#8217;améliorer en y ajoutant des alarm() afin de pallier à d&#8217;éventuels dépassements de temps sur l&#8217;accès au serveur.</p>
<p>La meilleure façon de se protéger efficacement contre le relayage est bien évidement d&#8217;avoir un serveur SMTP bien configuré mais ce n&#8217;est pas forcément évident à mettre en oeuvre surtout sur des systèmes aussi complexes qu&#8217;Exchange Server ou Lotus Notes; ces deux serveurs demandent généralement une bonne pratique avant d&#8217;être parfaitement maîtrisés.</p>
<p>Aussi, je m&#8217;appuierai plus sur une sécurité à l&#8217;échelle d&#8217;IP; l&#8217;avantage est que l&#8217;on devient complètement indépendant de la configuration SMTP.<br />
Une approche pourrait être que chaque fois que l&#8217;on découvre quelqu&#8217;un utilisant son serveur SMTP de façon illicite, alors on interdit à toute la classe IP de ce même utilisateur d&#8217;accéder au serveur. Cette approche (déjà rencontrée) est très mauvaise:<br />
- elle pénalise autrui, à savoir les utilisateurs innocents,<br />
- elle ne résout pas le problème,<br />
- a ce rythme, des pans entiers d&#8217;Internet ne pourront bientôt plus communiquer avec le serveur.</p>
<p>La meilleure façon de procéder consiste à appliquer les étapes suivantes:<br />
- Tout d&#8217;abord, on laisse gérer le courrier par le FAI; celui-ci dont le métier est l&#8217;Internet doit être capable de répondre à la problématique suivant:<br />
&laquo;&nbsp;Je ne veux pas que mon serveur SMTP soit relais ouvert&nbsp;&raquo;.<br />
Pour être plus précis, on va confier la gestion du MX du domaine au FAI; suite à l&#8217;extraction du MX, tout le courrier entrant arrivera donc directement chez le FAI.<br />
- Le FAI ré-acheminera tout le courrier sur notre serveur SMTP.<br />
- Le port 25 de notre serveur de messagerie ne sera accessible que par le(s) adresses IP du/des serveur(s) SMTP de notre FAI.</p>
<p>Ceci se fera grâce à un filtrage élémentaire sur le routeur (Exemple CISCO):<br />
<strong> access-list 125 permit tcp host 10.0.0.10 host 192.168.0.10 eq smtp<br />
access-list 125 deny   tcp any any eq smtp log<br />
</strong><br />
où le 10.0.0.10 représente le serveur du FAI et le 192.168.0.10 le nôtre.<br />
Toutes les autres tentatives d&#8217;utiliser le(s) serveur(s) SMTP sont enregistrées.</p>
<p>On peut faire la même chose grâce à un iptable sous Linux :<br />
<strong> /sbin/iptables -A INPUT -j ACCEPT -p tcp -s  10.0.0.10 -d 192.168.0.10 &#8211;dport 25<br />
</strong><br />
Grâce à cette technique, on canalise le flux SMTP et on interdit ainsi à quiconque de l&#8217;utiliser, si ce n&#8217;est les personnes autorisées.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.pagasa.net/les-relais-ouverts/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
