Content Spinning: les bonnes pratiques

Vous êtes de plus en plus nombreux à utiliser mon outil de content-spinning en ligne, et je vous en remercie.

Je vous rappelle toutefois que cet outil ne génère pas lui même la sémantique ni les synonymes: c’est à vous de le faire.

D’après quelques sources que j’ai eu, il semble que Google soit déjà au courant de notre petite bidouille et il n’est pas rare  d’avoir des articles spinnés se faire pénaliser . N’oubliez jamais que quelque part dans l’ombre, une armée de personnes s’acharne jours et nuits à lutter contre les mauvaises pratiques de ceux qui ne sont pas dans le camp du bien.

Néanmoins, même si les ingénieurs de Google ont certainement des mécanismes de détection susceptibles d’identifier les articles « trafiqués », il est facile de les contourner en utilisant quelques bonnes pratiques que je vais vous expliquer. Après ceci, vous serez capable de créer des milliers d’articles entièrement uniques. N’oubliez pas les backlinks, je vous prie: c’est déductible de votre ISF.

Tout d’abord, dans un souci de sauvegarde de notre patrimoine Francophone et par respect pour mes lecteurs du CanadZa, j’utiliserai désormais « pivoté » en lieu et place de « spinné ».

Lorsque l’on fait pivoter le contenu d’un article de façon conventionnelle, c’est à dire rapidement et sans se poser de question, trop pressés que nous sommes à vouloir promouvoir une ferme de blogs à coup de Xrumer, invariablement une série de problèmes survient et qui finissent par sauter aux yeux de notre grand ami à tous, l’inénarrable Google.

Le premier problème concerne l’agencement de l’article pivoté: en fait, même si son contenu diffère grâce au génialissime algorithme que je vous ai pondu (3 malheureuses lignes de code), la structure de votre page HTML reste généralement toujours la même, avec le même nombre de paragraphes, retour à la ligne, puces, images et tout le même fatras HTML habituel: H1, H2, H3, CENTER, etc.

L’idée est donc de casser le caractère monotone de notre article pivoté, en y insérant des étiquettes HTML différentes dans nos alternatives.

Par exemple, tantôt je mets un caractère en gras, tantôt je ne le fais pas:

{<b>Thibaut est gras</b>|Thibaut est gras}

En italique:

{<i>Cialis en italique</li>|Cialis en italique}

Centré:

{<center>Tramadol au centre</center>|Tramadol au centre}

En jouant sur les entêtes:

{<h1>Acheter mon viagra pas cher</h1>|<h2>Acheter mon viagra pas cher</h2>|<h3>Acheter mon viagra pas cher</h3>|Acheter mon viagra pas cher}

En cassant les paragraphes:

{.|.<br />}

En utilisant des puces

{<ul><li>Viagra 1</li><li>Viagra 2</li></ul>|=> Viagra 1<br />=> Viagra 2<br />}

En insérant des images de temps en temps:

{<img src= »image de Carla Bruni nue »>|}

Etc, etc. Le langage HTML est suffisamment riche pour que vous puissiez exprimer toute l’étendue de votre talent.

Notre deuxième souci est la quantité d’informations beaucoup trop similaire d’un article à l’autre: on y trouve généralement le même nombre de mots ainsi qu’un nombre identique de phrases:

Je {vais|pars} à {Lyon|Lille} jeudi prochain. J’y verrai {un match|une partie} de {foot|volley}

Ce problème se contourne aisément en créant un nombre différent de mots et aussi de phrases; il suffit de prévoir des expressions optionnelles:

J’aime {beaucoup|} regarder la télévision {le soir|}. {Cela me détend|}

Ma fille {qui vient d’avoir 4 ans|} va à l’école uniquement le matin {du lundi au vendredi|}

Troisième problème, la similitude qui peut exister d’une phrase à l’autre:

{Connaissez-vous la meilleure façon de perdre du poids ?|Savez comment perdre des kilos ?}

Même si elles sont différentes, ces deux phrases expriment clairement la même idée et sont tout simplement des synonymes basiques.

L’analyse sémantique est quelque chose de difficile à réaliser d’un point de vue informatique car il faut des algorithmes assez chiadés mais je ne suis pas convaincu que ce soit un obstacle pour une multinationale pesant plusieurs milliards de dollars.

Esquivez le piège des phrases synonymes en changeant complètement leur tournure:

{Dans le chapitre qui suit, je vous expliquerai la meilleure de façon de perdre du poids|Si vous voulez perdre du poids, lisez les explications qui suivent, une méthode vous détaillera précisément comment arriver à vos objectifs}

Le quatrième problème se rapporte aux OBL, les liens sortants: en créant systématiquement une relation vers votre site ou votre lien d’affiliation, vous ouvrez un boulevard béant à Google qui n’aura aucun mal à identifier son propriétaire.

Pour éradiquer cet inconvénient, multipliez les liens dans votre article, surtout ceux qui vont vers des sites de confiance, comme Wikipedia, Youtube, Facebook, etc. Votre lien en sera d’autant plus crédible. Si vous êtes dans une logique purement trafic, utilisez différents raccourcisseurs d’URL.

Et j’en viens maintenant à notre cinquième et dernier problème: la date de publication du lien. Si vous créez une dizaine d’articles que vous publiez le jour même, la rapidité d’apparition de votre lien sera trop importante. Comme je vous l’ai déjà expliqué dans un un article précédent, la vélocité est certainement un indicateur très utilisé par Google. Différez donc de quelques jours la publication de vos articles, et espacez votre travail suivant des intervalles irréguliers.

Joyeux pivotage à tous !

C'est dingue !

Sérieusement, peut-on gagner de l’argent sur Internet ?

Cela fait maintenant des années que je promène mes guêtres sur la toile, depuis 1994 précisément et il m’arrive régulièrement de faire un petit bilan de ce que j’y découvert et appris. Je ne sais pas pourquoi, mais les sujets qui concernent l’argent m’ont toujours attiré, et même lorsque je recherche des photos de Laetitia Casta nue, j’échoue régulièrement sur des forums financiers ou apparentés.

Est-ce de la vénalité, du méchant capitalisme de bas étage, ou tout simplement un mauvais gène que m’a donné mon papa, boursicoteur invétéré qui doit tenir cela de sa maman, ma centenaire de grand mère qui m’a initié à la bourse alors que je n’avais que 21 ans. Je ne sais pas, c’est sans doute cela être humain. Quoiqu’il en soit, j’ai essayé beaucoup de trucs, tactiques, idées, méthodes, e-book, machins chose, et à l’aube de ma nouvelle décennie, celle qui commence par 4, mais qui ne m’oblige pas encore à me fournir en petite pilule bleue, je fais un petit bilan de ces quelques années passées à tenter de payer plus d’impôts.

Je précise tout de suite qu’il ne s’agit que de constations personnelles, et qu’il est hors de question que certains de mes disciples prennent ce que je dis pour argent comptant. La chose la plus importante, pour ma part, est qu’un Saint Graal est avant tout personnel, qu’il doit vous plaire, être adapté à votre style de vie, au temps que vous pouvez y consacrer et que ce qui marche pour vous ne marchera peut être pas pour votre petite amie qui a promis de vous acheter votre dernier ebook qui explique comment s’enrichir en vendant du tricot sur Facebook.

Tout d’abord, il faut vous dire que je suis un joueur, j’aime les casinos, surtout l’ambiance feutrée qui y règne, ses cocktails à 100€ le verre (glup !), et aussi les beaux décolletés que l’on voit malheureusement trop peu. L’avantage aujourd’hui, c’est qu’on joue dans son fauteuil, avec un bon verre de Château Neuf, et puis aussi un fond d’écran Aubade mais que j’ai dû récemment changer parce que ma fille regarde quelque fois Bambi sur mon PC.

J’ai beaucoup joué à la roulette, j’ai gagné, parfois même beaucoup et bien sûr perdu comme presque tout le monde. Mon analyse est que l’on ne peut pas gagner contre une roulette sur un casino en ligne pour plusieurs raisons.

Tout d’abord parce que l’on part avec un handicap certain: on n’a que 48% de chances de gagner, à cause du zéro. Ensuite, parce que je n’ai aucune confiance en un programme informatique qui décide de la couleur qui va tomber.

Les casinos ont beau avoir telle certification machin, telle garantie truc, permettez-moi d’être très dubitatif sur la chose: un véritable générateur aléatoire n’aura jamais la véritable qualité d’une vraie roulette. Donc exit cette façon trop hasardeuse de gagner de l’argent.

J’ai par la suite migré vers les paris sportifs et tout de suite aimé cette façon très rapide de gagner beaucoup d’argent. Avec les mois qui ont suivi,
je suis rapidement passé vers le trading sportif: vous achetez à quelqu’un d’autre un paris (Back) que vous revendez par après (Lay).

L’avantage est que vous passez d’une logique de résultat binaire ou soit l’on gagne, soit l’on perd, à une logique de demie mesure: vous gagnez un peu ou vous perdez un peu. J’ai fait cela un temps, cela m’a plu, puis un peu lassé. Si j’ai gagné ? Oui sans conteste et il m’arrive encore parfois de pratiquer mais sans plus, et à petite dose. En tout cas, je ne peux que vous conseiller de privilégier le trading sportif aux paris de base: vous avez beaucoup plus de chances de gagner sur le long terme.

Ensuite, je suis tombé dans quelque chose d’énorme: le Forex, le marché des échanges monétaires. Cela fait des années que j’évolue dans un milieu de boursicoteurs, et le Forex est une sorte de consécration. Je laisse à d’autres le soin d’expliquer de quoi il en retourne tellement il y a de choses
à dire à ce sujet. Cela fait maintenant 4 ans que je pratique, et c’est seulement que depuis peu que je commence à gagner de l’argent. Je déconseille toutefois de partir, comme cela à l’aveuglette: c’est le risque assuré de perdre de l’argent. Le mieux est de se trouver un mentor ou encore d’écumer les forums spécialisés pour se faire une idée et surtout se former.

Sur ces trois chapitres de ma vie, j’ai tout de même appris beaucoup de choses.

Tout d’abord, il ne faut pas s’éparpiller et bien se concentrer sur quelque
chose que l’on sent bien et surtout qui nous plait.

Ensuite, la gestion en elle même de l’argent est quelque chose d’absolument primordiale et qui ne doit pas être réduite à de simples virements Paypal ou autres. La méthode de gagner de l’argent, la stratégie, est certes un facteur important, mais elle se fait toujours au détriment de la gestion, ce que l’on appelle le Money Management en Anglais (MM pour les intimes).

Lorsque l’on joue au casino, que l’on parie ou que l’on trade sur le Forex, on se trouve dans une logique court terme basée généralement sur une seule opération ou sur une durée limitée: je joue Lyon gagnant contre Paris, je joue une heure à la roulette ou j’achète trois lots de EUR/USD. Ce que l’on a tendance à oublier, c’est que cette opération aura toujours une incidence sur les autres événements à venir, et qu’il est donc nécessaire d’être extrêmement rigoureux sur son propre MM et surtout d’intégrer le résultat dans une logique plus large.

Je vous cite l’exemple bateau de la roulette. Il existe une technique de « recovery » (récupération des pertes) toute bête, foncièrement idiote et à ne surtout pas utiliser: la martingale. Lorsque vous perdez, la « technique » consiste à doubler la mise pour récupérer ce que l’on a perdu. Le problème, c’est qu’il faut parfois plusieurs coups pour gagner et que par conséquence, il est nécessaire de posséder un capital suffisamment solide pour s’en sortir. En bref, c’est la ruine assurée et ce très rapidement. Mais vous vous êtes rendu compte que je n’avais parlé que des pertes. Quid maintenant de mes gains ? Pourquoi, mon MM doit-il s’appliquer uniquement en cas de pertes ? Lorsque je gagne, je peux également monter une martingale limitée à disons trois coups: comme ceci, je peux créer une provision pour mes pertes à venir, sans risque.

Toujours pour continuer sur l’idée du MM, il m’apparait vital de construire un objectif systématique de gain ou de perte. Par exemple, sur l’opération
que je compte réaliser, quel qu’elle soit, j’ai prévu de gagner 50€, j’accepte de perdre 30€ et surtout je m’y tiens ! Si je gagne, je mets 20€ de côté, et je réinvesti mes 30€ au prochain coup, comme cela si je perd sur la prochaine opération, je serai toujours avec un bénéfice de 20€, et je m’arrêterai là.

Dans l’hypothèse où j’aurai perdu, ma prochaine opération se fera avec comme objectif 80€ de gains (30 à récupérer + 50 de gains) et 60€ de pertes, mais en deux coups bien distincts: 40€ de gains * 2 et 30€ pertes * 2. Voici donc un exemple de MM sommaire, mais que l’on doit decoreller de la stratégie qui est un autre sujet. Une stratégie viable doit donc faire au moins 50% de réussite pour être utilisable sur une période donnée.

Bien entendu, la roulette sur le casino en ligne, avec son résultat binaire et ses 48% de chance de gagner est certainement le pire exemple où appliquer un MM rigoureux; préférez-lui une méthode où il existe des demies mesures, comme le trading sporting, le Forex ou même la Bourse si vous en faites. Je suis convaincu que la clé d’une réussite financière passe pour plus de 60% sur la façon dont on gère son argent, ce qui rentre et ce qui sort.

Et dernier petit détail que j’ai observé au cours de ces dernière années: il y a franchement beaucoup d’escrocs sur Internet, des marchands de rêve, des galopins, des mythomanes et des affabulateurs. Ce qui a aboutit à la conclusion suivante: les gens qui gagnent le plus d’argent sur Internet sont ceux qui expliquent comment en gagner.

Je fais ici une analogie avec un petit détail de  l’histoire du Far West que vous connaissez certainement: la ruée vers l’or n’a pas enrichi les mineurs, mais les marchands de pelle !

Et je vous conseille de jeter un œil au slogan du célèbre John Chow: « I Make Money Online By Telling People How I Make Money Online ». (Je gagne de l’argent sur Internet en expliquant aux gens comment je gagne de l’argent sur Internet). Assez révélateur, n’est-il pas ? Et John gagne plusieurs dizaines de milliers de dollars chaque mois avec un blog somme toute relativement intéressant, mais certainement pas de quoi fouetter un chat.

Rendez-vous dans dix ans !

Greves Actuellement en France

Le GAF (Grèves Actuellement en France) est un indice mesurant la pression gréviste sur le territoire Français. Il est calculé à partir du recoupement d’informations en provenance des médias. L’unité de mesure du GAF est le point. Le GAF est mis à jour toutes les 15 minutes, 24 heures sur 24.

Jour



Semaine


Mois

Année


Plus d’informations

Je suis content de mon FAI et je le dis

A mes camardes grévistes chroniques militant pour l’obtention de meilleurs fauteuils dans les locomotives, collègues syndicalistes exigeant un 16ème mois et les 28 heures par semaine, étudiants stagiaires en grève depuis maintenant deux ans et demie, je vous déclare une seule chose: Mon fournisseur d’accès à Internet se moque de moi.

Car cela fait maintenant plus de 4 ans que je suis client dans la même boutique, et je proclame solennellement que je ne suis pas suffisamment satisfait.

Mon précédent fournisseur, le très performant Easyconnect, aujourd’hui disparu, non pas pour des raisons financières, mais plus stratégiques était très bien, mais il était devenu beaucoup trop cher par rapport au marché. Je pense qu’il fallait y voir là un objectif non dissimulé de faire fuir leurs clients afin de pouvoir fermer boutique plus tranquillement. C’est pour cette raison que je suis désormais client dans une grande boutique qui a su garder des vraies valeurs, celles que l’on ne peut pas retrouver chez ceux qui ont fait le choix du libéralisme à outrance.

untitled-1


Certes, la connexion fonctionne bien et il y a bien eu quelques petits soucis, mais qui n’en n’a jamais eu ?

Bien évidemment, je devrai être en droit d’obtenir 100% de disponibilités, je paye après tout, c’est mon droit, et je rappelle à tous que je n’ai ni devoir, ni compte à rendre à personne ici: j’exige mes 100%, et non pas ce taux ridicule de 99,8% qui m’est honteusement proposé dans ces longues conditions générales de vente (Le contrat, quoi).

Mais il est pourtant clair que mes admonestations vont rester vaines, en dépit de mes efforts les plus sincères pour satisfaire des exigences tout de même fort légitimes.

J’ai même pensé un moment couper Pagasa et surtout le très utilisé test smtp pour obtenir gain de cause. Le but, c’est quand même de sensibiliser les gens à mon problème et surtout les défendre. Après tout, c’est pour vous, chers lecteurs, que je me bat contre cette injustice. Mais maintenant que l’on parle souci entre nous, cela me fait repenser à ces trois scandaleux problèmes que j’ai eu au cours de ces 4 années.

C’était un de ces étés pénibles, long et chaud pendant les derniers jours de mes 4 semaines de vacances du mois de Juin. J’avais encore 20 jours qui me restaient de l’année dernière, et je n’avais donc pas le choix, il fallait que je solde tout avant mon départ pour 5 semaines en aout au Samoa. A ce sujet, notre CE n’avait même pas eu les 50% de réductions habituelles, et cette année, avec le rush sur le Pacifique, nous n’avions obtenu que 35% ! Il fait chaud l’été à Lyon, j’ai rarement vu une année où nous ne tapions pas les 35° et plus, maudite région !

Et qui dit chaleur, dit bien entendu orage, et qui dit orage dit foudre, et qui dit foudre, dit foudre mais bien entendu chez moi, et pas chez mon vieil énergumène de voisin qui vote même pas UMPS, contrairement à moi. Il a rien compris ce type à la vie, comprend pas qu’on puisse exister avec de si mauvais préceptes idéologiques !

Mais pour en revenir à cette triste histoire, la foudre a eu finalement raison de mon modem ADSL. J’ai tout de suite appelé mon service client, et après 2 très longues minutes d’attente, j’ai eu un monsieur avec un accent de la Grrrrandheu Mottheu; franchement, je me demande bien où ils vont les chercher ces autochtones ? Ils pourraient tout de même les choisir un peu plus prés de chez nous ! Le monsieur a confirmé la destruction de mon modem en 30 secondes, et a préparé le dossier de remplacement en moins d’une minute. Il m’a quand fait perdre un peu de temps, ce vil serf: l’entretien a duré au moins 5 minutes, il était 18h45 et ma femme me pressait pour que je mette la table. J’ai quand même d’autres chats à fouetter, moi !

Le lendemain, j’aurai dû retravailler mais heureusement j’avais eu la présence d’esprit la veille de poser un de mes jours d’ancienneté, pas pour la circonstance mais plutôt pour pouvoir épuiser mon stock de 3 jours annuels, je me rend donc à une boutique pas loin de chez moi.
Notez bien que j’ai dû prendre la voiture du bureau: le bus ne circulait pas ce jour suite à une grève légitime pour protester contre les nouveaux horaires TCL ! Tant pis, je ferais une note de frais.

A la boutique, on m’a fait patienter: un Bobo devant moi se faisait rembourser intégralement son abonnement iPhone suite à de nombreuses coupures. J’ai pu enfin récupérer mon modem après 5 très longues minutes. Je rentre à la maison, je remets en route, et paramètre le modem. Ces ostrogoths avaient oublié de me redonner mon login et mot de passe, heureusement que j’avais conservé les infos dans un dossier, sinon j’aurais été dans la pénible obligation de rappeler le provincial. Je fais un test: ça marche.

Je regarde l’heure: 10h13, soit 18h37 d’interruption ! Je ferai opposition au prochain prélèvement !

raleur asterix


Ma deuxième issue était nettement plus subtile. Je dis issue par déformation professionnelle. Au bureau, nous travaillons avec beaucoup d’étrangers et nous sommes malencontreusement obligé de parler la langue de Freddy Mercury; c’est pour cette raison que je dis issue à la place de soucis, ca fait quand même plus professionnel. Donc, pour revenir à mon issue, il se fait que j’ai installé un dispositif de surveillance de ma ligne ADSL. Vous croyez que je peux accorder ma confiance à n’importe qui sur la base d’un seul contrat, moi ?

Et puis je me méfie, avec toutes ces histoires de Dadvsi, Hadopi 1, Hadopi 2, Loppsi 1 et Loppsi 2. Il parait que l’on surveille mes emails, et mes connexions pour voir si je ne télécharge pas le dernier film de Bakhtiar Khudojnazarov, cinéaste du Tadjikistan. Alors, c’est pour cette
raison que j’ai mis en place toute une machine infernale pour voir ce qui se passe sur ma ligne: ping, charge du modem, température du disque dur, vitesse de rotation des fans ventilateurs, pression de la pièce, degrés d’humidité, etc.

Un jour alors que j’étais en arrêt maladie suite à un aphte occasionné par l’excès de poivre contenu dans un potage Philippin que me prépare occasionnellement ma femme, je m’aperçois de la piètre qualité de ma ligne ADSL: je perdais 50% de mes paquets !

Excédé, j’ai tout de suite appelé mon service client pour leur expliquer ma façon de voir les choses. Après deux longues minutes d’attente, je leur explique que suite à l’envoi chronique de 5 paquets ICMP, j’obtiens un SLA de seulement 50% alors que mon uptime est garanti à 99,8% et que je ne suis pas content, et que normalement je devrai être à 100%, et que blabla, expert TCP/IP, blablabla, livre sur Sendmail, blablabla, Linux, blablabla, BGP, blablabla, @ »#?&??, blablabla, blablabla, blablabla.

Après 15 minutes de monologue pendant lequel j’ai dû dévoiler plus de 150% de mon pédigrée, je n’ai plus rien à dire, et le monsieur m’explique qu’il a bien pris note de mes doléances et qu’il va faire le nécessaire. Le soir même, tout était presque rentré dans l’ordre: mon SLA tournait à 99,9% au lieu des 100% que j’ai toujours exigé.

Raleur1

Mon dernier issue remonte à seulement quelques mois, durant le week-end du 15 aout. Je m’en souviens bien car Xav, lecteur assidu de Pagasa, était de passage à la maison avec sa femme. Bonnes valeurs que celles qui animent mon ami Xav: Belge, éducation catholique, amateur de Côte du Rhône, politiquement UMPS; un type bien, en définitif.

Donc suite au départ de Xav, j’étais en train de regarder Gulli sur mon 48 pouces acheté au CE quand j’entends le tonnerre suivi d’un gros Boum sur mon modem ADSL. J’y jette un œil: tout était éteint. Argh, je me suis encore pris la foudre, et je vais rater mon émission préférée ! J’appelle avec angoisse mon service client: nous étions le dimanche 16 aout 2009, et il était 19h00.

Curieusement, un monsieur me répond poliment en moins de deux minutes. Je lui explique que cela fait déjà deux fois que je me prends la foudre en 4 ans, que mon taux de disponibilité va encore s’effondrer, que j’ai déménagé de Lyon parce qu’à Lyon, il fait trop chaud l’été et que dans ma nouvelle contrée, la Dombes, il fait meilleur, quoique trop ventée, mais il y a toujours autant d’orages et la foudre qui, elle a aussi déménagé, continue de persécuter mon modem ADSL, que je suis dans une région infestée par des moustiques qui vous piquent les pieds en début de soirée, de préférence lorsque vous dégustez un Châteauneuf 1999 au bord de la piscine, que j’ai failli me prendre un de ces gros sangliers l’autre jour en revenant d’une réunion du CE, et que je veux pouvoir regarder Gulli dans les meilleurs délais, où sinon je leur fais un procès.


IMG_0845


Le monsieur poli me répond qu’il a bien noté mes revendications et que le nouveau modem ADSL sera prêt dès le lendemain, à partir de 8h30 dans n’importe quelle boutique de la région où je me présenterai. 8h30 ? Et pourquoi pas 6h30 tant qu’on y est ? Bien malgré moi, je reprend la voiture du CE le lendemain pour aller échanger la malheureuse box: les bus TCL ne circulaient pas en raison d’une grève pour le paiement des jours de grève.

Heureusement que j’avais quelques jours CE à prendre cette année; cette fois, je n’aurai pas à puiser dans mes 3 jours annuels d’arrêt maladie.

Cette fois-ci, je n’ai pas eu à faire la queue, et un autre monsieur poli m’a donné une box toute neuve, avec cette fois-ci un anti-foudre. Mais d’après un copain du CE, il parait que ça ne sert à rien, que la foudre passe quand même. Je reviens à la maison, je branche et re-paramètre; bien entendu, comme d’habitude, il manquait encore mon login et mon mot de passe. Les Lyonnais n’aiment vraiment pas les Chtis, bande de xénophobes ! En trois minutes, la box est re-paramétrée, et il n’est même pas 11 heures, en ce glorieux lundi 17 aout 2009.

Ainsi se termine cette longue série d’incidents, complètement indépendants de ma volonté. Vous avez la preuve que le service que je paye n’est pas entièrement à la hauteur de la qualité que tout Français normalement constitué est en droit d’attendre. Je tairais bien entendu le nom de ce fournisseur; sachez juste que son numéro de service client est le 3900, un numéro que j’utilise plusieurs fois par semaine pour exprimer mes griefs les plus légitimes.

Il faut maintenant que je vous laisse; il est 10h30 et je suis chez moi en train de préparer la réunion du CE, nous devons renégocier avec la
direction les modalités des absences irrégulières.


raleur

De bien dangereux domaines Internet

Dans ce monde virtuel très dangereux qu’est devenu l’Internet, un classement sur la dangerosité des domaines, les .com, .net ou autres .fr vient d’être publié par la société McAfee.

C’est le .cm du Cameroun qui remporte la glorieuse palme du domaine le plus dangereux au monde: 36.7% des sites ayant cette extension posent un problème de sécurité. C’est à cause de sa relative similitude avec son prestigieux cousin .com, que les cybers-escrocs l’utilisent souvent pour piéger leur victime à coup de malware.

Son presque homonyme, le .com voit son échelle de dangerosité grimper à 32.2%; il s’attribut ainsi la deuxième place.

La Romanie (.ro) est le domaine le plus utilisé pour le téléchargement de programmes infectés par les virus, adwares et autres spywares.

Quand au très bon marché .info ($0.99), il est considéré comme le plus gros générateur de spam au monde.

NOM/PAYS Extension Rang Echelle de risque 2009 Echelle de risque 2008
Cameroun .cm
1
36,7%
-
Commercial .com
2
32,2%
5,3%
Chine .cn
3
23,4%
11,8%
Samoa .ws
4
17,8%
3,8%
Information .info
5
15,8%
11,7%
Philippines .ph
6
13,1%
7,7%
Network .net
7
5,8%
6,3%
Union Soviétique .su
8
5,2%
-
Russie .ru
9
4,6%
6,0%
Singapore .sg
10
4,6%
0,3%

A l’opposé, l’extension .gov est synonyme de confiance avec une échelle de risque à 0%. Le Japon (.jp) prend la deuxième place avec seulement 0,1% de sites jugés à risque.

NOM/PAYS Extension Rang Echelle de risque 2009 Echelle de risque 2008
Gouvernement .gov
104
0,0%
0,1%
Japon .jp
103
0,1%
0,1%
Education .edu
102
0,1%
0,4%
Irlande .ie
101
0,1%
0,3%
Croatie .hr
100
0,1%
0,5%
Catalan .cat
99
0,1%
-
Luxembourg .lu
98
0,1%
-
Vanuatu .vu
97
0,2%
0,9%
Afrique du Sud .za
96
0,2%
0,5%
Suisse .ch
95
0,2%
0,9%

Si j’étais de l’équipe qualité de Google

Dans l’incessante partie de cache-cache qui m’oppose à Google, j’ai récemment commencé à m’intéresser de plus près à la façon dont leur équipe qualité évolue et bannit les sites qui gagnent plein d’argent ne rentrent pas dans leur critère.

Il se fait que ma situation professionnelle m’a justement amené à travailler dans la qualité au sein d’un très gros service informatique. Avec le temps, il m’est souvent arrivé de me dire que Google est certainement confronté aux mêmes problématiques que je rencontre tous les jours.

Mon travail consiste à évaluer les performances des différents prestataires informatiques évoluant au sein de l’entreprise. J’ai à ma disposition un gigantesque ensemble d’informations provenant de sources variées: fichiers, téléphones, bases de données, etc.

A partir de cela, je construis des indicateurs et fait des rapports, la plupart du temps sous forme de graphes et tableaux. Je fais aussi des analyses détaillées sur les chiffres que j’obtiens. Je peux aussi déclencher des alertes en fonction de critères bien précis.

La première chose à savoir, c’est que la production de ces indicateurs est généralement bien automatisée. En effet, des outils aussi géniaux que PHP, Oracle, Excel (Et oui !) ou encore XML permettent de traiter n’importe quel type de données. Mais la seconde chose que je constate, c’est qu’une bonne analyse ne pourra jamais être remplacée par un algorithme aussi puissant soit-il.

Je vous donne un exemple basique. Un technicien helpdesk gère une dizaine d’incidents par jour. Le technicien est bien noté et perçoit une prime en fonction du nombre d’incidents qu’il résout. Cette prime peut être automatiquement produite par un indicateur que je crée via un script qui va interroger la base de données des incidents. Un jour, je m’aperçois que cet indicateur s’est complètement effondré. Si je voulais agir à la manière d’un ordinateur, sa prime aurait dû être automatiquement réduite par l’algorithme. Mais après analyse, il s’avère que trois nouveaux techniciens sont arrivés au cours du mois et qu’ils ont été pris en charge par le technicien senior. Celui-ci a bien évidemment été forcé de réduire sa tâche de travail opérationnel (son nombre de tickets) pour former les jeunes recrues.

Il en ressort donc que l’on ne peut pas appliquer systématiquement une pénalité sur la seule base d’un indicateur calculé: il faut parfois une analyse complémentaire pour obtenir un résultat fiable.

Maintenant, je profite de ma situation pour me mettre à la place de l’équipe qualité de Google, puisque nous faisons un travail similaire. Tout ce que je vous livre est le pur fruit de ma réflexion professionnelle et n’est donc que spéculation. Mais je pense que cela vous amènera à réfléchir plus longuement sur leur problématique pour mieux la contourner.

Pour évaluer le résultat d’une requête, j’ai tout d’abord une problématique de taille: la volumétrie absolument gigantesque de l’information à traiter.

Le premier point est que je ne peux me permettre de mettre derrière chaque expression un analyste qui va décortiquer les résultats: il me faut des indicateurs, des alertes et surtout trier l’information. Je ne vais pas partir arbitrairement sur quelques mots clés. Après tout, il est très difficile d’évaluer le comportement d’un Internaute lambda: dans la vie de tous les jours, il ne passe pas son temps à chercher des vidéos ou acheter du viagra.

Pour ce faire, je commence par créer un indicateur de vigilance par expression. Celui-ci se calculera en fonction de la dynamique des liens et surtout des alertes que j’aurais généré dans mes analyses des backlinks. Ce dont je m’aperçois, c’est qu’il existe une grosse pression dans la construction des liens sur certains mots clé. C’est là que vont se dégager les « achat viagra » et autre « cialis », pourvoyeurs de très grosses quantités de liens.

Sur ce type d’expression, j’ai positionné mon indicateur à 5000. A côté du viagra, une longue traine comme « viagra pas cher à Douchy Les Mines » recevra une note de seulement 20. Grâce à la vigilance, je sais désormais où je dois appuyer mes analyses et mes efforts pour lutter contre le spam. J’ai ainsi résolu mon problème de volumétrie.

L’indicateur de vigilance va devoir évoluer avec le temps; dans la seconde partie où je détaillerai le fonctionnement de mon autre indicateur, j’aurai la possibilité d’augmenter ma vigilance. Chaque mois verra aussi la diminution arbitraire de ma vigilance, ceci pour pallier à une anomalie du système que l’on appelle le Buzz. Celui-ci est le résultat d’une actualité exceptionnelle mais qui ne représente pas véritablement un danger pour la pertinence des résultats: avec le temps, il finit par s’estomper. C’est le cas par exemple, d’un concours de référencement dont la vigilance va rapidement atteindre des sommets, avec un score de 4500 par exemple pour finir par dégringoler pratiquement à zéro quelques mois après la fin du concours.

Mon second indicateur est la vélocité. Les liens naturels sont variés et se construisent doucement au fil du temps. Le fait de passer de un à plus de 1000 backlinks en l’espace de quelques jours est un déclencheur élémentaire d’alerte. A chaque ajout de backlink, ma vélocité va augmenter. Mais tout comme ma vigilance, elle va aussi diminuer lentement au cours des jours à cause de l’effet Buzz.

Si ma vélocité dépasse un seuil alors je peux commencer par lancer une analyse automatique des backlinks. Il n’est pas bien difficile de déterminer la qualité d’un lien:

- les nouveaux liens sont-il uniformes ou pas (même mot clé sur même URL)
- combien d’OBL (liens sortants) sont présents sur la page ?
- la page contient-elle des mots clés disposant d’une vigilance importante (Viagra, Cialis) ?
- le lien est-il une ancre ou une url ?
- l’âge du domaine
- le profil du Webmaster (Voir Google, tu m’ennuies)
- etc.

A ce niveau, je peux déjà choisir de retirer automatiquement ou de pénaliser un site rien que sur quelques critères. Et si cela n’est pas probant, j’ai toujours la possibilité de me tourner vers la vigilance qui m’indique si je dois oui ou non engager une analyse manuelle.

Si l’une des analyses tranche en défaveur du sondé, qu’elle le déclare spammeur, alors la vigilance sera augmentée et assurera la pérennité de mon système de filtrage.

Voilà, vous avez désormais une idée de la façon dont j’aurai à gérer le filtrage si je faisais partie de l’équipe qualité de Google: en construisant un mécanisme composé de quelques indicateurs formant un scoring, et dans lequel l’analyse manuelle aurait toute sa place. Car comme, je vous l’ai déjà expliqué jamais un programme informatique ne sera capable de reproduire l’une des plus puissantes qualités de l’homme: le jugement.

Google, tu m’ennuies

Certes, cela fait désormais quelques années que je te pratique et on commence à bien se connaitre tous les deux. Mais après tout ce temps, tu n’as pas pu m’empêcher de développer une certaine méfiance à ton égard. J’ai d’ailleurs souvent l’impression que cette méfiance est réciproque.

Par exemple, tu t’es amusé à descendre la plupart de mes sites à PR0, tout ça parce que je vend des liens et que tu as proclamé que c’était mal, alors que toi même tu le fais. Faites ce que je dis, pas ce que je fais, c’est bien connu, surtout en politique. Mais pour en revenir à cette histoire de PR, moi après tout, je m’en fiche que tu casses le PR5 de Pagasa, ce n’est pas ça qui me ramène des visiteurs ici, tu le sais bien.

Ce qui m’ennuie, c’est la façon dont tu le fais, parfois sournoisement. Pour ta gouverne, j’ai deux types de sites: une catégorie bariolée d’outils Google (Adsense, Analytic, Sitemap & CO) et ceux là sont bien souvent dépourvus du moindre soupçon de PR. A contrario, j’ai d’autres sites dont tu ignores totalement l’identité de leur propriétaire, et qui n’ont jamais eu ce genre de problème.

Mon ami, je sais que tu sais. Avec tous les gadgets que tu proposes tu es parvenu à carrément me profiler: tu sais que je vend des liens chez TLA ou Linklift car il y a longtemps que ton équipe qualité a infiltré la majorité des régies. Tu sais aussi que j’ai déjà utilisé des outils pour générer des millions de pages de contenu. Malheureusement pour moi, j’avais oublié d’enlever le sitemap du site en question qui s’est vite fait bannir de ton index.

Ce n’est pas grave, Yahoo m’apporte encore beaucoup de visiteurs; mais tu es courant maintenant que ma façon de faire n’est pas toujours en corrélation avec tes recommandations. Tu m’as à l’œil, je le sais et les infos que tu glanes via ta Googlebar et tes cookies Dart ne font que renforcer mes présomptions.

Ainsi, je me rappelle d’un autoblog que tu as blacklisté injustement,
tout simplement parce qu’un des articles automatiques avait crée un buzz relatif propulsant le nombre de visiteurs à 500 par jour, ce qui sur un autoblog est quand même pas mal, je trouve. Mais ça, tu ne l’as pas accepté et cela n’a duré que trois jours avant le ban. J’ai été surpris de ton attitude car pour une fois, je n’y étais pour rien: les liens étaient complètement naturels et hors de mon fait. Mais pour ta défense, on va dire que tu n’apprécies pas particulièrement les autoblogs et que je demeure « quelqu’un à risque ».

Maintenant, je sais que pour réussir, j’ai deux possibilités: soit, je me crée une nouvelle identité en utilisant par exemple un compte différent pour chacun de tes outils, soit j’efface toute trace de mon passage; exit tes outils et Adsense, j’utiliserai d’autres façons de faire. Et j’oubliais aussi: mes domaines sont désormais protégés, cela me coute un peu mais il est hors de question que tu saches que je possède tel domaine et que tu sois ainsi capable de me profiler encore une fois.

En ce qui concerne l’adresse IP des sites, je sais que cela ne compte guère dans ton profiling car il y a trop d’incertitude derrière ce genre d’information: est-ce un serveur mutualisé ou personnel ? Appartient-il à tel profile ou pas ? Est-ce un site Zombie ou parasite ? Etc. A ce sujet, tu as parfaitement raison: l’adresse IP n’est pas et ne sera jamais une identité.

Et pour terminer, la dernière chose qui m’ennuie avec toi, c’est que tu ne seras jamais un fournisseur fiable. Te rappelles-tu de ce site que je possède toujours d’ailleurs ? Il était numéro deux sur un seul mot assez concurrentiel, juste derrière un vieux PR8 de 1995. Il m’apportait beaucoup de visiteurs et aussi suffisamment d’argent pour payer une retraite complémentaire pour toute la famille.

Du jour au lendemain, tu as décrété qu’il n’avait rien à faire en deuxième position et tu l’as expédié au fin fond des SERPS, réduisant ainsi 90% des revenus de ce site. Je te rassure tout de suite, tu continues à contribuer à ma retraite mais tu m’as clairement montré qu’en aucun cas, je ne pouvais te faire confiance dans les affaires et que si aujourd’hui, nous sommes de bons amis, demain nous pouvons être les pires ennemis au monde.

Jamais je ne jouerai ma tête sur ton bon vouloir, mais je te rappelle que tu as désormais des responsabilités, beaucoup de responsabilités et qu’il y a trop de monde qui subsiste grâce à toi. Le fait de gagner ou de perdre une place dans les SERPS peut représenter des dizaines de milliers d’euros de perdu ou de gagné, suivant que l’on soit du bon ou du mauvais côté.

Je ne suis pas inquiet car je sais qu’il n’y a rien d’immuable surtout dans les technologies de l’information. Te rappelles-tu seulement d’IBM ou encore de Novell, ces leaders déchus ? Ton tour viendra aussi inexorablement, mais en attendant ce jour fatidique, tu continues de m’ennuyer.

Frais de mutation: l’arnaque des syndics de copropriété

Dans la série des arnaques et escroqueries, je vous en livre une bien belle et franchement bien implantée. Il faut savoir que j’ai moi même été victime de cette arnaque, et qu’un jour ou l’autre, vous avez de grandes chances de vous la prendre dans la figure. D’ailleurs, quelques lecteurs de Pagasa sont directement concernés, comme Christophe et Karim; aussi, je vous expose les faits et vous donne quelques conseils.

Comme vous le savez déjà, j’ai récemment vendu mon appartement. A la signature de l’acte de vente devant le notaire, celui-ci prend des frais à l’acheteur; rien de bien nouveau jusqu’ici. Mais ce que vous ignorez peut-être, c’est que le syndic de copropriété vous facture une prestation que l’on appelle les frais de mutation.

D’abord, la première chose à savoir, c’est que ces frais s’appellent l’état daté et qu’il s’agit en gros d’un relevé de ce que vous devez à votre syndic ainsi que d’autres bricoles. Ces frais ne sont imputables qu’au vendeur. Si vous êtes acheteur, la loi ne prévoit pas que vous soyez redevable de ces frais.

La deuxième chose à retenir, c’est que ce document qui comprend de une à quatre feuilles vous est facturé une fortune. Pour ma part, j’ai payé 322 euros, et il n’est pas rare de voir des factures de plus de 500 euros !
Et d’après ce que j’ai pu découvrir, l’établissement de ces documents ne prend pas plus de deux heures de travail d’un comptable. (Edit: après quelques recherches, certains le font en 10 minutes !)

Une troisième chose qui n’est franchement pas clair, c’est qu’un syndic ne peut normalement pas vous facturer à titre individuel. Le contrat le lie uniquement au syndicat des copropriétaires, même si la clause figure dans le contrat. La preuve est là sous forme de question posée au gouvernement ainsi que sa réponse.

Maintenant si vous êtes vendeur, je ne peux que vous conseiller de refuser de payer ces fameux frais de mutation qui ne sont qu’une belle escroquerie; franchement 322 euros pour quelques papiers administratifs, il faut quand même pas exagérer !
Vous pouvez vous faire aider par l’association Unarc qui connait bien le problème.

Si vous êtes propriétaire, jetez un œil au contrat de syndic, et soulevez le problème du coût de l’état daté lors de l’assemblée. Je vous rappelle que vous devez approuver les comptes une fois par an. Pour ma part, je regrette de ne pas avoir plus souvent décortiqué ces comptes car on y découvre parfois des choses surprenantes. Un petit exemple qui m’est arrivé: un cahier d’entretien facturé 600€ !

A lire finalement, cet article très intéressant qui décortique toute la mécanique de cette escroquerie et l’arsenal juridique en face.

Content Spinning

Voici un outil en ligne pour réécrire automatiquement vos articles.

La syntaxe est très facile à utiliser:
{}: définit une zone de choix
| : définit les synonymes

Maxnod: un datacenter dans l’Ain

Le serveur sur lequel est hébergé Pagasa a été récemment déménagé dans un datacenter de l’Ain situé à une trentaine de kilomètres au nord de Lyon.

Son propriétaire, la société Maxnod m’a récemment ouvert ses portes afin que je puisse visiter leur datacenter. En voici quelques photos et aussi quelques explications.

Datacenter Maxnod L’entrée du datacenter
Batiment Maxnod Le bâtiment, au cœur de l’AIN.
Freecooling Maxnod Le système de refroidissement
Rafraichissement datacenter Ce système est appelé « Freecooling » ou refroidissement gratuit
Refroidissement gratuit datacenter Il s’inscrit parfaitement dans le « Green IT »
Refroidissement green IT Optimise le refroidissement et par conséquent la facture énergétique
Générateur de secours Le générateur de secours
générateur datacenter Capable d’alimenter le datacenter en cas de panne électrique
générateur de secours pour datacenter Le deuxième générateur électrique
Générateur électrique de secours pour Datacenter Dans un datacenter, tout doit être redondé
Interrupteur général datacenter L’interrupteur général électrique du datacenter (A ne pas toucher !)
Bureau datacenter Il reste de la place pour mettre des bureaux ou d’autres baies
Arrivée fibre optique L’arrivée de la fibre optique
Brassage fibre optique La baie de brassage optique
Baies datacenter Des baies dans le datacenter
Couloir de baies Un couloir de baies
Le serveur Pagasa C’est là qu’est hébergé Pagasa
Pagasa DELL Sur mon serveur DELL
maxnod Le datacenter utilise le GIX Lyonix pour ses connexions backbone

Maxnod s’appuie sur la fibre optique de Reso-LIAin pour son réseau. Cette fibre les relie aux deux points d’accès de Lyonix, le GIX Lyonnais. De là, il est possible de joindre directement d’autres GIX importants comme le CIXP de Genève ou TOPIX à Turin.

Je tiens à remercier chaleureusement Lionel Drevon pour son accueil ainsi que ses nombreuses explications techniques et vous invite à aller sur le site de Maxnod pour plus de renseignements.