Archive for the ‘Le référencement’ Category

SeoCamp Paris 1 : compte rendu et impressions

Dimanche, décembre 9th, 2007

Le premier SEOCamp a eu lieu hier à Paris. Wullon (Texuma) y était. Reportage.

PostgreSQL vs MySQL : la nuance

Mercredi, août 8th, 2007

En consultant simultanément les sites officiels de MySQL et PostgreSQL, un détail m’a sauté aux yeux : le title

  • MySQL AB :: The world’s most popular open source database
  • PostgreSQL : The world’s most advanced open source database

On pourrait bien sûr philosopher durant des heures sur ce détail (l’un aimerait mettre en avant ses innovations, l’autre qu’il est très populaire (mais les services les plus connus ne sont pas forcément les meilleurs),…). Ceci mis à part, le title (titre de la page qui apparait dans la barre du navigateur) est très important dans le référencement.

L’utilisateur lambda qui cherche une base de donnée pour son projet je va pas encombrer sa requête de world, most, popular ou advanced, il se contentera de open source et surtout database. Hors ces mot-clefs se situent à la fin dans le title de ces SGBD.

Lors d’une recherche Google pour database on tombe sur… rien qui concerne ces deux moteurs.

Pour open source database et les autres mot-clefs semblables, MySQL (en général 1er) arrive toujours devant PostgrSQL (généralement 3ème).

De mon point de vue, ils feraient mieux d’optimiser leur title plutôt que de se ridiculiser mutuellement, ils obtiendraient ainsi davantage d’utilisateurs.

Flux de syndication : abrégé ou complet ?

Jeudi, juin 7th, 2007

Les flux de syndication (RSS et Atom) sont légions sur le web. Chaque site dynamique se doit d’en posséder, que ce soit pour tenir sa clientèle ou sa communauté informé ou pouvoir diffuser simplement son contenu sur d’autres sites.

Cependant on se trouve confronté à deux formats principaux pour le contenu :

  • Le flux abrégé (seul quelques phrases ou une centaine de caractères introduisent l’article)
  • Le flux complet (où tout l’article y est présent)

Comme je le disais au début, ces flux ont plusieurs utilités. Et selon les utilisations, le choix du flux abrégé est vite une abomination pour le lecteur. Explications.

Si vous utilisez les flux de vos sites préférés sur des petits agrégateurs comme netvibes où vous vous contentez d’afficher le titre des articles, voir une centaine de caractères, le format des flux ne vous importe peu. Si le titre ou l’introduction vous plait, vous visiterez le site.

Par contre, si vous relevez les flux sur un agrégateur sous forme de logiciel pour les lire offline, par exemple en déplacement… vous ne supportez pas de devoir vous contenter du titre d’un article intéressant.

De mon point de vue, il n’y a pas de choix à faire : il faut le format complet . C’est à l’utilisateur de choisir ensuite comment il l’affiche (juste le titre, une centaine de caractères, complet,…). Les flux de syndication ne doivent pas être disposés dans le seul but de récolter des visites sur son site. C’est avant tout pour diffuser des informations.

MegaGlobe en beta

Mardi, mai 29th, 2007

Le moteur de recherche MegaGlobe commence à dévoiler une partie de l’iceberg au public en lançant le moteur en beta public (accessible via http://beta.megaglobe.com mot de passe : welcome ).

Ce moteur espère révolutionner le marché de la publicité par click grâce à son brevet Pay per Valid Click qui vise à éliminer les clics frauduleux et réduire ainsi l’argent gaspillé par les annonceurs.

Un algorithme maison basé sur un Megarank permettra de classer les milliards de résultats répartis dans des centaines de langues sur un peu plus de 300 noms de domaines.

Premières constatations :

  • Je suis situé en Suisse (ça c’est normal) avec la langue allemand (ça c’est pas normal. Il ne se fie pas à la langue du navigateur mais à l’adresse du propriétaire de l’ip ?)
  • L’interface est très simple (ceux qui l’ont vue m’ont dit : “C’est moche”). Moi je répond : normal, c’est une beta. L’utilité c’est que ce soit sobre et fonctionnel non ?
  • Les dates dans l’actualité sont au format américain en heure GMT.
  • La recherche est lente. C’est peut-être dû à ses débuts : peu de pages en caches ou pré-formatées.
  • Les parties publicitaires (annonceurs) sont déjà en place. C’est leur moyen de rémunération, mais en principe on attend d’avoir quelque chose de solide pour se rémunérer non ? De toutes manières leur audience ne doit pas être gigantesque actuellement.
  • L’algorithme ne se gêne pas de renvoyer des résultats en anglais s’il les jugent plus pertinents.
  • Les mots-clefs contenus dans le nom de domaine comptent peu comparé aux autres moteurs (google, exalead,…).
  • La densité de mot-clefs joue par contre beaucoup plus.

Personnellement je ne suis pas encore convaincu de la performance de l’algorithme. Nous verrons comment ça évolue.

En complément : Interview de Derrick Grissom de Megaglobe

Un projet libre alternatif : Valiz

BuzzRace, la course qui devient carnage

Samedi, mai 26th, 2007

 BuzzRace est une course au Buzz. L’idée était de faire découvrir rapidement Hellotipi.com à un maximum de personnes. La seule méthode efficace pour remplir cet objectif est le buzz.

Cependant, comment faire pour qu’il fonctionne sans trop d’effort ? Il suffit de lui donner un petit air de compétition, c’est ainsi que BuzzRace a été mis sur pied.

C’est une course très intéressante car elle se déroule dans un esprit de compétition très fair-play et démontre l’impact de certains blog et surtout de leurs communautés sur le web.

La course  a commencé depuis 10 jours, il ne reste plus que la moitié. Les plus gros blogs se sont lancés dans cette course et prenne un malin plaisir à s’étriper mutuellement. Chacun cherche à obtenir le soutien d’un maximum de parrain. Citons notamment Eric de Presse-citron.net qui a rallié Loïc Lemeur ou encore Gonzague qui a obtenu le soutien d’Otto pour écraser le citron. La course se joue actuellement entre ces deux blog, mais rien n’est joué.

Pour ma part, je donne un mini coup de pouce spontané à Eric :

Buzzrace - La course au buzz

Bonne chance et que le meilleur carnet d’adresse gagne ;)

LEMARR : Exalead manifeste

Vendredi, mars 30th, 2007

Exalead, société française spécialisée dans les moteurs de recherche pour entreprise, se fait connaitre via son moteur de recherche grand public. Mais pas facile de se faire entendre dans la cour des grands, jusqu’à présent une partie de son trafic était issu de partenariats avec des portails de services, mais certains ne seront pas renouvelés et Exalead cherche à grignoter sa part.
Pour se faire entendre, quoi de mieux qu’une manifestation ? C’est en partant de cette idée qu’exalead a lancé un mouvement, Le MARR (Mouvement Anti Recherche Relou). Les vidéos des plus brillantes manifestations peuvent être exposée sur Dailymotion.
J’espère juste que Google ne fera pas la même chose, ce serait le chaos mondial :°

Conseils pour débuter en référencement

Dimanche, mars 18th, 2007

Le référencement n’est ni simple, ni compliqué. En faisant les choses simples, elles le seront également pour les robots d’indexation et vous serez naturellement bien positionné.
Voici une liste de point faciles à suivre qui devrait vous garantir une bonne indexation :

  • Codez vos templates proprement : le code html ou xhtml doit être propre, structuré et lisible (sémantique). Ne le remplissez pas de balises de mise en forme inutiles, préférez une mise en forme par feuille de style css. Remplissez correctement les attributs alt et title des balises. Structurez votre contenu avec les balises <hx>.
  • Soignez vos title : Le titre de votre page (<title>Titre</title>) est très important dans le référencement, il ne doit pas se répéter sur plusieurs pages. Donnez un titre qui représente le contenu de votre page. Si une partie du title se répète sur tout votre site, mettez le à droite (par exemple le nom du site).
  • Nettoyez vos urls : Le nom de vos pages (fichier .html, .php, .asp,…) est très important, par exemple une page de présentation ne doit pas s’appeler page01.html mais presentation.html. De même, évitez les urls avec beaucoup de paramètre GET en php (lien.php?var1=xxxx&var2=xxx&var3=xxx), si vous êtes dans ce cas, il est très fortement conseillé de passer par la réécriture de lien, ce n’est pas si complexe que ça en a l’air et ça vous aidera beaucoup.
  • Attention au contenu dupliqué : Une page ne doit pas être accessible via plus d’une url. Faites particulièrement attention en cas d’utilisation de l’url rewriting, vos liens doivent toujours pointer avec le même nom. Votre site ne doit être accessible sous un seul nom de domaine, et uniquement avec ou sans www.. Voir mes billets : Duplicata avec ou sans www : c’est fini pour Google et www ou pas. Au besoin, utilisez le fichier robots.txt (googlebot supporte l’usage de * dans ce fichier).
  • Donnez un plan aux robots : Les robots explore naturellement votre site en fonction des liens qu’il rencontre sur votre site et les liens externes. Mais ils auront du mal à trouver du contenu caché (celui qui n’est accessible que via une recherche ou en fouillant dans les archives), ce contenu est souvent conséquent et peut mettre des mois à être indexé. Pour éviter les suprises, donné un plan du site aux robots. Google et Yahoo supporte le protocole du sitemap, générez le via un script maison aidé d’un cron ou à défaut, générez le via un site externe ou un logiciel. Cependant je vous conseille fortement de réaliser un script sur mesure pour cela, ça vous garantira des résultats et vous contrôlez facilement leur contenu.
  • Analysez ! : où passent les robots ? Utilisez Crawltrack pour suivre vos bots. Suivez l’évolution de votre site avec un outil de statistique basé sur les logs (fournis par l’hébergeur, généralement awstats, webalizer et/ou analog) et éventuellement un outil basé sur un marqueur javascript (google analytics, xiti,…). Utilisez également l’interface webmaster de Google et Yahoo pour suivre l’évolution de votre site.

En respectant cette courte liste de directives, vous devriez bénéficier d’une bonne indexation, nous verrons plus tard la liste des conseils pour un bon positionnement. Mais n’oubliez pas : si votre site est bien construit, structuré,… les bots s’y retrouveront facilement.

Polydoc, la future référence des développeurs

Dimanche, février 4th, 2007

Un site s’est donné comme objectif de devenir la documentation globale des développeurs : Polydoc.
Construit sur le concept du wiki, il propose de construire une documentation la plus complète possible sur les fonctions de chaque langage de programmation. L’idée n’est pas de concurrencer les documentations officielles, loin de là (bien qu’il y ait souvent des exemples sur polydoc, les explications sont souvent brèves et débouchent parfois sur les sites officiels), mais plutôt de faciliter les recherches et faire le lien entre plusieurs langages.
Le site est simple, ergonomique et très agréable à lire.
Déjà plus de 300 pages de documentations concernant 28 langages différents sont disponible et une petite communauté s’est déjà formée.
Personnellement j’aime beaucoup ce projet courageux et il rentre dans ma philosophie du libre partage alors je vais leur donner un petit coup de main pour concrétiser mon titre en référençant ce site comme il se doit.

Bon courage à tous les contributeurs ;)

Championnat du monde de référencement 2007

Lundi, janvier 15th, 2007

Aujourd’hui on est le 15 janvier 2007 et c’est le jour du lancement du championnat du monde de référencement 2007 (évidemment comme c’est américain, ça s’appelle The SEO World championship.

Ce concours est une édition “sérieuse“, c’est à dire :

Au menu des prix, on trouve une petite Citroën C2, une petite croisière aux Caraïbes, un petit téléviseur plasma et un petit peu de flouze.
Ce concours étant très attendus, les principaux noms de domaines sont déjà pris, certains par des petits malins qui comptent les revendre à prix d’or aux participants.
Les mot-clefs du concours sont globalwarming awareness2007 (définition, traduction et délires par notre ami wullon).

Bonne SEO ;)

Matt Cutts fait une mise au point sur les mises à jour des datacenters de Google

Samedi, décembre 23rd, 2006

Matt Cutts, un ingénieur de Google qui dirige une belle équipe (dont certaines personnes sont très connues dans l’histoire du web) est chargé depuis un bon bout de temps de travailler sur les mesures anti-spam (au niveau de l’index) de Google, de la qualité des résultats ou encore du contact avec les webmasters.
Suite à un énième sujet sur les forums de Web Masters World au sujet des mises à jour de l’index Google au travers des datacenters (centre de données, nid de serveurs) de Google, il a décidé de sacrifier les derniers moments qui lui restaient avant l’arrivée de sa famille pour noël pour écrire un billet sur son blog à ce sujet.

Il récapitule ainsi les différentes méthodes utilisées dans le temps par Google pour synchroniser les bases de données entre ses datacenters :

  • Entre 2000-2003, il y avait bel et bien la fameuse Google Dance qui, une fois par mois et durant une semaine, mettait à jour les index, page rank et autres backlinks
  • Depuis l’été 2006, l’index google est mis à jour régulièrement et les synchronisations se font de manière incrémentale tous les jours environ. Cela permet de garder une bonne intégrité et des résultats logiques pour tout le monde. Quand aux fameuses mise à jour des backlinks et Page Rank (qui a toujours aussi peu de valeurs actuellement), elles se font tous les 3-4 mois.

Ces confirmations ne sont pas superflues. Pour ma part, cela confirme ce que je pensais (je contrôle chaque jours l’état de plusieurs sites sur une vingtaine de datacenters et ils sont tous synchrones tous les 2 jours) et la fréquence des mises à jours du PR et backlinks correspondent aux observations de nombreux webmasters.