Post on 25-Jan-2015
description
1
Indexation et
optimisation
Technique
(SEO)
Présentation réalisée par Jean-Claude Domenget – MCF sciences de l’information et de la communciation – JCD blog à destination d’étudiants dans le web.
Diffusable sous licence Creative Commons – by-nc-nd 2.0 http://creativecommons.org/licenses/by-nc-nd/2.0/fr/
2Indexation et optimisation technique JCD blog
Les actions de référencement naturel Principes du référencement SEO
Indexation et optimisation technique
Optimisation éditoriale
Inscription dans les annuaires, maillage interne et liens entrants
Recherche universelle et derniers moteurs
Mesures d’audience (outils, KPI, tableaux)
Visibilité et présence sur les médias sociaux
3
Optimiser l’indexation de votre site
Google indexe naturellement votre site.
Vous pouvez néanmoins améliorer l’indexation de votre site :
travailler l’accessibilité pour les robots (fichier robots.txt, fichier sitemap)
éviter les freins au référencement
JCD blogIndexation et optimisation technique
4
Le fichier robots.txt
JCD blogIndexation et optimisation technique
5
La syntaxe d’un fichier robots.txt
Ce fichier explique au moteur où il ne doit pas aller, avec l’instruction : « Disallow » suivie soit d’un répertoire, soit d’un fichier.
User-agent: *
Disallow: /cgi-bin/
Disallow: /tempo/
Disallow: /abonnes/prix.html
User-agent: Googlebot
Disallow: /cgi-bin/
Disallow: /perso/
Disallow: /entravaux/
+ Depuis 2007, indication de l’adresse du fichier sitemap dans le fichier robots.txt :(user-agent ; disallow, sitemap (Url))
JCD blogIndexation et optimisation technique
6
Créer un fichier robots.txtCf :https://www.google.com/webmasters/tools/dashboard?hl=fr
JCD blogIndexation et optimisation technique
7
Où placer votre fichier robots.txt
Le fichier texte robots.txt est à placer à la racine du site :
http://monexemple.com/robots.txt
Ou http://premier.monexemple.com/robots.txt
JCD blogIndexation et optimisation technique
8
Le fichier sitemap
Fichier Sitemap = plan du site au format xml
Il s’agit de la liste des adresses de vos pages.
4 informations sont distinguées : adresse – dernière modification – fréquence de mise à jour – priorité d’indexation.
<urlset>
<url>
<loc>http://www.lemechantlipdub.fr/</loc>
<lastmod>2009-04-04</lastmod>
<changefreq>daily</changefreq>
<priority>1</priority>
</url>
</urlset>
Pour plus d’informations, voir : sitemaps.org
JCD blogIndexation et optimisation technique
9
Créer un fichier sitemap
Ex : Cf Création d’un fichier sitemap dans le centre d’aide pour les webmasters.
Possibilité de
- créer un sitemap en fonction du protocole sitemap ;
- créer un sitemap à l’aide d’un fichier .txt ;
- utiliser un flux RSS/Atom sous forme de fichier sitemap.
Liste de liens d'outils pour créer un fichier sitemap : nouveau générateur de google - outils tiers - outils pour wordpress - Outils pour Dotclear - ou auditmypc google sitemap generator
JCD blogIndexation et optimisation technique
10
Faire connaître votre fichier sitemap
Google :
utiliser Outils pour les webmasters
Yahoo :
utiliser Yahoo ! Search
JCD blogIndexation et optimisation technique
11
Les freins au référencement
Certains choix de programmation constituent des facteurs gênant ou bloquant au référencement
Les Frames
Le Javascript
Les pages trop graphiques
Le flash
La duplication de contenu
Les URL exotiques
Les redirections trompeuses
Les techniques de spam (pages satellites, cloaking etc.)
Cf La présentation faite par David Degrelle en 2008 à Montbéliard pp.18 à 34
Cf Les obstacles au référencement (Action-rédaction)
JCD blogIndexation et optimisation technique
12
Les freins au référencement
JCD blog
Cf Présentation de Sébastien Billard lors du SEO campus 2009
Indexation et optimisation technique
13
Conseils
L’indexation de flash pose toujours problème. Eviter les sites full flash sinon fournir un contenu alternatif en swfobject
Ex : http://www.etc-creations.fr/
Les menus déroulants, les pop ups et les contenus AJAX posent problème. Le langage Javascript peut être accessible en venant en surcouche du HTML
Les moteurs ne savent pas remplir les formulaires. Seuls les résultats de type GET sont indexables et il faut prévoir une navigation alternative
JCD blog
Source : cours 4 optimisation structurelle de Sébastien Billard pp. 11 à 22
Indexation et optimisation technique
14
Conseils (2)
Les images doivent être dotées d’un attribut alt pertinent
Les balises sémantiques doivent être utilisées pour leur fonction <strong>. Ne pas les détourner.
La duplication de contenu provient de doublons qui peuvent être éviter notamment par des redirections 301et balise link rel=canonical
Les redirections doivent être définitives 301 et non temporaires 302
http://www.webrankinfo.com/dossiers/debutants/initiation-aux-redirections
JCD blog
Source : cours 4 optimisation structurelle de Sébastien Billard pp. 23 à 40
Indexation et optimisation technique
15
Optimiser techniquement votre site
Précisions
L’optimisation technique est la première étape d’un référencement de qualité, le socle de votre travail de référencement;
Suivront ensuite, l’optimisation éditoriale (création d’un contenu de qualité) et les actions de linking pour améliorer la popularité du site (actions pour augmenter la visibilité du contenu).
JCD blogIndexation et optimisation technique
16
Discussion quant à l’utilité de 4 critères d’optimisation technique
Balise Title
Texte visible et soin du code (X)HMTL
Balises meta
Attribut alt
+ Une technique d’optimisation : l’URL rewriting
JCD blogIndexation et optimisation technique
17
Balise TITLE
La balise TITLE est un des critères essentiels d’optimisation SEO
Elle s’affiche comme titre de page dans votre navigateur
Ex : <title>JCD - blog: pre-requis seo - referencement naturel - version 2010</title>
Règles :
Chaque page web possède son titre propre
Ce titre est en relation avec le contenu de la page
Le titre ne doit pas dépasser 69 caractères
JCD blogIndexation et optimisation technique
18
Erreurs :
Un seul titre pour toutes les pages
Un titre n’est pas une liste de mots clés
Pas de titres multilingues
Conseils :
créer des pages mono-thèmes – multiplier les pages. Le titre doit être un résumé de la page (éviter donc les pages multi-thèmes)
JCD blogIndexation et optimisation technique
19
Texte visible et soin du code (X)HTML
Le texte visible comprend outre le titre de la page, le contenu textuel de la page, y compris la légende des images. Autrement dit tout texte qui n’est pas lissé ou inaccessible au robot.
L’optimisation technique d’une page passe par la rédaction d’un code propre
Règles :
Respecter la sémantique des balises (X)HTML (vérification par Lynx cf cours 4 Sébastien Billard p.8)
Utiliser la balise <H1> pour le titre de l’article et <H2>, <H3> etc. pour les sous-titres
JCD blogIndexation et optimisation technique
20
Utilisation de la feuille de style CSS pour mettre en page, avec les balises de fonction <div> (positionner un bloc) et <span> (modifier le style d’une portion de texte).
Mise en valeur des mots clés avec les balises d’indication <strong> (moteurs) et <b> (lecteur)
Longueur des articles : si possible supérieur à 200 mots descriptifs (Olivier Andrieu). Google prend en compte les textes entre 110 et 1320 mots (Maxime Grandchamp).
L’attribut SWF Object pour proposer un contenu texte alternatif à une animation flash
JCD blogIndexation et optimisation technique
21
Erreurs :
Des pages ou des images trop lourdes (100 ko max environ)
Une page ne contenant qu’une animation flash – Nécessité d’avoir un contenu texte visible et une image
Détourner des balises. Utiliser des balises de mise en valeur du contenu au lieu de balise sémantique. Ex : <b> au lieu de <strong>
JCD blogIndexation et optimisation technique
22
Balise meta description
La balise meta description n’est plus prise en compte pour le positionnement d’une page web
Elle permet de donner une indication pour le texte descriptif affiché sous le titre de page, dans la page de résultats des moteurs de recherche (snippet)
Règles :
Chaque page web doit posséder une description propre
La description doit contenir les mots clés visés par la page
La description ne doit pas dépasser 152 caractères
Erreurs : Une desciption n’est pas une liste de mots clés
JCD blogIndexation et optimisation technique
23
Balise meta keywords
La balise meta keywords n’est plus prise en compte pour le positionnement d’une page web
Elle ne peut avoir d’intérêt que pour faciliter l’inscription de votre site dans des annuaires
Règles :
Elle contient une liste de mots clés en relation avec la page
Indiquer l’univers sémantique des mots clés visés, les variations de genre et de personne
JCD blogIndexation et optimisation technique
24
Balise meta robots
La balise meta robots est prise en compte par les moteurs
Elle sert à définir des restrictions au robot qui vient scroller vos pages
Les valeurs principales :
noindex, (pas de crawl avec le fichier robots.txt)
nofollow, (ne crawl pas le lien)
noarchive, (pas d’accès à la version cache dans les résultats)
Noodp (descriptif de DMOZ pas pris en compte)
Cf L’article de Webrankinfo sur les balises meta
JCD blogIndexation et optimisation technique
25
L’attribut alt de la balise <img>
L’attribut alt permet de proposer un contenu texte alternatif à une image. Ce contenu texte est pris en compte par les robots pour identifier les images.
Règles :
Rédiger un texte alternatif court contenant les mots clés visés par la page.
Erreurs :
Désigner une image par un code passe-partout. Ex : 0001.jpg
JCD blogIndexation et optimisation technique
26
L’URL rewriting
La réécriture d’URL permet de modifier les URL exotiques.
Elle n’a pas forcément d’impact sur le positionnement mais sur l’incitation au clic
Adresse type : type / genre / produit – voiture / monospace / C4 picasso
JCD blogIndexation et optimisation technique
27
Pénalités Google
Risques de dénonciation avec formulaire Spam Report
Techniques à ne pas utiliser : pages satellites, cloaking, liens cachés...
La sandbox / “courbe de vie d’un site”
Le déclassement = “minus 30”, “minus60”, “postion 6 penality”
La liste noire = désindexation de l’index principal # déclassement
JCD blogIndexation et optimisation technique
28
Optimisation du délai d’indexation
Juste lancé, déjà indexé ?
Mise en ligne d’une version provisoire du site
= version attractive, proposition de contenus dès le départ, mise à jour fréquente de la page d’accueil, obtention des 1ers liens, inscription dans annuaires dès sa sortie, présentation du site sur forum, blog
Si absence de référencement ?
= référencement # positionnement, liste des pages indexées “site:”, blocage, manque de liens entrants, utilisation de technologies bloquantes, autre site pénalisé sur un serveur mutualisé
JCD blogIndexation et optimisation technique
29
Votre CMS est-il “SEO Friendly” ?
Avez-vous la main sur 100% du code HTML généré par votre solution ?
Pouvez-vous personnaliser le contenu des balises ?
Votre solution génère-t-elle de la duplication de contenu ?
Utilisez-vous des technologies qui bloquent les moteurs ?
+ Réécriture d’URL, rubricage – navigation, arborescence, suppression cookies – javascript, erreurs, fichiers et balises sémantiques, contenus multimédia etc.
JCD blog
Cf : SEO et Joomla ! Comment tirer le meilleur parti du CMS – Philippe Yonnet
Indexation et optimisation technique
30
SEO et Joomla !
Problèmes Joomla / SEO = Réécriture URL, champs manquant, souplesse structurelle etc.
URL = pour que URLs deviennent SEF (search engine friendly)
Cf Joomla.org
Templates SEO : code léger, pas de facteurs bloquant, respect des balises sémantiques
Plugin SEO = sh404SEF (incontournable) – ensemble avec Joomla! Meilleur que des CMS réputés / SEO
JCD blogIndexation et optimisation technique
31
SEO et wordpress !
Un code source propre et compréhensible
Des thèmes déjà orientés SEO par défaut
Un système de ping et de trackback
Une URL propre avec les permaliens
Une structure basée sur les catégories et les mots-clés
Un ensemble de plugins à intégrer
Le fichier functions.php
Les taxonomies et le custom_post_type
JCD blogIndexation et optimisation technique
User-agent: *
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: */trackback
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.txt$
Allow: /wp-content/uploads
User-agent: Googlebot-Image
Allow: /
User-agent: Mediapartners-Google
Allow: /
Sitemap: URL-de-votre-sitemap
Source : Olivier Andrieu
32
SEO et blog
Certains CMS offre une aide avantageuse. Matt Cutts a indiqué que wordpress règle 80 à 90% des aspects relatifs au SEO.
Le guide du référencement de blogs de webrankinfo
(dont proposer des flux RSS – articles associés – tags – bookmarks sociaux)
Et utiliser les plugins qui vont bien avec parcimonie !
JCD blogIndexation et optimisation technique
33
Temps de chargement
Optimiser
Tester notammnet avec outils disponibles dans GWT
Compresser avec par exemple Gzip pour Apache
Activer le cache du navigateur
Activer le préchargement des pages
Synchroniser avec serveurs tiers
Mesurer avec le code GA asynchrone
JCD blogIndexation et optimisation technique
34
Temps de chargement (2)
Compacter les fichiers CSS
Regrouper les images dans des sprites CSS
Positionner en bas de page les fichiers Javascript
Optimiser les images
Fidéliser vos utilisateurs
JCD blogIndexation et optimisation technique
35
Impact du respect des normes W3C
Des pages 100% compatibles avec le standard du W3C ?
Service “validateur W3C”
Utilité en SEO ?
Enjeux plutôt d’accessibilité et de compatibilité
JCD blogIndexation et optimisation technique
36
Les questions de l’âge et de la fraîcheur
Fraîcheur de l’information
L’âge d’une page
Pages anciennes ou pages récentes ?
Les requêtes QDF (Query Deserves Freshness)
JCD blogIndexation et optimisation technique
37
Les sites multilingues
Un nom de domaine par langue
Un sous-domaine par langue
Un répertoire par langue
Des pages multilingues
JCD blogIndexation et optimisation technique
38
Conclusion
L’optimisation technique est le premier maillon d’une stratégie de référencement. Elle en constitue son socle.
Elle doit faciliter le travail d’indexation des robots.
Elle favorise un bon positionnement des pages sur les mots clés visés.
JCD blogIndexation et optimisation technique
39JCD blog
Pour aller plus loin :Cf les cours de Sébastien Billard – master 2 IDEMM.
Cours 4 : Optimisation structurelle pour le référencement
Indexation et optimisation technique