L’optimisation technique d’un site web multilingue
À mesure que l’audience mondiale accède au Web à travers une multitude de périphériques et de navigateurs, il est important de pouvoir contrôler la publication des contenus multilingues du site de manière cohérente et rapide afin de fournir une excellente expérience utilisateur. Lors de l’optimisation technique, nous nous assurons que le site web multilingue est bien conçu, de façon à améliorer son référencement à l’international.
Les moteurs de recherche qui parcourent internet à la recherche d’informations à indexer doivent être en mesure d’interpréter facilement le contenu de votre site web, surtout lorsque celui-ci est rédigé dans une langue étrangère. Google tente de déterminer la langue de chacune des pages de votre site. Avec un site bien conçu sur le plan technique, vous pouvez améliorer votre référencement, et toucher vos clients potentiels sur les marchés étrangers.
L’optimisation technique de votre site n’est qu’un des aspects du processus de référencement à l’international, mais plus votre interaction avec les moteurs de recherche de vos marchés cibles sera fluides, meilleures seront vos possibilités d’obtenir un bon référencement à l’étranger.
L’optimisation on-page pour les sites conçus en une seule langue n’est certe plus aussi importante qu’elle ne le fut par le passé: les moteurs de recherche sont aujourd’hui plus performants et sont à même de compenser certaines erreurs dans le code source du site web. La situation est très différente pour les sites web ayant une dimension internationale. Un site multilingue ciblant différents marchés nécessite un niveau supérieur d’optimisation technique pour s’assurer de sa bonne indexation sur chacun des marchés ciblés.
Architecture du site web
L’analyse de l’architecture du site nous permet de comprendre la façon dont l’information circule. Nous évaluons en particulier différents aspects critiques pour un bon référencement multilingue:
• Le nom de domaine : faut- il poursuivre une approche multi-domaine, ou avoir des sous-dossiers ou sous-domaines ? Un nom de domaine local est la meilleure option pour le SEO international mais il faudra s’assurer de proposer un contenu pertinent et adapté à l’audience, enrichi régulièrement, pour chaque domaine local. L’effor tà fournir pour l’obtention de backlinks de qualité sera aussi plus important lors d’une approche multi-domaine.
• Navigation du site: celle-ci doit être suffisamment intuitive pour l’utilisateur. Si la navigation est fluide pour les utilisateurs, ce sera aussi le cas pour les moteurs de recherche : l’exploration du site sera plus aisée. Il est donc important que le site web soit bien organisé, avec des thématiques similaires regroupées par catégorie.
• Les liens internes au site peuvent influencer le référencement , il donc mettre en place une stratégie de linking interne efficace.
• Structure des répertoires du site web : pas plus de 4 niveaux de hiérarchie pour atteindre la page du produit final . La structure du site pourrait ressembler à ceci : www.votresite.com / fr /categorie-principale /sous-categorie /pageproduit.html
Codes d’état HTTP
Les codes de réponse du serveur peuvent également avoir un impact sur le référencement. Lors de l’optimisation multililingue de votre site, nous détectons les codes du type 301, 302, et le tristement célèbre erreur 404. Ces codes correspondent aux réponses de serveur lorsqu’un utilisateur tente de demander une page. Ces réponses peuvent être 200, 301, 302 ou 404.
Un code réponse 301 signifie que la page demandée a été déplacée de façon permanente vers une nouvel les url Le code 302 indique une redirection temporaire.
Lors de l’analyse du site, nous recherchons les redirections 301 et 302 car les moteurs de recherche indexent l’URL de destination finale. Les 302 indiquent une redirection temporaire, et les moteurs de recherche l’ignoreront. Pour cette raison, nous devons faire en sorte que s’il y a des redirections, alors celles-ci soient de type 301 car elles seront prises en compte par les moteurs de recherche, et elles permettent de transmettre le PageRank d’une page à l’autre.
Le code 404 signifie que la page demandée n’a pas été trouvée. Cela peut être par exemple un lien brisé. Les liens brisés peuvent bloquer les moteurs de recherche et il faudra les réparer. Google Webmaster Tools, ou d’autres outils tels que Screaming Frog fournissent également une liste détaillée des liens brisés sur votre site.
Crawling et Indexation
Si les pages de votre site ne peuvent pas être analysées par un moteur de recherche, celui-ci ne sera pas indexé par les moteurs de recherche . Il existe de nombreux points sensibles au sein d’un site, pouvant entraver la capacité d’un robot à explorer votre site. Le problème le plus fréquent est celui des liens brisés donnant lieu à des erreurs 404 sur votre site. On pourra citer également d’ autres freins à l’indexation : le contenu en Flash, l’utilisation de l’ajax, les iFrames ou l’insertion de liens à l’intérieur de JavaScript.
URLs dynamiques ou URLs non optimisées
Si vous disposez d’un site de e-commerce, alors il est possible que l’information concernant vos produits soit extraite d’une base de données, donnant lieu à la présence d’ID et / de sessions dans les urls. Cette approche peut être source de problèmes, puisque les robots chargés de crawler le web à la recherche d’informations pourront rester bloqués sur certaines sections de votre site à cause de la présence de caractères spéciaux dans les urls. Les moteurs préfèrent des urls simples et statiques par opposition à des urls dynamiques. Nous veillons donc bien à que vos urls soient optimisées.
Problèmes de contenus dupliqués
Le problème de duplicate content rencontré le plus fréquemment est d’ordre interne : le contenu est alors dupliqué sur plusieurs pages du site web. Quand un moteur de recherche peut accéder et indexer de multiples versions d’une même page, il y a une forte probabilité que le moteur filtrera les résultats dupliqués, ce qui peut donner lieu à une pénalisation du site.
L’exemple le plus commun de contenu dupliqué externe se retrouve sur les sites e-commerce où la description du produit d’un fabricant est reprise par presque tous les ecommerçants qui commercialisent ce produit, votre site pouvant alors apparaitre en retrait, ou être pénalisé pour la publication de contenus dupliqués. La meilleure façon de déterminer si le contenu de votre site est dupliqué sur d’autres sites est de le vérifier avec des logiciels tels que CopyScape.
Pour éviter ce type de situation désagréable, pouvant donner lieu à la désindexation des pages concernées, et à ce que votre site soit rétrogradé dans les rankings, nous recommandons de personnaliser la description du produit de façon à le différentier de ceux proposés par vos concurrents.
Temps de chargement du site
Un site dont le temps de chargement est long verra le taux d’abandon augmenter, et le taux de conversion diminuer. Il conviendra d’analyser le poids des pages de votre site. Nous vérifions s’il y a un usage excessif de scripts, si les images ont bien été optimisées et comprimées, si l’utilisation de Flash est réduite à son strict minimum. Idéalement, le poids maximum d’une page doit être de l’ordre de 130K pour la page d’accueil et de 180K pour toutes les autres pages. Si le site dispose d’une version mobile, les pages proposées devront être d’un poids encore inférieur.
Il est impératif de vérifier la vitesse de chargement de votre site multilingue depuis les différents points du globe oú se trouve votre audience. Pour cela nous utilisons différents outils tels que l’extension Pagespeed de Firebug, ou Google Webmaster Tools qui nous montre également comment votre site fonctionne en terme de performances. La mise en place d’un CDN (Content Delivery Network) améliorera votre référencement sur les marchés étrangers.
Les Sitemaps XML
L’envoi de votre sitemap XML actualisé directement aux moteurs de recherche peut contribuer à ce que ceux -ci indexent plus rapidement les nouveaux contenus de votre site. La plupart des moteurs de recherche donnent la possibilité aux webmasters de soumettre un sitemap XML, ce qui leur permet de découvrir l’ensemble du contenu de votre site et de réduire les problèmes de contenus dupliqués.
Dans le cas d’une structure d’urls avec sous-dossiers, s’assurer de bien créer un site map différent par langue et sous-dossier, et de créer un compte indépendant dans Google Webmaster Tool pour chaque sous dossier afin d’enregistrer le sitemap.
Utiliser les annotations hreflang
Un problème courant avec les sites multilingues ciblant différents pays, c’est que beaucoup d’entre eux proposent un contenu semblable ou très similaire puisque le contenu traduit ne varie pas de façon significative d’un pays à l’autre. Les contenus dupliqués peuvent conduire à ce que certaines versions linguistiques dupliquées de sites soient désindexées.
La solution consiste à ajouter dans le code de la page les annotations rel= »alternate » hreflang= »x » pour indiquer à quel pays le contenu s’adresse .
Imaginons que votre page est en langue anglaise et s’adresse aux anglophones du monde entier. Vous avez également créé une version de cette page pour vos clients australiens, et une version pour les canadiens:
Voici l’ensemble de vos annotations:
<link rel="alternate" href="http://example.com/en-ie" hreflang="en-ie" />
<link rel="alternate" href="http://example.com/en-ca" hreflang="en-ca" />
<link rel="alternate" href="http://example.com/en-au" hreflang="en-au" />
<link rel="alternate" href="http://example.com/en" hreflang="en" />
Compatibilité des navigateurs
Internet Explorer, Firefox, Chrome, Safari, Opera … Nous nous assurons que votre site web multilingue soit bien compatible avec tous les navigateurs.
Utilisation des caractères UTF-8 / système Unicode
L’utilisation de caractères spécifiquez à certains alphabets, ou de caractères spéciaux, peut donner lieu des erreurs lors de leur restitution si ceux-ci n’ont pas été correctement encodés. Ainsi, il faudra s’assurer que les caractères typographiques utilisés par votre site web sont correctement interprétés et restitués sur l’ensemble des zones et langues ciblées par votre site internet. Les erreurs liées à la reconnaissance erronée de caractères, à des mots-clés manquants dans les titres et les balises alt d’image, par exemple, peuvent affecter le référencement d’un site sur le marché cible.
Le système d’encodage de caractères le plus largement utilisé est «Unicode». «Unicode» est adapté à la plupart des caractères et des langues de la planète, et il est correctement interprété par les systèmes d’exploitation. On pourra donc opter pour l’utf-8 dans le cadre des sites web multilingues.
Pour utiliser Unicode dans les pages écrites en HTML 4, rajouter la ligne suivante dans l’en tête des pages du site:
<meta http-equiv= »Content-Type » content= »text/html;charset=utf-8″>
Pour l’ utiliser avec HTML 5, on spécifiera:
<meta charset= »UTF-8″>
Sens de l’écriture
Parfois, le site web multilingue devra proposer un contenu dans une langue s’écrivant de droite à gauche plutôt que de gauche à droite. Nous devrons alors nous assurer que le sens du texte est correctement indiqué dans le code de la page. On pourra définir le sens du texte en utilisant l’attribut ‘dir’ dans l’élément HTML. Pour les langues comme l’arabe, le persan et l’ourdou l’ attribut ‘dir’ devra ainsi être réglé sur la valeur rtl (de droite à gauche (right to left):
<html dir= »rtl »>
Un attribut ‘dir’ n’est pas nécessaire pour les pages écrites de gauche-à-droite dans des langues telles que l’anglais, car c’est le sens du texte par défaut.
Des mises en page différentes sont parfois nécessaires pour passer à une langue s’écrivant de droite à gauche. Cela signifie que la mise en page devra être adaptée à ces langues. Par exemple, le site des Nations Unies adapte sa mise en page à la langue arabe qui s’écrit de droite à gauche, celle-ci étant inversée par rapport aux mêmes pages en version anglaise.
L’agence Openvalley adapte la mise en page de votre site web à une écriture du type RTL lorsque cela est nécessaire.
Hébergement & Adresse IP
La situation géographique d’un site web est un facteur qui influe sur le ranking de Google. Un site web hébergé localement pourra influer positivement sur le référencement du site web, et la géolocalisation par ip peut s’avérer utile, même s’il s’agit d’un facteur qui peut être facilement contrebalancé par les options de ciblage géographique de Google Webmaster Tools.
En revanche, le temps de réponse du serveur, et donc sa proximité géographique, joue un role sur le référencement local. Il faudra donc dans certains cas avoir recours à un CDN (Content Delivery Network) qui permettant de mettre en cache le site web pour le restituer localement de façon performante.
Utiliser les rich snippets ou extraits enrichis
Les rich snippets ou contenus enrichis vous permettent d’afficher des données supplémentaires dans les résultats de recherche Google. La possibilité d’enrichir son contenu avec les rich snippets permet à Google de publier des données supplémentaires venant se greffer sur les résultats de recherche. Les rich snippets de Google permettent d’étoffer vos résultats dans Google en rajoutant plusieurs lignes de texte sous chacun de vos résultats de recherche. En plus de votre titre de page et de votre meta description, les rich snippets permettent d’afficher dans les pages de résulats, par exemple, le prix ou l’évaluation d’un produit, une recette de cuisine, ou une date concert.
Actuellement, les extraits enrichis sont compatibles avec les types de contenu suivants : Avis, Personnes, Produits, Établissements et entreprises, Recettes, Évènements, Musique…
Configurer le ciblage géographique dans Google Webmaster Tools
Google Webmaster Tools fournit des informations détaillées sur de nombreux éléments de votre site Web et vous permet de contrôler certains aspects concernant la façon dont Google indexe votre contenu. Avec GWT, vous avez, en particulier, la capacité de mettre en place le ciblage géographique par pays. Dans le cas d’un nom de domaine à extension générique ou assimilée (monsite.com/fr , monsite.com/en, monsite.com/de ….), il conviendra de déclarer chaque répertoire dans GWT comme étant un site à part entière, en allant dans la rubrique Configuration > Paramètres > Zone géographique ciblée, sélectionnez le pays adéquat et cochez la case. Si vous visez tous les pays d’une langue donnée, par exemple l’anglais: inutile d’utiliser cette fonctionnalité.
Éviter les redirections automatiques
Pas de cookies pour afficher les versions traduites de vos pages. Éviter les redirections automatiques basées sur la détection de la langue de l’utilisateur. En effet, celles-ci risquent d’empêcher les internautes (et les moteurs de recherche) de consulter toutes les versions de votre site. Mieux vaut suggérer aux internautes l’existence d’autres versions linguistiques du site web.
Une langue par page
Nous recommandons de n’utiliser qu’une seule et même langue par page er pour tous les éléments html d’une même page: headers, balises meta, urls, sidebars, menus, etc…
Dispositifs mobiles
A l’international, l’accès au web s’effectue de plus en plus depuis des dispositifs mobiles: tablettes, smartphones, d’oú l’importance de l’adaptation des sites internet à ces dispositifs (responsive design) pour toucher une audience internationale.
Contactez Openvalley dès aujourd’hui pour l’optimisation de votre site web multi-langue. Améliorez votre référencement et gagnez de nouveaux clients à l’international.