Le web sémantique n’a jamais fait parler de lui, mais récemment, tout le monde en parle. Les taux d’adoption de la standardisation RDFa, micro-données et d’autres types de données structurées ont été lente à se faire identifier en raison de du peu d’avantages de les ajouter aux pages.
Les moteurs de recherche, et en particulier Google, ont commencé à utiliser les rich snippets. Les balises Meta robots et robots.txt sont deux exemples adoptés par les moteurs de recherche pour la découverte de contenu.
Qu’est-ce que sont les schémas ?
Les schémas sont des balises HTML que les développeurs web utilisent pour le balisage de leurs pages avec un langage lisible décrivant le contenu de la page. Le balisage peut être lu et compris par les principaux moteurs de recherche et autres robots ou programmes.
Les développeurs web utilisent la norme de schema.org pour ajouter des données structurées au sujet de leur contenu des pages. Schema.org fournit le vocabulaire et le format de micro-données (normes ouvertes de format de données), et permet d’ajouter une couche supplémentaire d’informations au contenu HTML constitué d’un ensemble de balises introduites par la technologie de l’HTML5.
L’objectif à long terme de cette démarche est de couvrir un large éventail de formats. L’objectif initial étant les micro-données.
Ce guide vous aidera à vous mettre en adéquation avec les micro-données et la norme schema.org, de sorte que vous pourrez commencer à ajouter des balises à vos pages web. Google fournit un outil de validation pour les richs snippet, que vous pouvez utiliser pour tester votre balisage et d’identifier d’éventuelles erreurs.
Une considération importante est de savoir qui sont les contrôleurs de schema.org ? Un consortium des principaux moteurs de recherche – Google, Microsoft et Yahoo.
Tous les participants sont des entreprises publiques. Que faire si le conseil décide que la norme schema.org doit être un centre de profit et décident de rendre la norme payante ? Y a t-il quoi que ce soit que l’on peut faire pour arrêter cela ?
Même s’il n’est pas dans le champ d’application de cet article de répondre à cette question, il est important de considérer au moins les évolutions futures possibles.
Les moteurs de recherche ont commencés à utiliser ces données structurées en ajoutant des extraits rich snippets aux résultats des moteurs de recherche, ce qui va augmenter, car il y a un impact certain et positif sur le taux de clic (CTR). Principalement sur l’ajouts de commentaires (étoiles), des images (vidéos) et d’autres caractéristiques de rich snippets qui les démarquent dans les SERP.
Cela peut paraître comme un avantage sur le classement, mais il y a beaucoup d’autres moyens moins coûteux de réaliser des augmentations similaires sur le taux de clics sans le coût du balisage supplémentaire.
Identifier les micro-données
On pourrait penser que ces données pourrait alourdir les sitemaps. Google utilise le sitemap pour assigner vos données à son moteur.
Commencez par ajouter des micro-formats à l’HTML en ajoutant l’élément ItemScope spécifier dans le bloc HTML (div) et ajoutez l’attribut ItemType après pour identifier le type. Voici un extrait à partir du site schema.org expliquant les différents types d’éléments :
<itemtype = "http://schema.org/Event"></itemtype>
Le type le plus large pour la norme schema.org est Thing (Chose), qui possède quatre propriétés : nom, description, url et l’image.
Les types plus spécifiques partagent des propriétés plus larges. Par exemple, une événement (Event) est un type plus spécifique que la chose (Think), et un festival (Festival) est un type plus spécifique que événement.
Les articles plus spécifiques héritent des propriétés de leur parent. (En fait, un festival est un type moins spécifique que un événement qui a son tour est un type moins spécifique que organisation, de sorte qu’il hérite des propriétés de deux types de parents.)
Plus d’informations sur la hiérarchie des typages de la norme schema.org.
La propriété d’un élément utilise l’attribut itemprop englobant l’information se rapportant à la propriété :
<h2>Evènement : <span itemprop = "name"> Titre de l'évènement</span></h2>
Utilisez les balises span pour associer les attributs itemprop vers le texte approprié sur la page. Lorsque vous êtes incapable de marquer le balisage de l’information (par exemple une date de création d’article) utiliser la méthode méta comme ceci:
<meta itemprop = "dateCreated" content = "2012-03-08" /> (format iso 8601 pour les dates)
Il est possible qu’un itemprop peut être un itemtype lui-même par exemple, si vous avez y inclus des critiques ou des personnes impliquées dans l’article comme un contributeur ou l’auteur et dans ce cas, vous l’intégrer dans les données comme ceci:
<div itemprop = "Review" itemscope itemtype = "http://schema.org/Review"> <span>Auteur : <span itemprop = "author"> Un auteur </span> (né le 12 Septembre 1754) </span> </div>
Dans tous les cas, votre balise div ouverte doit avoir une balise de fermeture comme illustré ci-dessus.
La plupart des types sur schema.org ont des « types » qui sont attendus du texte et des URL. Cela permet aussi à un type parent (illustré ci-dessus), qu’il peut inclure des types d’enfants.
Les pages qui sont une collection d’éléments doit avoir chaque élément marqué séparément et utiliser l’attribut itemprop avec la valeur « url » pour faire un lien vers une page comme ceci:
<div itemscope itemtype = "http://schema.org/Person"> <a href="page1.php" itemprop = "url"> page 1 </a> </div> <div itemscope itemtype = "http://schema.org/Person"> <a href="page2.php" itemprop = "url"> page 2 </a> </div>
Meilleures pratiques de mise en oeuvre
- Ne pas attacher des attributs pour cachés du contenu.
- Ne pas entrer des valeurs qui sont destinées à tromper quelqu’un ou quelque chose (par exemple les moteurs de recherche).
- Testez, testez et testez et retestez de nouveau et vous connaîtrez la véritable valeur des micro-formats que vous obtiendrais de la tâche de tous formaliser vos pages !
Ressources en ligne pour la normalisation schema.org
- Hiérarchie complète du schema.org
- chez W3c
- Microformats.org
- Mon article sur l’html5, les rich snippets et seo