Diagramme des éléments sémantique en html5

Toute personne impliquée dans la conception Web ou de développement a rencontré le terme sémantique en référence à l’html5 et Internet en général. Ce terme est souvent problématique naturellement source de confusion pour beaucoup d’entre nous, en particulier, car il y a un manque évident de consensus sur sa définition dans certains contextes. Dans cet article, nous allons explorer  l’Html5 et tenter de comprendre ce qu’il le rend plus sémantique que ses prédécesseurs.

Diagramme des éléments sémantique en html5

Le sens de la sémantique

Le concept de la sémantique vient du domaine de la linguistique consacrée à l’étude du sens. Avec des langues naturelles telles que le français, nous distinguons entre la syntaxe (la grammaire) et le sens. Si vous pensez à une phrase, le sens a à voir avec la façon dont les gens l’interprètent : « Le chat a ronronné sur moi toute la journée. » La sémantique se rapporte à l’aspect de la phrase qui permet aux gens de le lire pour comprendre le message qu’il contient. En collaboration avec la syntaxe, la sémantique est une grande partie de ce qui facilite la communication par le langage. Lorsque nous parlons de la sémantique par rapport à l’Html, nous parlons de la communication entre les programmes d’ordinateur, pas les humains. La sémantique html vise essentiellement à améliorer la mesure dans laquelle les applications peuvent traiter ou interpréter le contenu d’Internet. Par exemple, considérons l’extrait suivant, la page contenant certaines des structures html plus autonomes :

Le chat a ronronné sur moi toute la journée.
<img alt= »chat ronron » src= »images/chat_ronron.png » title= »le chat ronronne » />

Les éléments (et attributs) donnent des informations sur la façon que le navigateur va présenter le contenu à l’utilisateur. Les éléments de paragraphes seront par défaut affichés par un espace au-dessus et en dessous d’eux, les éléments d’image sont affichés en utilisant le fichier image inclus dans l’attribut src et ainsi de suite. Lorsque le navigateur rencontre chacun de ces éléments, il rend le contenu d’une manière particulière qui est finalement déterminée par les balises utilisées.

Les structures html ont déjà une signification

Il est important de comprendre que l’Html5 n’a pas pour rôle d’introduire une sémantique au format Html pour la première fois. L’Html à déjà un niveau de sémantique intégré. Les structures existantes Html sont significatifs à des degrés divers. Si vous regardez cet élément familier Html inclus dans l’extrait ci-dessous vous verrez où je veux en venir :

<img alt= »chat ronron » src= »images/chat_ronron.png » title= »le chat ronronne » />

Bien qu’il soit abrégé, le nom de l’élément img indique quelque chose de significatif sur le contenu de la balise, c’est-à-dire que c’est une image. De cette façon, vous pouvez penser à l’aspect sémantique html comme étant semblable aux méta données, le rôle de la balise de l’élément et les noms d’attribut sont de décrire les données.

Rappelez-vous au commencement, le contenu était séparé du style

Certaines de ces structures que nous avons utilisées en Html indiquent au navigateur le style des éléments de contenu dans une page. Depuis un moment déjà, nous avons été encouragés à séparer la mise en forme d’une page de son contenu. Par exemple, nous avons remplacé la balise i avec em, ce qui est plus significatif et ne dit pas exactement comment le navigateur doit afficher le texte dans l’élément. Le but d’utiliser em est de transmettre des informations sur la nature de l’élément de contenu, plutôt que des informations à propos du style. Les em évidemment influe sur le style, qui est la principale raison pour laquelle nous l’utilisons, mais il laisse les détails du style au navigateur et / ou le code CSS idéalement séparé du balisage de la page. La sémantique Html5 est une grande étape dans ce processus. Le but ultime est de créer un système dans lequel les applications ont accès à un plus grand niveau de signification

N’est-il pas similaire au langage XML ?

Si vous avez utilisé l’Xml dans le passé, vous avez une certaine familiarité avec les concepts de balisage sémantique. Par exemple, lorsque vous créez un document Xml pour un ensemble de données, vous choisissez les éléments et attributs à des éléments de modèle dans les données. Idéalement, les noms d’éléments et d’attributs définissent les éléments de données d’une manière significative :

<nouvel_article piece_id= »2468″>
Didier Dupont
21 janvier 2013
</nouvel_article>

Le développeur a choisi ici des noms qui décrivent de manière intuitive les valeurs de données en cours de modélisation. Avec l’Html5, vous ne pouvez pas choisir vos propres éléments, car ils ne sont pas librement extensible. Les choix des structures ont pour but d’obtenir un sens plus essentiel par rapport aux versions précédentes.

Différents types de sens

Nous avons parlé de la signification, mais en fait, il y a différentes façons dans lequel un élément ou un extrait d’autre code peut être significative. La balise img est significative, elle raconte quelque chose sur le contenu de l’élément, en décrivant ce qu’il est. Certains des nouveaux éléments Html5 comme header et footer sont significatifs, ils indiquent quelque chose sur le rôle ou le but de l’élément dans la structure globale d’une page.

Qu’est-ce que cet aspect amélioré significative de l’Html5 implique ?

L’Html5 a quelques nouveaux éléments avec lesquels vous pouvez inclure plus d’information sémantique dans votre balisage des pages. Il y a une multitude de nouveaux éléments, nous allons en examiner ici quelques-uns. La balise d’en-tête (header) indique une information concernant le contenu de l’élément et de son rôle dans la structure de la page :

<header>
<h1>Outil seo</h1>
</header>

L’élément d’en-tête peut contenir d’autres éléments et a tendance à inclure au moins un élément de tête. La balise de bas de page (footer) est similaire, avec la balise, le but est de nouveau d’exprimer quelque chose de significatif sur le contenu de l’élément et sa relation avec le reste de la page :

<footer>
Informations de bas de page
</footer>

La balise nav décrit l’objet d’une section de page, c’est à dire qu’elle contient des liens de navigation :

<nav>
<ul>
<li>
<a href »home.php » title= »home »>Index du site</a>
</li>
<li>
<a href »nouvelles.php » title= »les nouvelles »>Les nouvelles</a>
</li>
<li><a href= »contact.php » title= »contact »>Contactez-nous »></a></li>
</ul>
</nav>

L’élément section contient généralement un groupe d’articles sur le même thème, souvent en collaboration avec un en-tête. L’élément de section a une signification assez abstrait, mais il est néanmoins significatif :

<section id= »vue »>
<h2_>Gérard Depardieu s’exile</h2_>
Gérard Depardieu à décidé…
<img alt= »l’exile » src= »images/gerard-depardieu.jpg » title= »Depardieu l’exilé » />
</section>

L’élément article est semblable, utilisé pour définir un élément qui est autonome :

<article>
<h2 >Le miracle</h2 >
Le miracle du chat perdu s’avère…
</article>

Une balise aside indique le rôle d’un élément par rapport à son contexte dans la page, comme dans la version étendue suivant le code de l’article ci-dessus:

<article>
<h2 >Le miracle</h2 >
Le miracle du chat perdu s’avère…
<aside>C’est en 2003 que le miracle survient…</aside>
</article>.

Ce ne sont que quelques-uns des nouveaux éléments Html5 offrant des améliorations sémantiques, d’autres incluent les médias et les éléments de saisie utilisateur ainsi que des attributs supplémentaires. L’inclusion de micro-données dans l’html5 fournit également une possibilité accrue, y compris l’information sémantique dans les pages et les applications. Comme vous pouvez le voir, certains de ces nouveaux éléments sont significatifs tant en termes de contenu et qu’à la structure.

Pensez à certaines des vieilles balises, telles que div. L’élément div est tout simplement un morceau d’une page. Le nom de la balise ne nous dit absolument rien sur le contenu de l’élément ou de son rôle au sein de la page. En d’autres termes, l’étiquette transmet très peu de sens. Beaucoup de balises de longue date n’ont généralement aucune signification du tout ou dans certains cas générique, un sens vaguement défini. Chaque élément dans une page a été contenue dans un d’un ensemble de catégories d’éléments très généraux. Les nouvelles balises Html5 nous permettent de définir le contenu en utilisant des termes plus spécifiques.

Pourquoi avoir fait un cours théorique ?

Je devais absolument introduire par des notions en Html5. Ce qui nous permettra de mieux comprendre le fond de ma problématique posée.
Comme nous l’avons vu, la sémantique Html5 nous permet de créer un code de balisage qui décrit des éléments de contenu.

  • Le balisage sémantique rend les contenus et les données plus consultables. Les pages web ne sont bien sûr pas seulement affichée dans le navigateur web, ils sont également traités par d’autres programmes tels que les robots des moteurs de recherche. Depuis le balisage sémantique est conçu pour permettre aux applications interpréter les pages web de manière plus significative, ce qui devrait à terme améliorer la qualité de la recherche. Tim Berners-Lee a souvent cité le « rêve » pour le Web, les ordinateurs seraient capables d’analyser toutes les données en ligne. Ce qui pourrait être très loin, mais la poussée sémantique de l’Html5 est motivée par ce type d’objectif à long terme.
  • L’accessibilité est l’un des principaux avantages de balisage sémantique. Les outils d’accessibilité peuvent bénéficier grandement de l’accès plus significatif du contenu Internet. Ces outils comprennent modules complémentaires du navigateur pour les utilisateurs ayant une vision limitée, de problème d’audition, de difficultés d’apprentissage etc.. Le balisage sémantique est plus facile pour une application de traitement de contenu web et le résultat pour communiquer le message original à l’utilisateur de manière à ce qu’il convienne à leurs besoins. Ce concept s’étend au-delà de l’accessibilité, grâce à des techniques telles que la conception. Le résultat est une approche plus globale de diffusion de contenu.
  • Le balisage sémantique améliore la cohérence, tant que les éléments de contenu sont plus logiquement attribuables à des types d’éléments particuliers. Ceci est en contraste avec les modèles plus anciens, dans lequel les éléments peuvent souvent tout aussi logiquement être contenues dans toute une gamme de types d’éléments différents.

Alors, et le référencement dans tout ça ?

Ce n’est pas seulement facile à comprendre pour nous, mais aussi beaucoup plus facile pour un Bot Google à explorer et à indexer un site structuré en Html5. Les méthodes traditionnelles pour définir un en-tête et un pied de page se composait de la balise div avec un identifiant unique. Bien que ce soit un moyen efficace de faire les choses, il est bien plus désordonnée que d’utiliser des balises spécifiques pour chaque zone de contenu. Quand quelques experts indiquent que l’Html5 diminue le champs d’application du référencement, différentes preuves contre cette affirmation.

Si cela vous intéresse, je vous propose l’article que j’avais rédigé sur les effets de l’html5 qu’ils pourraient avoir sur le référencement.

Rémi Morin

Veilleur - Référenceur Gestion de l'identité numérique des entreprises soucieuses de leur e-reputation, et conscientes de la plus-value que peut apporter la bonne gestion de leur présence en ligne.

Follow Me:
TwitterFacebookLinkedInPinterestGoogle Plus

L'évolution du web vers la synthèse

L’évolution du web vers la synthèse et l’intelligence artificielle

Le web sémantique : Présent dans la recherche de tous les jours

En 1999, Tim Berners-Lee a décrit sa vision de l’avenir d’Internet. Il décrivit les ordinateurs étant capable d’analyser et de comprendre les mêmes informations que nous, et de devenir des assistants virtuels personnalisés. Imaginez l’application de calendrier sur votre appareil mobile observant un conflit d’horaire lorsque vous commencez à réserver un voyage sur Weekendesk. Ou que votre ordinateur effectue toutes les recherches nécessaires pour justifier votre décision et établit un rapport de recherche détaillé à l’appui d’une décision prête pour vous dans la matinée. Pour beaucoup, c’est la véritable destination d’Internet, et tout le partage social qui a attiré l’attention de tout le monde dans le web 2.0 est un aperçu simple de ce qui est à venir. Un auteur du blog, a décrit en disant:  » C’est une orgie de données et votre serveur y est invité « .

Depuis une dizaine d’années, un mouvement appelé le Web sémantique (hyper-médias) a été adopté pour permettre cette vision. On pense que par bien annoter un document HTML, permettra à un ordinateur de consommer et de comprendre l’information, un peu comme un humain le ferait et donc être en mesure de prendre des décisions éclairées et à agir en notre nom. Pour ce faire, il doit y avoir la structure, les définitions relationnelles et des protocoles d’annotation de plusieurs vocabulaires descriptifs et suivis. Jusqu’à présent, l’adoption a été anémique.
Cependant, pour de nombreuses raisons, l’effort a jusqu’ici été scindé en factions de diverses technologies concurrentes. La création et le soutien limité par les navigateurs ainsi que les moteurs de recherche ont limités les précoces à explorer la technologie plus profondément.

Mais récemment, cette situation a changé depuis l’apparition de l’HTML5, technologie prenant en charge le marquage sémantique dans tous les navigateurs modernes. Les moteurs de recherche ont commencé à récompenser les sites Web utilisant les Rich Snippets en affichant dans leurs résultats de recherche les données sémantiques ( étoiles d’évaluation, image de profil google, etc.). Des rapports ont été rédigés, beaucoup de firmes ont vu leur trafic augmenté près de 30 %, en raison de leurs implémentations de la norme RDFa et des Rich Snippets.

Récemment d’autres entreprises utilisent également des balises sémantiques. Facebook ont été les premiers à se démarquer en utilisant la norme RDF avec la création de l’OpenGraph en 2009 et ont récemment commencés à utiliser le marquage de profils utilisateurs et événementiel avec les micro-formats hCard et hCalendar. Google a poussé l’authentification des auteurs et lds ouvrages rédigés avec l’annotation XFN rel= »me ». Yahoo Tech et LinkedIn ont tout deux adoptés également la norme des micro-formats dans leurs données.

En réponse à cette confusion et complexité, un consortium des principaux moteurs de recherche, y compris Google, Yahoo, Microsoft et Yandex, se sont réunis pour créer une approche standardisée, appelée Schema.org. Elle suppose l’utilisation des micro-données à grande échelle plutôt que RDF / RDFa et constitue une ressource unique pour les principaux vocabulaires sémantiques à utiliser. L’espoir est que, en simplifiant la technologie et la standardisation, ces obstacles à l’adoption se verront réduits et que la plupart des industries commencent à adopter cette technologie.

Alors, comment peut-on mettre en oeuvre une annotation sémantique ?

Il y a deux cadres d’annotation primaires qui sont le langage de définition de ressource (RDF / RDFa) et Microformats. RDF peut être utilisé avec le balisage du document HTML avec ce qu’on appelle Sujet-Prédicat-Objet triple. C’est un langage robuste qui est le plus couramment utilisé pour d’autres ensembles de données fiables qui nécessitent des données de liens profonds. Il a été critiqué pour sa complexité, cependant une révision récente appelée RDFa a été mise en place ce qui rend la technologie plus facile à utiliser, avec un accent sur l’utilisation d’attributs. Voici un exemple de ce que pourrait ressembler un objet simple en RDFa :

</pre>
<div xmlns:v=”http://rdf.semantic-vocabulary.org/#” typeof=”v:Person”>
 <p>Name: <span property=”v:name”>Rémi Morin</span></p>
 <p>Title: <span property=”v:title”>Référenceur web, chargé de veille emarketing</span></p>
</div>
<pre>

Les Micro-formats quant à eux, ont été développés visant la simplicité pour une implémentation dans un document HTML. Les Micro-données sont un sous-ensemble des Micro-formats que Schema.org a mis en place. Créant sa propre API DOM dans la spécification HTML5, c’est donc la future norme présumée pour la plupart des sites internet :

</pre>
<div itemscope itemtype=”http://semantic-vocabulary.org/Person”>
 <p>Name: <span itemprop=”name”>Rémi Morin</span></p>
 <p>Title: <span itemprop=”title”>Référenceur web, chargé de veille emarketing</span></p>
</div>

À un certain niveau, les concepts sont assez simples, mais il y a de nombreuses ontologies et vocabulaires sémantiques qui ont été définis et sont référencés dans le but de donner un sens à votre RDF ou attributions Microformat. Remarqué la référence sémantique vocabulary.org ci-dessus ? Elle fait appel à un schéma défini hCard, ou dans l’exemple suivant est une personne qui y est définie. Schema.org a défini un grand nombre d’entre eux directement pour les micro-données, mais il en existe d’autres comme base Dublic, DocBook et les Goodrelations qui est très populaire en particulier pour le commerce électronique. Il y a des plugins disponibles pour un grand nombre CMS, principalement dans le commerce électronique pour aider à mettre en place un balisage sémantique.

Imaginez le web 4.0

Tom Jenkins, président exécutif d’Open Text a récemment fait l’objet d’un discours sur l’apparition du web 3.0 web sémantique et d’Internet objet ainsi que de ses prédictions pour le Web 4.0. Jenkins a noté que  » Les natifs du numérique, décrits comme super-connectés fous de technologie âgées de 30 ans et au-dessous, demandent d’avantages de gadgets et de nouvelles applications qui vantent les gains de productivité et de temps. C’est cette demande qui est le moteur de l’arrivée précoce du Web 3.0, ou le Web sémantique.  »

Jenkins prédit que le Web 4.0 arrivant dans notre vie de tous les jours dans les cinq ans :  » Les environnements virtuels ne sont plus limités aux laboratoires de recherche et cette paire de lunettes 3D pour les films peuvent être utilisés plus souvent que jamais. » Jenkins perçoit le Web 4.0 basé sur la virtualisation, en déclarant :  » Pensez à un monde virtuel, se représenter comme étant un avatar, possédant une paire de lunettes 3D virtuels et que l’on puisse marcher dans les nuages.  »

Jenkins a également exprimé le besoin croissant de gestion des connaissances et le danger pour les entreprises d’ignorer les médias sociaux: « Environ 45% des entreprises au niveau mondial interdisent l’accès des employés aux sites de médias sociaux. » Jenkins avertit que ces sociétés finiront par «perdre leur compétitivité» et exhorte le développement des politiques de l’entreprise pour guider utilisation des médias sociaux.

Je vous invite à lire un article intéressant avec l’arrivée du Knowledge Graph de Google en France complétant mes arguments illustrés ici ainsi que dans un de mes articles sur la présentation du graphe de connaissance dynamique de google lorsqu’il était sorti aux Etats-Unis que j’avais rédigé auparavant .

Article édité le 07/12/2012

Rémi Morin

Veilleur - Référenceur Gestion de l'identité numérique des entreprises soucieuses de leur e-reputation, et conscientes de la plus-value que peut apporter la bonne gestion de leur présence en ligne.

Follow Me:
TwitterFacebookLinkedInPinterestGoogle Plus

Résultat de recherche sémantique google

Google a récemment dévoilé le graphe de connaissance dynamique (Knowledge Graph), ce qu’ils appellent la « première étape dans la prochaine génération de la recherche« . La version initiale s’est progressivement déployée pour les utilisateurs américains et anglais depuis quelques jours qui se compose de trois éléments :

  • Liens vers différents ensembles de résultats fondés sur des significations contextuelles pour un terme de recherche donné.
  • Résumés sujet avec les principaux faits visibles dans la barre latérale des SERPs.
  • « Cases d’information » qui offrent des informations supplémentaires dans la barre latérale des SERPs basée sur les requêtes populaires liées.

[youtube=http://www.youtube.com/watch?v=mmQl6VGvX-c&w=560&h=315]

Google a annoncé en même temps dans un billet de blog distinct que le Knowledge Graph pour mobiles et tablettes sera compatible avec les systèmes Android 2.2+ et iOS4+.

Google a indiqué qu’il a vu une augmentation notable de l’activité sur son site Web dans les deux semaines depuis que la compagnie a commencé l’une des transformations de recherche les plus importantes de son histoire.

« Selon les premières indications les gens effectueraient plus d’interaction , apprendraient plus de choses … et feraient plus de [recherche] requêtes, » c’est ce que le vice-président principal de Google Amit Singhal a déclaré au journal de Wall Street. « Cela attiserait la curiosité des gens. »

Le graphe de connaissance dynamique montre un large panel,  (C’est ce comme cela que Larry Page l’a décrit) vers la droite des résultats de recherche de Google sur certaines requêtes organiques pour les personnes dignes de mention, séries TV, des équipes sportives, des lieux, des livres, et d’autres entités.

En plus de tirer quelques informations de base biographique ou factuelle de Wikipedia, Google propose des liens vers des recherches connexes. Dites que vous recherchez [musée du louvre], Google vous affiche des résultats pour le lieu, des moyens de transport pour s’y rendre, la carte pour repérer le lieu, et d’autres résultats connexes à votre recherche.

Résultat de recherche sémantique google

Rémi Morin

Veilleur - Référenceur Gestion de l'identité numérique des entreprises soucieuses de leur e-reputation, et conscientes de la plus-value que peut apporter la bonne gestion de leur présence en ligne.

Follow Me:
TwitterFacebookLinkedInPinterestGoogle Plus

Le web sémantique utilisé par Google

Le web sémantique utilisé par Google

Google devrait prochainement mettre à jour son moteur de recherche afin de rendre les résultats de ce dernier plus pertinents grâce au web sémantique.

Aujourd’hui, l’algorithme de Google tente de déterminer l’importance d’un site web en fonction des mots que ce dernier contient ainsi que du nombre de liens pointant vers celui-ci. Le Wall Street Journal rapporte que la firme de Mountain View est en train de procéder aux « plus gros changements de l’histoire de la société pouvant affecter des millions de sites » dont le classement dépend aujourd’hui du fameux PageRank.


La suite sur Clubic.com  Web sémantique : Google proposera un moteur plus « intelligent ».

Rémi Morin

Veilleur - Référenceur Gestion de l'identité numérique des entreprises soucieuses de leur e-reputation, et conscientes de la plus-value que peut apporter la bonne gestion de leur présence en ligne.

Follow Me:
TwitterFacebookLinkedInPinterestGoogle Plus

La pagination seo par Google
La pagination pour le référencement par Google

En septembre de l’année dernière, Google avait sorti  rel = »next » et rel = « prev » pour palier aux problèmes de pagination dans le référencement et la recherche.
C’est un sujet assez complexe mais  il peut être très utile pour les grands sites avec beaucoup de pagination.
Maile Ohye de chez Google a mise en ligne récemment une vidéo sur YouTube sur la chaîne d’aide de Google Webmaster expliquant comment tout cela fonctionne en anglais clair pour que tout le monde comprenne. (possibilité de sous-titre en  français)

Voici la nouvelle vidéo :
[youtube=http://www.youtube.com/watch?v=njn8uXTWiGg&w=540&h=385]

Rémi Morin

Veilleur - Référenceur Gestion de l'identité numérique des entreprises soucieuses de leur e-reputation, et conscientes de la plus-value que peut apporter la bonne gestion de leur présence en ligne.

Follow Me:
TwitterFacebookLinkedInPinterestGoogle Plus

l'ecommerce et le web sémantique
ecommerce et le web sémantique

futur levier de croissance de l’e-buisness ?

Après l’annonce par Google, Bing et Yahoo! de l’initiative schema.org, le e-commerce se lance dans les technologies du web sémantique. L’auteur de ce slide parle du web sémantique comme étant un « futur levier de croissance de l’e-buisness » et décrit schema.org comme étant une bonne chose pour la hérarchie sémantique d’un site internet mais également une mise avant pour la visibilité sur les SERPs.


via Web semantique et e-commerce : la vague va déferler !

Rémi Morin

Veilleur - Référenceur Gestion de l'identité numérique des entreprises soucieuses de leur e-reputation, et conscientes de la plus-value que peut apporter la bonne gestion de leur présence en ligne.

Follow Me:
TwitterFacebookLinkedInPinterestGoogle Plus

Les principes du web sémantique

Le principe des métas données où les données sont reliées entre elles.

Le Web sémantique désigne un ensemble de technologies visant à rendre le contenu des ressources du World Wide Web accessible et utilisable par les programmes et agents logiciels, grâce à un système de métadonnées formelles, utilisant notamment la famille de langages développés par le W3C1. (wikipédia)

Le SMO prendrait t’il la place au SEO ?

Le métier de SEO vétuste? Voué à disparaitre ?

Le Social Media Optimisation semble s’imposer comme étant une option ou un changement de réflexion au marketing des moteurs de recherche.

httpv://www.youtube.com/watch?v=6BQNb4rddZ4
sources : http://www.readwriteweb.com/

Rémi Morin

Veilleur - Référenceur Gestion de l'identité numérique des entreprises soucieuses de leur e-reputation, et conscientes de la plus-value que peut apporter la bonne gestion de leur présence en ligne.

Follow Me:
TwitterFacebookLinkedInPinterestGoogle Plus