Google : un brevet pour une indexation basée sur l'analyse des phrases

Le site WebRankinfo signale que Google a récemment obtenu un brevet sur l'analyse des phrases, ce qui pourrait bien faire évoluer ses méthodes d'indexation dans un avenir plus ou moins proche.
En effet, outre le traitement des mots et des expressions (avec une phrase construite selon le type sujet, verbe et complément), le moteur pourrait aller au-delà de la syntaxe classique et s'intéresser à la phraséologie, c'est à dire à la relation des mots qui sont associés dans une requête ou dans un document.

Voici quelques précisions données par l'auteur de l'article : "Considérons la requête : « vilain petit canard ». Google dans un premier temps peut la traiter mot par mot (« vilain » et « petit » et « canard ») et chercher tous les documents dans lesquels ils apparaissent. Cela donnera-t-il un résultat pertinent ? Il y a peu de chances. Par exemple, est-ce qu'un document contenant cette phrase serait pertinent ? « Le Canard Enchaîné a publié un petit article dénonçant le vilain procédé de… ». Le système de Google peut aussi regrouper les mots dans différentes combinaisons (groupes ou partitions) pour tenter de modéliser l'expression : « vilain petit » et « canard » ou « vilain » et « petit canard », ou encore « vilain petit canard ». On comprend bien qu'en passant par un modèle phraséologique (ou dit de phrasification) on met de côté les documents dans lesquels on trouve ces trois mots mais sans qu'ils aient une relation étroite. On aboutit ainsi aux résultats les plus pertinents : le vilain petit canard, le conte d'Andersen."

Pour lire l'article complet : www.webrankinfo.com/dossiers/redaction/brevet-phrasification

Fabrice MOLINARO