2007-04-11

HYPERWEB



HYPERWEB

hervé fischer

La planète devient hyper. Au-delà de l’idée d’une augmentation d’intensité, nous avons admis l’usage de désigner les liens dans l’univers numérique actuel par le préfixe hyper : hyperlien, hypertexte. Je propose d’appeler HYPERWEB la prochaine génération de l’internet, qui va combiner des algorithmes de recherche sémantique plus sophistiqués, prendre en compte les nouvelles plateformes technologiques collaboratives de ce qu’on appelle déjà le Web 2.0 et reconnaître l’importance déterminante des dimensions contextuelles de production du sens de chaque information (écologie sémantique).

L’écologie des médias

Beaucoup des recherches actuelles sur le web manquent encore leur but, faute d’admettre que les hommes ne communiquent pas avec une langue universelle de mots-outils monosémantiques. Les communications humaines sur notre planète Terre sont fragmentées en beaucoup de silos socioculturels qui dialoguent peu ou pas du tout entre eux. Ces milliards de pages de textes disponibles sur le web, où l’on navigue par hyperliens et qu’on qualifie donc d’hypertexte ne sont pas un vaste texte planétaire indexé où l’on peut innocemment trianguler des mots, c’est-à-dire des descripteurs encore très élémentaires ; il faut aussi en repérer et indexer les configurations de sens socio-culturelles, pour prendre en compte l’écologie des environnements textuels du sens de chaque mot, de chaque idée, de chaque information, de chaque internaute. Au-delà des illusions de l’universalisme sémantico-linguistique des années 1970, il est nécessaire de reconnaître aujourd’hui et d’introduire dans nos algorithmes la richesse et le défi de cette diversité socio-culturelle. C’est ce que nous rappelle aussi la nouvelle théorie de l’écologie des médias. Cela nous conduit à aborder des macro-configurations de significations et non plus seulement des mots isolés et donc à prendre en compte les écosystèmes sémantiques selon la diversité non seulement textuelle, mais aussi culturelle des logiques de sens dans lesquelles ceux-ci s’inscrivent. Ce que nous cherchons sur le web n’est généralement pas de l’ordre d’un dictionnaire, mais plutôt d’une riche encyclopédique, donc de l’ordre d’une information - un récit - ayant une inscription locale et historique, une complexité, une intention, un imaginaire. Autant de facteurs déterminants de son positionnement dans cet hypertexte dont on parle tant aujourd’hui, mais qui est en réalité fragmenté entre des époques, des continents, des pays, des sociétés, des sous-groupes, que les moteurs de recherche ne savent pas encore prendre en compte au-delà de leurs liens contextuels primaires. Bref, il est séduisant de parler de web sémantique, mais, one ne peut se limiter aujourd’hui à une linguistique ancienne anhistorique et asociologique. Les configurations de sens relèvent aussi d’autres sciences humaines plus complexes et difficiles à croiser. Il faut sociologiser, historiciser, psychologiser le web pour construire un objet de recherche pertinent, c’est-à-dire qui reflète la diversité écologique des savoirs et des communications humaines.

Hypertexte et
hyperusagers

C’est face à ce constat d’évidence que s’inscrit l’HYPERWEB. L’hyperweb est certes un web offrant des hypermoteurs de recherche sémantique, capables d’augmenter extraordinairement leur puissance. Mais au-delà de l’analyse des textes, l’hyperweb va devoir exploiter aussi les liens entre les chercheurs eux-mêmes, qui constituent de facto des communautés virtuelles de sens. En identifiant l’appartenance d’un utilisateur à une communauté sémantique, en indexant ce chercheur et lui attribuant un profil : c’est un africain, un jeune, un économiste, un géographe, un joueur, un sportif, un professionnel, un touriste, une personne malade, etc., on pourra peu à peu cibler mieux les configurations écologiques où celui-ci entend conduire ses navigations internet, et donc répondre à ses demandes avec plus de pertinence et de richesse de contenu. L’orientation de l’hyperweb ne consiste donc pas à multiplier et fragmenter à l’infini les catégories de ce qu’on appelle l’ontologie sémantique, mais à prendre en compte la diversité des paramètres des usagers autant que des mots *. La phénoménologie et la théorie de l’information le soulignent depuis longtemps : les usagers sont partie constituante du sens des messages et donc de l’hypertexte !

Comment peut-on envisager cette avancée des moteurs de recherche ? Je vois trois options principales et complémentaires :

  • Développer des algorithmes qui prennent en compte cette diversité de profils sociologiques, psychologiques, etc. des usagers. Cela est parfaitement réalisable et perfectionnable par rapport à ce que fait déjà manifestement Amazon.com pour nous suggérer des achats de livres, ou un moteur de recherche comme Google, qui reconnaît publiquement enregistrer et construire l’historique de nos navigations sur le web.
  • Créer des plateformes d’outils informatifs collaboratifs du type des ébauches actuelles de web 2.0. On pourra alors, dans les termes actuels de l’évolution du web, recourir au peer2peer, au mode IP Everywhere, au protocole IPv6, etc.
  • Prendre en compte les communautés sémantiques d’usagers. Et c’est ce qui est le plus prometteur, mais aussi le plus délicat.

Car il est possible de croiser les historiques de recherche convergents des usagers et de reconnaître et construire peu à peu informatiquement ces communautés d’hyperusagers, ou usagés liés sémantiquement. On constituera ainsi des configurations écologiques humaines et pas seulement textuelles de sens, qui seront virtuelles, dynamiques et évolutives un peu comme des bancs de poissons, dont on apprendra à caractériser les aires et les arabesques de mouvement. Ainsi, au-delà de l’utilisation systématique du profil – des habitudes – de chaque usager, qui permet de mieux cibler sa recherche, en indexant chacun des usagers pour le lier à l’historique de recherche des autres usagers fréquentant les mêmes configurations de sens, on pourra consolider et enrichir peu à peu ces configurations de sens elles-mêmes. Bref, c’est sur les liens des usagers – hyperusagers - et non seulement du texte – hypertexte - qu’on mise. Et bien entendu, c’est de l’entrecroisement et de la complémentarité de ces deux ensembles indexés et métadatés qu’on espère le progrès décisif des moteurs de recherche. Certes. il n’est pas question ici de sous-estimer la complexité des protocoles informatiques que cela suppose. Et il sera nécessaire en outre de créer un mode de divergence, qui permette à l’usager d’un moteur de recherche d’échapper à l’enfermement où celui-ci tendra alors à le confiner, pour lui permettre de naviguer efficacement vers d’autres écosystèmes de sens que celui de ses habitudes principales.

Démocratie digitale

Mais il nous faut prendre en compte ici un problème éthique fondamental de respect de la vie privée. Jusqu’à quel point est-il démocratiquement admissible d’indexer les usagers du web? Car selon un tel projet, on arriverait vite à étiqueter les usagers selon des critères politiques, moraux, physiques, ethniques, etc. Les excès des banques de données policières, sur les styles de vie, du data mining auquel recourt de plus en plus le marketing, et sur toute inscription cumulative et durable de données personnelles sur un citoyen à son insu deviennent de plus en plus problématiques et inquiétants. Le cauchemar d’une STASI numérique est au rendez-vous si nous n’y prenons garde. Les vertus de l’hyperweb ne sauraient justifier de tels abus, et, puisque c’est dans cette direction que nous allons inéluctablement, voilà une raison de plus de légiférer urgemment en faveur du respect des libertés dans ce qu’il faut bien appeler désormais notre démocratie digitale.

* Lire à ce sujet mon fils Arnaud Fischer : http://searchengineland.com/070403-040029.php .

Aucun commentaire: