VariaCréation

CLASSER CALCULER[Record]

  • Marcello Vitali Rosati

Un rêve, plus ou moins explicite, hante nos esprits depuis plusieurs millénaires. On le retrouve ci et là dans les listes égyptiennes, dans les catalogues aristotéliciens, dans le règles mnémotechniques des néoplatoniciens florentins de la renaissance, dans les constructions mathématiques de Leibniz, dans les affirmations des grands noms du web : le monde est constitué d’une masse énorme d’informations, dont la connaissance et l’exploitation permettrait la maîtrise quasi-totale. Il serait alors possible de tout savoir, de tout prévoir, de tout faire. Mais deux limites, proprement humaines, empêchent la détention et l’exploitation de cette globalité d’informations : l’accessibilité et la calculabilité. Les informations ne sont pas toutes accessibles à l’homme, même en considérant qu’elles existent, qu’elles résident quelque part – contenues dans un livre, détenues par un ensemble de spécialistes ou qu’elles soient simplement observables dans la nature – elles sont, ou bien disséminées, ou bien cachées, ou bien incompréhensibles, et ce en raison de l’incapacité ou nous nous trouvons à déchiffrer et uniformiser les langues, des codages, des formats. Le problème structurel de la bibliothèque dérive de ce constat. La bibliothèque est un dispositif qui essaie d’abattre l’une des deux limites du rêve de savoir total : l’accessibilité. Dans une bibliothèque toutes les informations – ou du moins beaucoup d’informations – sont accessibles. Mais, quand bien même l’accessibilité serait totale, il resterait une autre limite : la concaténation des données, la calculabilité. En d’autres termes, une fois qu’un homme a accès à une grande masse d’informations, comment peut-il les exploiter ? Ayant accès à des milliers de livres, je ne peux exploiter que les informations que je suis capable de lire et de retenir. Pour pouvoir exploiter ces informations il faudrait qu’elles constituent un objet calculable par une immense machine qui les exploiterait automatiquement. La mathématisation des sciences est une tentative de résolution de ce second problème. La ferveur suscitée par le développement du web naît d’un tel rêve et promet une accessibilité ainsi qu’une calculabilité totales. La machine devient le dieu leibnizien, capable de tout savoir et de tout calculer, accessibilité totale et calculabilité totale signifiant savoir total. Tim Berners Lee peut être considéré comme un des promoteurs du rêve de savoir total. Dans un TED Talk de 2009, il présente cette idée avec un ton enthousiaste et enthousiasmant. « Il y a quelques années, je vous ai demandé de mettre vos documents en ligne et vous l’avez fait. C’est génial ! Aujourd’hui je vous demande de mettre vos données en ligne. » Accessibilité et calculabilité. Le web a permis de rendre accessible une masse énorme de documents. Maintenant le problème est : comment les exploiter ? Un homme ne peut pas les utiliser à cause de leur masse. Mais si les informations deviennent des données pures, alors les machines peuvent les comprendre et les calculer : le savoir total est donc possible. « Raw Data Now!  » s’écrie Tim Berners Lee : des données brutes tout de suite. La donnée brute est une formalisation de l’information qui rend la connaissance exploitable par une machine. L’analyse des données peut être réalisée par la force de calcul de l’ordinateur. La donnée est pure, ouverte à toutes les associations de sens possible et une machine peut la relier à l’ensemble des autres données. Le monde peut être connu de façon totale, absolue et objective. Si l’on admet que le web d’aujourd’hui a résolu le problème de l’accessibilité à l’information, que tout est en ligne et potentiellement accessible, le web de demain, le web des données ou web sémantique, résoudra le problème de la calculabilité. On ne peut nier que cette idée …

Appendices