Résumés
Abstract
“Mining the Internet Graveyard” argues that the advent of massive quantity of born-digital historical sources necessitates a rethinking of the historians’ toolkit. The contours of a third wave of computational history are outlined, a trend marked by ever-increasing amounts of digitized information (especially web based), falling digital storage costs, a move to the cloud, and a corresponding increase in computational power to process these sources. Following this, the article uses a case study of an early born-digital archive at Library and Archives Canada – Canada’s Digital Collections project (CDC) – to bring some of these problems into view. An array of off-the-shelf data analysis solutions, coupled with code written in Mathematica, helps us bring context and retrieve information from a digital collection on a previously inaccessible scale. The article concludes with an illustration of the various computational tools available, as well as a call for greater digital literacy in history curricula and professional development.
Résumé
Dans cet article, l’auteur soutient que la production d’une grande quantité de sources historiques numériques nécessite une réévaluation du coffre à outils des historiennes et des historiens. Une troisième vague d’histoire informatique, marquée par un nombre toujours croissant d’informations numérisées (surtout dans le cadre d’Internet), la chute des coûts d’entreposage des données numériques, le développement des nuages informatiques et l’augmentation parallèle de la capacité d’utiliser ces sources, bouleverse déjà la pratique historienne. Cet article se veut une étude de cas basée sur ces observations. Il étudie plus particulièrement un projet de numérisation de Bibliothèque et Archives Canada — les Collections numérisées du Canada — pour éclairer certains défis ci-haut mentionnés. Un ensemble de solutions prêtes à utiliser pour l’analyse de données, jumelé avec un code informatique écrit en Mathematica, peut contribuer à retracer le contexte et à retrouver des informations à partir d’une collection numérique précédemment inaccessible aux chercheurs étant donné sa taille. L’article se termine par une présentation des différents outils informatiques accessibles aux historiens ainsi que par un appel à l’acquisition d’une plus grande culture numérique dans les curriculums en histoire et dans le développement professionnel des historiens.