mercredi 18 mars 2009

C'est la crise : des livres gratuits sur le web (I)

Depuis quelques années, de nombreux projets de numérisation de livres ont vu le jour. Les Bibliothèques apportent leur pierre à l’édifice avec le projet de la Digithèque. D’innombrables institutions gouvernementales, universités, associations ou particuliers ont produit des éditions électroniques de millions de livres. Nous entamons ici une série sur les plateformes, en commençant par les sites généralistes, qui nous semblent les plus intéressantes pour télécharger, gratuitement et tout à fait légalement, des ouvrages :
  • Google Books : projet mastodonte, source de polémiques infinies, lancé en 2004, Google Books donne accès à plus de sept millions d’ouvrages, tant libres que protégés par le droit d’auteur, dans de nombreuses langues (toutefois en majorité de l’anglais). L’utilisateur peut consulter soit l’intégralité du livre soit des extraits (au moins 20% de l’ouvrage). Les documents disponibles en texte intégral sont téléchargeables en pdf. Depuis le début du projet, lancé avec la collaboration des bibliothèques, plus de 10.000 éditeurs sont devenus des partenaires du portail, avec en particulier pour les francophones : L'Harmattan, le Cerf, John Libbey, de Boeck, Luc Pire, Complexe, MM2, Serre, Masson, Vrin. En cas de voyage, les guides du Routard et les guides Michelin sont également consultables en intégralité ;-). Attention, consultez toujours l’interface en anglais qui comprend bien plus de références que son homologue francophone.

  • Gallica : précurseur des projets institutionnels (imaginé en 1992), le site de la Bibliothèque nationale de France, qui vient d’être rénové, propose plus de 750.000 ouvrages, revues, manuscrits et plans dont ¼ en mode texte. Les textes, parfois numérisés en qualité très médiocre, sont téléchargeables en txt, pdf et tiff. A noter un portail mathématiques et des partenariats disciplinaires pour la médecine, la géologie, l’archéologie... Un accord avec des éditeurs français vient de permettre d’ajouter 10.000 titres sous droits dans le système.

  • Wikisource : cousine de Wikipedia (les deux produits sont d’ailleurs liés par des hypertextes) et créée également par la Wikipedia Foundation, cette base de données textuelle sous forme de wiki donne accès à des centaines de milliers de textes dans une cinquantaine de langues. Les domaines littéraires et scientifiques se partagent la vedette. On y trouve de nombreux inédits introuvables ailleurs sur le web. Les documents sont consultables en ligne et téléchargeables en pdf ou html (partie « boîte à outils » dans le menu de gauche).

  • Gutenberg Project : ce Grand Ancien fut lancé en 1971 par Michael Hart de l'université de l'Illinois. Ce chercheur estimait que la plus grande valeur créée par les ordinateurs n'était pas le calcul, mais la mise à disposition des collections des bibliothèques. Il saisit une copie de la déclaration de l'indépendance des États-Unis et l'envoya à tous les utilisateurs du réseau informatique de l'université. Ce premier texte a été suivi par 100.000 titres numérisés par les volontaires du projet et leurs partenaires dans une quarantaine de langues. Les textes sont téléchargeables dans des formats html et txt spartiates sur la forme mais d’un intérêt immense sur le fonds.

  • Avalon Project : donne accès à des milliers de textes juridiques, historiques, économiques, politiques et diplomatiques concernant le monde entier. La couverture temporelle va du Code d’Hammourabi au Rapport de la Commission parlementaire sur le 11 septembre en passant par la Magna Carta. Deux sous-ensembles méritent un intérêt particulier : IMTG (ensemble des minutes du procès de Nuremberg) et DIANA (corpus sur les droits de l’homme). Les textes sont disponibles en formats html.

  • Europeana : grand projet européen aux multiples péripéties, il permet de consulter en ligne un grand nombre de textes imprimés, images, vidéos produites par des bibliothèques nationales ou universitaires, musées et centres d'archives. Europeana est encore en phase de test et peine à se démarquer en termes de contenu original (une grosse majorité des documents provient encore de Gallica). Le portail est toutefois extrêmement réussi et propose de nombreux modes d’accès novateurs. Un objectif ambitieux fixe le nombre d’items mis à disposition à 10 millions pour 2010, c’est donc une plateforme à suivre de près.

  • Ebooks libres et gratuits : proposé par un groupe de bénévoles très motivé, ce site donne accès à plus de 1700 ebooks francophones disponibles dans 7 formats différents (dont le pdf , le doc et l’odt). La mise en page est très soignée. Ce site est un incontournable pour la grande littérature européenne et américaine du XVIIIème au XXème siècle et pour les romans populaires et feuilletons de la même époque. Quelques grands textes scientifiques et dictionnaires sont également disponibles.

  • Bibliothèque électronique du Québec : est très certainement l’équivalent de la Bibliothèque de la Pléiade pour le livre électronique gratuit. Jean-Yves Dupuis a numérisé (seul !) depuis 1997 un gros millier d’ouvrages en français en choisissant la meilleure édition papier disponible et en nous donnant accès à des pdf d’une grande élégance formelle. Ses ebooks de Balzac, Proust, Verne, Dumas et Ségur sont des références absolues en termes de qualité. Son site offre, en outre, de très nombreux inédits et introuvables dont une grosse sélection de plus de 200 ouvrages québécois.

Il est important de noter que certains des ouvrages proposés en toute légalité au Canada ou aux Etats-Unis ne sont pas encore libres de droits en Europe. Vous ne pourrez donc pas télécharger les œuvres d’André Gide, Henri Bergson, Georges Orwell, Colette, Jean Giroudoux, Marc Bloch, Thomas Mann ou Albert Einstein... même si rien ne vous en empêche techniquement...

Dans des billets à venir, nous vous proposerons de nombreuses autres plateformes spécialisées par disciplines, par zones géographiques ou par typologie de documents ainsi que des sites mettant à disposition des livres numérisés par des bibliothèques et des maisons d’édition. Une autre question que nous aborderons bientôt sera de vous permettre de consulter ces livres numériques confortablement en vous conseillant des outils et des interfaces adaptées (livrels, logiciels adaptés à vos appareils mobiles,...).

2 commentaires:

Anonyme a dit…

Et HathiThrust ?

La poussée de l'éléphant :
http://babel.hathitrust.org/cgi/ls

Bien cordialement
Bernard Majour

Bibliothèques de l'ULB a dit…

Bonjour !

Nous allons publier très prochainement un billet entièrement consacré à HathiTrust et aux risques liés au quasi monopole de Google sur la longue traine du marché du livre.

Hathitrust va certainement devenir au cours des années qui viennent l'un des systèmes majeurs de mise à disposition gratuite de la culture. Hélas c'est encore pour le moment une quasi boite noire dans laquelle les institutions participantes déposent des livres électroniques, permettent la recherche (en béta limitée), mais limitent très fortement le téléchargement des ouvrages. Qui plus est, environ 90% des livres du système sont déjà dispos sur Google books ou d'autres sites indiqués dans ce billet.

Toutefois, Hathitrust est une excellente nouvelle car il va créer de la concurence "publique" à GoogleBooks, se préoccupe de la préservation à très long terme des fichiers et redonne de la marge de manoeuvres aux bibliothèqes pour favoriser un accès gratuit et pérenne à la culture livresque.

Pour plus d'infos sur HathiTrust, reportez vous à l'excellent Affordance, par exemple : http://affordance.typepad.com/mon_weblog/2008/10/la-crise-llphan.html#comments