mardi 9 septembre 2014

Vers un accroissement de l’ouverture et du partage des données de la recherche ?

Mise à jour du 11 septembre. L'ADBU a mis en ligne sur son site trois dépêches de l'agence AEF, dont la dernière précise les contours de l'intervention d'Alain Bensoussan lors du récent congrès ADBU. Le CNRS, l’ADBU et le réseau international d’avocats Lexing soutiennent le projet de rédaction d'une "charte universelle de l'open science". Le scénario d'une simple exception au droit d'auteur n'est pas retenu, dans la mesure où une exception ne fait que confirmer la règle, à savoir le maintien des résultats de la recherche dans le pré carré des éditeurs. Il s'agit de fonder un droit de l'open science en écrivant "une charte, puis une loi, puis une convention mondiale”.


Le 15 octobre prochain, aura lieu à Toulouse, dans le cadre de la Novela, une Rencontre Interdisciplinaire de l’Académie des Sciences Inscriptions et Belles Lettres de Toulouse, à laquelle je participerai. Intitulée «Démarches Scientifiques : Le numérique bouleverse la donne», la rencontre se fixera pour enjeu d'analyser les impacts du numérique sur la démarche scientifique elle-même. Plusieurs acteurs du monde de la recherche en sciences "dures" ou en sciences humaines et sociales y participeront. Voici le fascicule provisoire de présentation de l'événement :



Avec l'aimable accord d'Alain-Michel Boudet, organisateur de la rencontre, et Professeur Émérite au Laboratoire en Recherche en Sciences Végétales de Toulouse, je publie avec plus d'un mois d'avance la trame de mon intervention.

***

Le colloque porte sur les impacts du numérique sur la démarche scientifique elle-même. En ce qui concerne les archives ouvertes et l’open access, on serait tenté de répondre, en première analyse, que le numérique n’a pas d’impact sur ces domaines précis. En effet, les notions d’archive ouverte et d’open access ne préexistent pas au numérique, elles en sont au contraire l’émanation : sans numérique, pas d’archives ouvertes et pas d’open access. Les premières archives ouvertes sont issues d’un mouvement mondial parti des physiciens avec la création d’ArXiv sous l’impulsion de Paul Ginsparg. D’un strict point de vue chronologique, la naissance d’ArXiv date du 14 août 1991, soit 8 jours seulement après que Tim Berners-Lee a rendu public le projet WorldWideWeb [1]. On pourrait donc considérer, au mieux, la naissance des archives ouvertes et celle du World Wide Web comme quasi-contemporaines. Cependant l’adoption du mot « Internet » et du protocole TCP/IP datent de 1983. On ne se trouve donc pas dans une situation où le numérique vient modifier un domaine préexistant.

Une seconde approche révèle qu’il n’en reste pas moins que le numérique bouleverse de fond en comble les principales dimensions indissociables de l’ouverture des données de la recherche : la «chaîne éditoriale» classique, les coûts de publication, le partage des résultats et le droit d’auteur.

La question de la désintermédiation dans la chaîne éditoriale est l’occasion de balayer une idée reçue selon laquelle les publications en open access ab initio seraient de moins bonne qualité scientifique que les publications d'abord publiées par des éditeurs scientifiques [2]. Trois cas nous permettent de battre en brèche ce préjugé.
a) Les épi-revues sont des revues à comité de lecture dont les articles sont déposés intégralement en archives ouvertes. Le Centre pour la communication scientifique directe (CCSD) a mis en ligne en janvier 2013 une plate-forme baptisée Episciences qu’il présente ainsi : « Les comités éditoriaux des épi-revues organisent l'activité d'évaluation et de discussion scientifique des prépublications soumises ou sélectionnées. Les épi-revues peuvent ainsi être considérées comme une « sur-couche » aux archives ouvertes ; ils y apportent une valeur ajoutée en apposant la caution scientifique d’un comité éditorial à chaque article validé.» Hélas, à l'heure actuelle, seule une revue est publiée par le biais d'Episciences : le Journal of Data Mining and Digital Humanities.
b) PLOS (Public Library of Science) est un projet américain à but non lucratif basé sur le modèle de l’auteur-payeur. Au départ, en 2001, PLOS est une pétition invitant les chercheurs à boycotter les éditeurs qui imposent un embargo supérieur à 6 mois pour l’accès libre et gratuit aux articles publiés. Soutenu par le Prix Nobel Harald Varmus, le projet PLOS devient une entreprise d’édition scientifique de revues en biologie et en médecine. En 2003, la revue scientifique à comité de lecture PLOS Biology voit le jour. Paraîtront ensuite PLOS Medicine, PLOS Computational Biology, PLOS Genetics et PLOS Pathogens. En 2006 s’ajoute PLOS One, revue ouverte à tous les domaines scientifiques et pas simplement la médecine et la biologie.
c) Le projet hybride porté par le CERN, SCOAP3, (Sponsoring Consortium for Open Access Publishing in Particle Physics), opérationnel depuis janvier 2014, permet de « libérer » en open access dix des revues les plus prestigieuses en physique des hautes énergies. Les éditeurs ne sont pas pour autant écartés du processus de relecture et de validation. Ils continuent à organiser le peer-reviewing.

Par ailleurs, les éditeurs scientifiques ne sont pas exempts de tout reproche en ce qui concerne la qualité des articles publiés. Récemment encore, un article paru dans la revue Nature révélait que Cyril Labbé, chercheur en informatique à l’Université Joseph Fourier de Grenoble, avait repéré parmi les revues publiées entre 2008 et 2013 par les principaux éditeurs scientifiques, la présence d’articles générés par ordinateur. 16 de ces articles provenaient de l’éditeur Springer et plus de 100 de l’éditeur américain Institute of Electrical and Electronic Engineers (IEEE).

Concernant les coûts de publication, ils ont fortement diminué avec le développement exponentiel de la diffusion en ligne des revues, mais le coût des abonnements institutionnels a augmenté dans le même temps. C'est cette considération qui a motivé principalement l'appel au boycott d'Elsevier lancé par le mathématicien Timothy Gowers en 2012. S'ajoutait également la prise en considération du fait qu'Elsevier soutenait le Research Work Act, projet de loi américain dont certaines clauses visaient à interdire le libre accès aux publications scientifiques financées par l'État.

C’est surtout sur le partage des travaux de recherche et le droit d'auteur que nous nous arrêterons. Avec le numérique, ce n’est pas seulement la question de l’accès aux données de la recherche qui est revisitée, mais aussi celle de leur réutilisation. En effet, si les conditions de réutilisation ne sont pas prévues expressément, les données de la recherche sont susceptibles de faire l'objet de prédations de toutes sortes : via les réseaux sociaux scientifiques (MyScienceWork, Mendeley, Academia.Edu...), via les pressions exercées sur les auteurs pour renoncer à leurs droits moraux, notamment le droit à la paternité, via les clauses limitant les possibilités de Text and Data Mining, ou bien encore via la promotion récente par STM, (association internationale des éditeurs en Sciences-Techniques-Médecine), d’une série de nouvelles licences prétendument ouvertes.

Les licences Creative Commons constituent un outil efficace permettant aux auteurs de préciser les conditions de réutilisation de leurs travaux. La Déclaration « Open Access Initiative » de Budapest en 2002 encourageait le développement des publications sous licence libre. Dix ans plus tard, la nouvelle Déclaration de Budapest, BOAI 10, fait de la licence CC-BY (licence Creative Commons avec mention de la paternité) la licence par excellence du mouvement open access. C’est seulement en 2014 que les archives ouvertes commencent à intégrer les licences Creative Commons. La nouvelle version de HAL, qui sera mise en ligne en octobre 2014, en est une bonne illustration.

SavoirsCom1, collectif qui milite pour la défense des communs de la connaissance et notamment pour l'ouverture des données de la recherche, insiste sur la résultante de cette évolution trop lente :
"Comme, en France ou ailleurs, ce point précis de la Déclaration de Budapest est resté longtemps non suivi d’effets [3], le paysage contemporain des archives ouvertes présente une situation paradoxale : l’usage des licences Creative Commons est bien moins fréquent du côté de la « Voie verte » des archives ouvertes, que du côté de la « Voie dorée », c’est-à-dire du modèle controversé auteur/payeur, proposé par de grands éditeurs comme Springer et Elsevier." 
Il est vrai que les chercheurs se sentent bien souvent noyés sous la masse des clauses juridiques dont se composent les contrats d'édition. L'organisation à but non lucratif Science Commons propose des modèles d'addenda leur permettant d'aménager ces contrats de façon à pouvoir déposer leurs travaux dans une archive ouverte avec une licence libre.

La question ultime qui se pose est : faut-il légiférer sur le libre accès ? Les exemples américain, allemand, anglais et mexicain nous y invitent. Les sceptiques se diront qu'on en est encore loin, puisque, au niveau européen, la Directive PSI (Public Sector Information) de 2013, qui porte sur la réutilisation des informations du secteur public, exclut les données de la recherche de son champ d’application.

On sent pour autant les lignes bouger en France. Lors du dernier congrès ADBU (Association des Directeurs et personnels de direction des Bibliothèques Universitaires et de la Documentation), l'avocat Alain Bensoussan, spécialisé en droit du numérique, est venu plaider dans une allocution intitulée « Droit des plateformes et open science », pour la fondation d'un "droit de la science ouverte". Émancipé du cadre juridique trop restreint de la Propriété Littéraire et Artistique et du double écueil que peut constituer la revendication de droits tant du côté des éditeurs que des auteurs, ce "droit de l'open science" aurait pour visée d'assurer "un libre partage et une libre réutilisation" des données de la recherche (je me base ici sur le LiveTweet assuré par @lamateur37, que je remercie). La position prônée par Christophe Perales, président de l'ADBU, au congrès ou sur son blog, semble aller dans le même sens, et l'on ne peut que s'en réjouir.

L'idéal à terme serait sans doute (rêvons un peu) la consécration inter-étatique d'un domaine public de l'information ou "indivis mondial de l'information", tel que défini par l'UNESCO en 2011. Mais de quoi s'agit-il exactement ? Constitué intégralement d'informations et de données, et non d’œuvres marquées par l'empreinte de l'originalité d'un auteur, le domaine public de l'information serait autonome par rapport aux règles régissant la Propriété Intellectuelle. Il serait immédiatement réutilisable et partageable. Le droit moral serait ou bien inexistant (l'équivalent d'une licence CC0...) ou bien réduit à sa portion congrue: le droit à la paternité (l'équivalent d'une licence CC-BY...); de sorte que le droit moral ne constituerait pas un obstacle à la dissémination et à la réutilisation des contenus.

***

[1] En fait, Paul Ginsparg a appris l’existence du programme WorldWideWeb en 1992. Il l’a réutilisé quasi-immédiatement pour faire d’Arxiv l’un des premiers serveurs web :
In the fall of 1992, a colleague at CERN emailed me: ‘Q: do you know the worldwide-web program?’ I did not, but quickly installed WorldWideWeb.app, serendipitously written by Tim Berners-Lee for the same NeXT computer that I was using, and with whom I began to exchange emails. Later that fall, I used it to help beta-test the first US Web server, set up by the library at the Stanford Linear Accelerator Center for use by the high-energy physics community. Use of the Web grew quickly after the Mosaic browser was developed in the spring of 1993 by a group at the National Center for Supercomputer Applications at the University of Illinois (one of those supercomputer sites initiated a decade earlier, but poised to be replaced by massive parallelism), and it was not long before the Los Alamos ‘physics e-print archive’ became a Web server as well.” Paul GINSPARG, “It was twenty years ago today”, http://arxiv.org/abs/1108.2700

[2] Préjugé véhiculé par exemple dans un article du 4 octobre 2013 de la revue Science : John BOHANNON, « Who’s afraid of Peer Review ? », Science, http://www.sciencemag.org/content/342/6154/60.full. Pour une réfutation de la méthodologie employée par Bohannon, se reporter à l’article de Sylvain DEVILLE, « Articles bidons dans les revues : non, ce n’est pas la faute à l’Open Access », Rue89, 5 octobre 2013. http://rue89.nouvelobs.com/2013/10/05/articles-bidons-les-revues-non-nest-faute-a-lopen-access-246324

[3] Il existe bien sûr des exceptions. Les revues publiées par l'European Geosciences Union sont placées sous Creative Commons depuis 2008. Ces revues sont actuellement au nombre de 16. Merci à Manuel Durand-Barthez de m'avoir signalé ce cas.