vendredi 19 août 2011

JSTOR, l'édition scientifique, le politique et les "hacktivists": le quatuor impossible?


Mise à jour du 8 septembre: l'agrégateur JSTOR a annoncé les 6 et 7 septembre qu'il avait pris la décision de rendre librement accessibles les articles de journaux antérieurs à 1923  pour les Etats-Unis et à 1870 pour le reste du monde. Dans la Foire aux Questions, JSTOR précise que cette décision avait été prévue avant les affaires Swartz et Maxwell. Depuis, les messages de félicitations adressés à JSTOR pleuvent sur Twitter. On retiendra notamment celui de Lawrence Lessig particulièrement emblématique:





L'actualité de l'édition scientifique a connu quelques remous récemment. Au départ, un "hacktivist" (un hacker militant si vous préférez) du nom d'Aaron Swartz, chercheur à Harvard et brillant informaticien, a téléchargé sur un ordinateur portable environ 4,8 millions d'articles provenant de la plate-forme de revues scientifiques JSTOR. Le 19 juillet dernier, le département américain de la Justice a annoncé la mise en examen du lecteur boulimique, pour fraude électronique, fraude informatique et obtention d'informations à partir d'un ordinateur protégé. Il encourt jusqu'à 35 ans de prison et 1 million d'amende.

JSTOR (Journal Storage), la cible de Swartz, n'est pas un éditeur, mais un agrégateur de revues scientifiques. JSTOR est un organisme à but non lucratif fondé en 1995 par la Fondation Andrew W. Mellon dans le but de numériser et de diffuser des revues académiques. JSTOR dessert actuellement plus de 7000 institutions dans 153 pays. Depuis 1995, JSTOR a numérisé près de 1400 revues académiques de plus de 800 éditeurs.

Le mode opératoire est le suivant: entre septembre 2010 et janvier 2011, Swartz s'est rendu à plusieurs reprises dans les locaux du Massachusetts Institute of Technology. A partir d'un ordinateur portable qu'il avait discrètement connecté aux placards des serveurs du réseau informatique du MIT, Swartz a mis en route un logiciel destiné à automatiser le téléchargement. Swartz a adopté une stratégie visant à éviter toute détection par les systèmes de surveillance de JSTOR, des plus rudimentaires aux plus sophistiqués: identifiants fictifs loufoques (Gary Host ou Grace Host abrégés en "GHost"), adresses mail fictives, modification de l'adresse IP et de l'adresse MAC.


On ne connaît pas à l'heure actuelle les motivations précises de Swartz. On peut cependant supposer comme le procureur Carmen Ortiz que Swartz projetait de partager les articles téléchargés sur un site de partage P2P. D'après l'acte d'accusation: "Swartz intended to distribute a significant portion of JSTOR's archive of digitized journal articles through one or more file-sharing sites". Le but supposé sera difficile à prouver par le procureur, puisque Swartz n'a jamais mis en ligne les documents. Cependant, (si elle était avérée), la finalité alléguée paraîtrait assez en conformité avec la ligne de conduite proclamée par Swartz en 2008 dans un manifeste intitulé "Guerrila Open Access Manifesto". D'abord publié sur son blog puis retiré sans doute suite à des pressions (Aaron Swartz était en 2009 sous le coup d'une enquête fédérale dans une autre affaire dont on parlera plus bas), ce manifeste reste toujours visible sur le site Pastebin. Dans son "Guerrilla Open Access Manifesto", Swartz conclut:
 We need to take information, wherever it is stored, make our copies and share them with the world. We need to take stuff that's out of copyright and add it to the archive. We need to buy secret databases and put them on the Web. We need to download scientific journals and upload them to file sharing networks....
 Pour autant, Swartz n'a pas mis les articles en ligne et en libre accès et le procureur n'a donc pas retenu de charges en rapport avec une violation de copyright.

 L'affaire a connu un second rebondissement: pour marquer son soutien à Swartz, un certain Greg Maxwell, ingénieur en informatique, a décidé de déposer sur le site P2P the Pirate Bay, 18 592 articles issus de la plate-forme JSTOR. Ces articles proviennent tous de la revue Philosophical Transactions of the Royal Society. L'acte ressemble à celui de Swartz, à ceci près que:
 1) Greg Maxwell a pris soin d'expliciter sa démarche dans un texte dont vous trouverez la traduction en Français par @marlened ici.
2) Maxwell estime avoir téléchargé tous les articles de façon parfaitement légale ("through rather boring and lawful means"). Probablement a-t-il construit son stock d'articles petit à petit sur plusieurs années: au contraire d'un téléchargement massif et automatisé, des téléchargements successifs et espacés peuvent échapper logiquement à la vigilance des gestionnaires des plates-formes éditoriales.
3) Tous les articles libérés étaient antérieurs à 1923 et font donc partie du domaine public au regard de la loi américaine du Sonny Bono Copyright Term Extension Act

Une fois les faits exposés, une série de questions se posent.


Stringquartet. Par chooyutshing. CC BY-NC-SA 2.0. Source: Flickr.



Première interrogation: pourquoi l'Etat fédéral lance-t-il une procédure à l'encontre de Swartz alors même que JSTOR n'a pas déposé plainte?

Dans une déclaration officielle, JSTOR explique n'avoir pas souhaité poursuivre Swartz en justice, après que que l'intéressé avait rendu les fichiers et après avoir "reçu la confirmation que le contenu n'était pas et ne serait pas utilisé, copié, transféré ou diffusé". 
Pourtant le département de la justice a décidé de mener une action en justice. Pourquoi? L'une des explications possibles est fournie par un article de la revue Wired (je traduis en élaguant):

En 2008, le système judiciaire fédéral a décidé de lancer un test pour l'accès gratuit du public au système  PACER, qui permet de faire des recherches sur  les décisions de justice. L'expérience a été étendue à 17 bibliothèques à travers le pays. Swartz s'est rendu à la bibliothèque de la septième Cour américaine d'appel de Chicago et a installé un petit script Perl qu'il avait écrit. Le code était conçu pour demander un nouveau document à partir de PACER toutes les trois secondes. De cette manière, Swartz a obtenu près de 20 millions de pages de documents de la cour. Or il se trouve que bien que les documents soient publics, PACER facture normalement huit cents la page. [...] Le FBI, chargé d'enquêter, avait fini par classer l'affaire.

Pour parler trivialement, il semblerait que le gouvernement fédéral, qui n'a pas réussi à "coincer" Swartz en 2008, ait quelques comptes à régler avec l'hacktivist... Et c'est pourquoi, il "met le paquet" en axant ses chefs d'accusation sur  le terrain criminel. Mais comme nous allons le voir, il eût été plus avisé d'en rester du côté du terrain civil.

FBI Warning.  Par Travelin' Librarian. CC-BY NC 2.0. Source: Flickr.



Deuxième interrogation: la procédure engagée par le département de la justice a-t-elle des chances d'aboutir?


Si l'on se fie à l'expertise très fine proposée par l'avocat Max Kennerly, les accusations correspondent mal aux faits constatés. Reprenons un à un les principaux chefs d'accusation:
 - Wire Fraud ("fraude électronique"): la jurisprudence a toujours interprété la fraude comme un stratagème pour extorquer de l'argent. A l'évidence, l'action d'Aaron Swartz n'entre pas dans ce cadre.
Computer Fraud ("fraude informatique"): même réponse. Swartz n'avait pas l'intention de dépouiller JSTOR, les auteurs ou les éditeurs diffusés par JSTOR.
- Recklessly damaging a Protected Computer ("dommage causé imprudemment à un ordinateur protégé"): JSTOR ne fait état dans sa déclaration d'aucune dégradation avérée de ses serveurs. JSTOR aurait confirmé n'avoir subi aucune perte ou aucun dommage, d'après Demand Progress, le site fondé par Aaaron Swartz.
- Unlawfully Obtaining Information from a Protected Computer ("Obtention illégale d'information à partir d'un ordinateur protégé"): en tout état de cause, Swartz, en tant que lecteur autorisé ("walking user") du MIT, disposait de toutes les autorisations requises pour consulter JSTOR. Qu'il ait travesti son identité sous des noms et des adresses e-mails fictives ne change rien à l'autorisation d'accès dont il bénéficiait. Tout au plus, le tort de Swartz est de ne pas avoir agi en conformité avec les Conditions Générales d'Utilisation: JSTOR prohibe l'usage de tout programme informatique permettant de télécharger automatiquement du contenu via des robots, spiders, crawlers, wanderers ou accélérateurs (§2.2.f).




Troisième interrogation: Existe-t-il une justification aux tarifs institutionnels exorbitants de JSTOR?


L'épithète "exorbitants" n'est pas... exagérée. Hélas, le secret professionnel m'impose de ne pas divulguer les montants versés par les universités françaises au titre des tarifs négociés par le consortium Couperin. Les sommes en jeu sont considérables.


Le constat le plus étonnant vient du fait que contrairement à bon nombre d'éditeurs scientifiques (et non des moindres: Elsevier, Wiley-blackwell, Springer...) qui ouvrent la possibilité d'un achat pérenne des archives, JSTOR ne propose qu'un abonnement perpétuel. Et toute rupture momentanée d'abonnement fait pedre à l'institution le bénéfice de l'antériorité des contenus. Au plan économique, dans le cas où une institution est contrainte par sa situation budgétaire de se désabonner temporairement puis de se réabonner, elle devra repayer son ticket d'entrée sous forme d'un montant forfaitaire assez élevé. Cette stratégie commerciale de fidélisation de clientèle par la contrainte n'est guère appréciée des institutions publiques, et semble particulièrement mal-venue quand elle émane d'un organisme à but non-lucratif.
Certes, comme l'indique Maria Bustillos, "l'accès est gratuit pour toute institution à but non lucratif sur le continent africain, (...), et dans un certain nombre de pays en développement dans d'autres parties du monde." Il n'en reste pas moins que le prix à payer par les autres institutions est tout sauf négligeable.

Un blog bien informé tente d'établir aussi précisément que possible la répartition interne des revenus provenant des abonnements institutionnels. Il en ressort que:
- 30 % sont destinés au paiement des éditeurs
- 10 % correspondent aux frais de fonctionnement des serveurs
- 40 % correspondent à la masse salariale
- 20 % correspondent à des frais administratifs divers (?)
On ne peut que s'interroger que le bien-fondé d'un tel modèle économique où 70% des charges sont englouties en frais de fonctionnement. La réponse de JSTOR sur ce point est des plus floues: “it is important to understand that there are costs associated with digitizing, preserving, and providing access to content.”


Quatrième interrogation: en quoi la démarche de Greg Maxwell se distingue-t-elle de celle d'Aaron Swartz?

Comme on l'a vu,  Greg Maxwell a a fait le choix de ne libérer que des articles antérieurs à 1923. Ce faisant, il pointe un problème spécifique : la privatisation par certains éditeurs et la monétisation de travaux scientifiques qui devraient relever du domaine public. Critique maintes fois adressée par certains tenants d'une réforme du droit de la propriété intellectuelle, comme ici, par Lawrence Lessig, dans l'ouvrage intitulé L'Avenir des Idées:

Un problème qui empoisonne souvent la vie des créateurs est celui des œuvres que l’on prétend couvertes par un droit d’auteur alors qu’elles ne le sont pas. Par exemple, il est courant que les éditeurs prétendent posséder un droit d’auteur que la loi ne leur accorde absolument pas, ainsi que le font les éditeurs de partitions, qui mentionnent souvent un copyright sur des œuvres tombées dans le domaine public.          

Cette pratique est une violation des lois existantes. C’est un délit que de prétendre posséder des droits d’auteur quand ce n’est pas le cas, mais la seule peine prévue par la loi aux États-Unis passe par une plainte déposée par un procureur. Il est évident que les procureurs ont mieux à faire ; personne n’a jamais été poursuivi pour une infraction de ce type. [...] Le Congrès pourrait autoriser des personnes privées à entamer des poursuites contre les fausses revendications de copyright. En cas de victoire, les plaignants pourraient alors se voir reconnaître des dommages en plus du remboursement de leurs frais. De plus, une fois rendues publiques, ces affaires pourraient changer le comportement des éditeurs.
 L'action de Greg Maxwell est ciblée sur les travaux scientifiques du domaine public. Elle met  en lumière un paradoxe contemporain: en pratique, on constate que certains biens communs peuvent faire l'objet de transactions consécutives à une appropriation exclusive par des acteurs privés.


 

Cinquième interrogation: qu'en pense Lawrence Lessig?

Le point de vue du professeur de droit à Harvard Lawrence Lessig sur l'affaire en cours, revêt une certaine  importance, pour deux raisons au moins. D'abord, Lessig est l'un des spécialistes mondiaux des questions touchant à l'open access et à la réforme du droit de la propriété intellectuelle; il est également le co-fondateur des Creative Commons dont l'une des finalités principales est de permettre une meilleure circulation et un meilleur partage des résultats de la recherche. Ensuite, Lessig connaît bien Aaron Swartz. Il avait fait appel à ses compétences en 2002 pour la conception du format de métadonnées des Creative Commons. Et depuis l'automne 2010, Swartz était devenu un collègue de Lessig au sein du Center for Ethics de Harvard. 

A l'occasion d'une conférence donnée au CERN en avril dernier, Lessig s'était déjà livré à quelques critiques acerbes concernant la politique tarifaire de JSTOR, notamment le coût des articles en pay per view

Concernant l'affaire Aaron Swartz, Lawrence Lessig a donné son point de vue dans un commentaire assez court. Le message de Lessig est un peu décevant en ce qu'il ne comporte que très peu d'analyse juridique du dossier. Du strict point de vue juridique, Lessig se contente d'émettre un doute sur la qualification criminelle des faits en constatant qu'il existe une incertitude considérable dans le domaine de la fraude informatique. Pour le reste, Lessig quitte le terrain juridique, pour adopter un point de vue moral. Quand bien même Aaron Swartz a des chances d'être relaxé, il n'en reste pas moins que son acte est condamnable d'un point de vue éthique:

Nonetheless, if the facts are true, even if the law is not clear, I, of course, believe the behavior is ethically wrong. I am a big supporter of changing the law. As my repeated injunctions against illegal file sharing attest, however, I am not a believer in breaking bad laws. I am not even convinced that laws that protect entities like JSTOR are bad. And even if sometimes civil disobedience is appropriate, even then the disobedient disobeys the law and accepts the punishment.
[...]
What it was is unclear. What the law will say about it is even more unclear. What is not unclear, however, to me at least, is the ethical wrong here. I have endless respect for the genius and insight of this extraordinary kid. I cherish his advice and our friendship. But I am sorry if he indeed crossed this line. It is not a line I believe it right to cross, even if it is a line that needs to be redrawn, by better laws better tuned to the times.
En  réalité, le silence prudent de Lessig s'explique du fait que, désormais, tout ce qu'il pourra déclarer est susceptible d'être utilisé ultérieurement à charge ou à décharge au cours du procès.

Lawrence Lessig et Aaron Swartz vers 2002. Source: The Awl

 Conclusion: qui dans le quatuor joue le plus faux?

Sous le flot de ces considérations, on en viendrait presque  à oublier un membre important du quatuor, qui a à cœur de faire entendre ses dissonances. Greg Maxwell et Aaron Swartz mettent en cause  l'attitude  des éditeurs qui profitent de leur position quasi-monopolistique pour monétiser à des prix parfois excessifs, l'accès aux résultats des travaux scientifiques. On se trouve en effet dans une situation ubuesque où les chercheurs sont amenés bien malgré eux à rétribuer les éditeurs deux à quatre fois:
- par la rédaction et la soumission d'articles dont  ils ne retirent aucune compensation financière
- par leur participation non rémunérée à l'activité de peer reviewing (relecture critique et sélective des papiers proposés à la publication par leurs collègues)
- par la participation financière de leurs laboratoires ou de leurs centres de documentation à l'abonnement ouvrant l'accès au texte intégral des revues
- de plus, la publication d'articles est soumise par certains éditeurs à l'acquittement d'un montant forfaitaire.

Est-ce à dire que la partition jouée par nos deux "hacktivists" ne visait pas à déstabiliser l'agrégateur de contenus JSTOR mais n'avait pour but que de chatouiller par des sons stridents les oreilles des éditeurs scientifiques ? Pas si sûr. Car dans le cas précis de JSTOR, la part des revenus perçus par les éditeurs n'excède pas 30% du chiffre d'affaires total de l'agrégateur, le reste étant absorbé par les dépenses de fonctionnement de JSTOR. On peut s'interroger sur le bien-fondé d'un tel modèle tarifaire, pour une organisation à but non lucratif, qui, comme elle le rappelle elle-même dans la déclaration déjà citée, a vocation à "fournir un accès abordable aux contenus scientifiques à quiconque en a besoin". Sans doute le procès sera-t-il l'occasion de jeter un peu de lumière sur cette zone d'ombre.

---------------------------------------------------------------------
Merci à @marlened pour sa traduction du texte de Greg Maxwel