Depuis fin 2019, la recherche sur le COVID-19 se fait à grande vitesse et génère des coopérations internationales traduites par les co-signatures d’articles scientifiques. La Chine, foyer de l’épidémie, est le principal pays producteur de recherches sur le nouveau coronavirus, mais près de 90 pays sont impliqués au 4 mai 2020. Cette note revient sur la géographie de la recherche portant sur le COVID-19 et son évolution entre le 23 mars et le 4 mai 2020.

Préambule sur la production scientifique

La diffusion rapide du COVID-19, la nécessité de trouver des solutions pour enrayer l’épidémie et affronter ses conséquences expliquent que nous assistions à une mobilisation accélérée des scientifiques pour publier leurs résultats. Ces publications prennent la forme traditionnelle d’articles dans des revues à comité de lecture et celle, plus directe (car ne passant pas par le filtre de l’évaluation par un comité de lecture) de dépôts de pré-publications (preprints) sur des archives ouvertes (en particulier bioRxiv, medRxiv et ChemRxiv).

Du point de vue de la diffusion des connaissances, le secteur de l’édition académique en biomédecine, dominé par des acteurs privés enregistrant des marges impressionnantes (voir le chiffre d’affaire d’Elsevier ou Springer), s’est empressé de proposer une mise en accès ouvert de la littérature académique portant sur le thème du coronavirus (exemple chez Elsevier : https://www.elsevier.com/connect/coronavirus-initiatives). Exceptionnellement, le savoir produit par les chercheurs et chercheuses du monde entier est présenté comme un bien public et sa mise en accès ouvert se révèle indispensable pour une circulation mondiale et accélérée des connaissances.

Souhaitant que ces initiatives ne restent pas exceptionnelles et cantonnées au cas de la crise que nous traversons, Vincent Larivière, Fei Shu et Cassidy R. Sugimoto en appellent à une ouverture “sans délai” de la littérature académique (Larivière, Shu & Sugimoto, Février 2020).

Évidemment, cette course au vaccin et à la publication n’est pas dénuée de suspicions de fraudes et d’erreurs scientifiques dont témoigne le nombre d’articles et de preprints retirés (voir le site de suivi Retraction Watch) et de son lot de controverses scientifiques. L’affaire Raoult dans le domaine de la virologie a fait l’objet d’une couverture médiatique (et politique) suffisante pour en témoigner (La Science au temps du coronavirus, Gingras, 2020). Que l’on s’appuie sur la littérature publiée dans les revues à comité lecture ou sur les publications disponibles dans les archives ouvertes, il convient donc d’avoir un regard prudent sur les données actuellement disponibles au sujet de la recherche en lien avec le COVID-19.

Suivre la progression des recherches sur le COVID-19

Précautions prises, l’application web NETSCITY, mise en place à destination des chercheurs et chercheuses, spécialistes de l’information scientifique et journalistes scientifiques pour traiter les données issues des grandes bases de données bibliographiques, permet d’avoir un aperçu intéressant et rapide de la provenance des premières publications portant sur le COVID-19.

Cette application, en cours de développement, est déjà accessible en version beta à l’adresse : https://www.irit.fr/netscity. Il s’agit d’une collaboration interdisciplinaire entre trois laboratoires CNRS : l’UMR Géographie-cités (Paris), l’UMR LISST et l’UMR IRIT (Toulouse) avec le soutien du groupe NETSCIENCE du LABEX Structuration des Mondes Sociaux (SMS).

Dans le cadre de la crise que nous traversons, cette application peut permettre de répondre aux questions suivantes :

  • D’où viennent, depuis décembre 2019, les articles scientifiques qui ont pour mot-clef “COVID-19”, “2019-nCoV” ou “SARS-CoV-2” ?
  • Cette géographie reflète-t-elle la géographie de l’épidémie ou observe-t-on des spécificités caractéristiques de la géographie traditionnelle du champ de la virologie avec un effort particulier des zones où se situent les laboratoires historiques de ce champ ?
  • Que peut-on dire des coopérations scientifiques traduites par les co-signatures de publications ? Malgré l’épidémie et la fermeture des frontières, voit-on émerger des connexions entre chercheurs localisés dans des villes, pays, continents différents ?

Une première analyse, réalisée à partir des données du Web of Science à quatre dates, celle du 23 mars 2020, celle du 6 avril 2020, celle du 20 avril 2020 et celle du 4 mai 2020, permet de mettre en évidence la prééminence des publications en provenance de Chine et la croissance progressive des publications provenant d’autres zones, y compris l’espace sub-saharien – traditionnellement peu visible.

Voici le détail des données collectées suivi de quelques représentations graphiques extraites de NETSCITY.

Le 23 mars 2020, 197 publications étaient accessibles dans le WoS (SCI-EXPANDED, CPCI-S, ESCI) parmi lesquelles 70 articles évalués par les pairs, 65 éditoriaux, 35 lettres,  17 recensions, 9 brèves d’actualité, et 1 correction. A titre de comparaison, pour des requêtes similaires, Alexei Lutay trouvait le lendemain : 386 publications dans Scopus, 1262 dans Semantic Scholar et 1766 dans Dimensions. Dans la mesure où la couverture (le nombre de revues couvertes par le Wos reste plus limité, ces différences n’apparaissent pas étonnantes) (Lutay, mars 2020). D’un point de vue thématique, les principaux champs couverts par ces publications sont la médecine générale, la virologie, les maladies infectieuses, l’immunologie, la microbiologie, l’imagerie médicale et les maladies tropicales. La revue médicale Lancet est celle rassemblant le plus de publications à cette date (Tableau 1).

Le 6 avril 2020, la même requête dans le Web of Science renvoyait 442 publications (soit deux fois plus que 15 jours plus tôt). Parmi elles, 146 articles, 137 éditoriaux, 79 lettres, 41 brèves d’actualité, 34 recensions, et 5 corrections. Les champs de la pédiatrie, de la biologie et des soins intensifs occupent une place plus importante. Celui de la médecine tropicale devient plus marginal. Les principales contributions restent en médecine générale, maladies infectieuses et virologie. A cette date, le British Medical Journal (BMJ) passe devant Lancet en nombre de publications. Les trois premières revues du Web of Science publiant sur le sujet restent le BMJ, Lancet et Journal of Medical Virology (Tableau 2).

Le 20 avril 2020, on compte 1095 publications (soit 2,5 fois plus que 15 jours plus tôt). Parmi elles, 346 éditoriaux, 334 articles, 180 brèves d’actualités, 127 lettres, 92 recensions, et 16 corrections. Les contributions dans le champ de la santé publique et environnementale, ainsi qu’en anesthésiologie, immunologie et oncologie se sont développées. Les principales contributions restent en médecine générale, maladies infectieuses et virologie. A la suite des quatre mêmes premières revues, on remarque la revue Cureus, qui ne comptait à peine que 3 publications à la date précédente. Cette dernière est bien plus jeune et moins conventionnelle que les précédentes. Créée en 2009, elle présente l’originalité d’être en accès ouvert et de pratiquer le principe dit de crowdsourcing dans son processus d’évaluation. Cela signifie que l’évaluation est ouverte et les remarques des évaluateurs sont publiques. Il est intéressant de voir que cette revue innovante, du point de vue de l’édition scientifique, se retrouve au premier plan dans ce contexte d’urgence (Tableau 3). Cela confirme, avec le développement simultané des dépôts sur archives ouvertes, l’attrait pour les nouvelles méthodes de diffusion et de production du savoir.

Le 4 mai 2020, 1913 publications contenant les mots recherchés sont indexées dans le WoS. La croissance a été légèrement moins marquée qu’au court de la quinzaine précédente (multipliée par 1,7 contre 2,5 la fois précédente). Face aux bases de données concurrentes (déjà près de 5000 publications pour Scopus ; 8000 pour Pubmed ; plus de 10 000 pour Dimensions et Lens d’après  Jeroen Bosman), ce rythme peut paraître étonnant, mais il est en cohérence avec la politique de couverture généralement moins exhaustive du WoS et peut aussi s’expliquer par le choix de procéder à une indexation plus complète de l’information (au 4 mai, la part d’adresses renseignées par publication est de 83 %).

Parmi les 1913 publications, on distingue 629 articles, 592 éditoriaux de revue, 332 lettres, 176 brèves d’actualité, 166 recensions et 18 corrections. Aux précédentes spécialités représentées en tête desquelles la médecine générale, la virologie, les maladies infectieuses, la santé publique et la radiologie, on remarque une participation croissante des anesthésiologistes et des dermatologistes. Les revues comptabilisant plus de 10 publications précédemment se maintiennent dans le top 30, et l’innovante revue Cureus conforte sa place dans le top 5 des revues impliquées (Tableau 4). Deux revues iraniennes intègrent le top 30 : la revue de chirurgie orthopédique Archives of bone and joint surgery et Archives of Iranian Medecine.

Venons en à présent à la géographie !

La géographie des recherches sur le COVID-19

Le 23 mars 2020

Au 23 mars, les publications qu’il est possible de renseigner géographiquement (177 parmi 197) proviennent de 39 pays différents (Tableau 5).

Les 5 premiers pays ont produit 69 % de l’ensemble des publications portant sur le sujet. Il s’agit, dans l’ordre décroissant, de la Chine, des États-Unis, du Royaume-Uni, de la Corée du Sud et de la Suisse. Ils sont suivis de près par l’Italie, l’Allemagne et la France (Carte 1).

La production provient de 159 aires urbaines distinctes. Les 55 premières agglomérations ont contribué à près de 80 % de la production (Tableau 6). 

Grâce à NETSCITY, les données sont normalisées de sorte que lorsqu’une publication provient de plusieurs agglomérations différentes, chacune reçoit une fraction de publication proportionnelle au nombre d’agglomérations participantes. Pour réaliser ces statistiques, le niveau urbain considéré est celui de l’agglomération au sens où nous avons procédé à un regroupement de la ville-centre et de sa banlieue (voir la méthodologie expliquée ici). Il en ressort que les principales aires urbaines publiantes sont Wuhan, Beijing, Hong-Kong, Guangzhou et Séoul. La primauté de la ville de Wuhan et le fait que le top 5 soit asiatique témoigne du fait que la géographie de la recherche est ici directement liée à celle de l’épidémie (Carte 2). Ces agglomérations sont suivies par Londres, qui, à cette date, n’est pas la ville européenne la plus touchée par l’épidémie. Il faut donc y voir une place particulière de la capitale britannique dans les champs scientifiques concernés et en tant que siège de revues scientifiques (à cette date, la moitié des publications londoniennes sont des éditoriaux).

Parmi les 177 publications, 96 ont été signées depuis au moins deux agglomérations différentes et 10  ont été signées depuis plus de 6 agglomérations. Cette densité de co-publications permet de s’intéresser aux réseaux de coopérations entre lieux. Au niveau pays, les principaux liens de collaborations sont entre la Chine et le reste des pays du monde : États-Unis, Canada, Australie, Allemagne, Royaume-Uni, Belgique, France. Les scientifiques italiens ont, quant à eux, collaboré plus spécifiquement avec les États-Unis et le Brésil (Graphe 1).

Cliquer ici pour explorer le graphe de façon interactive

Au niveau interurbain, on note que les collaborations infranationales sont prépondérantes (en Chine : lien Wuhan – Beijing et Wuhan – Shanghai ; en France : lien Paris – Bordeaux – villes des premiers patients atteints du Coronavirus dans le pays ; en Corée : lien Séoul – Taejon/Daejeon). On enregistre ensuite des coopérations internationales renouvelées entre Rome et Rio, entre Atlanta et Riyadh, entre New Haven et Sydney, entre Paris et Wuhan, ainsi qu’entre Genève et Shanghai (Graphe 2).

Cliquer ici pour explorer le graphe de façon interactive

Le 6 avril 2020

Au 6 Avril, les publications qu’il est possible de renseigner géographiquement (381 parmi 442) proviennent de 57 pays différents (Tableau 7).

Les 5 premiers pays font  66 % de l’ensemble des publications portant sur le sujet, ce qui indique que la production est moins concentrée que 15 jours plus tôt. Les trois premiers pays restent la Chine, les États-Unis, et le Royaume-Uni. En revanche, la Corée du Sud et la Suisse sont dépassées par l’Italie, pays européen le plus touché par l’épidémie, et par l’Allemagne (Carte 3).

La production provient de 262 aires urbaines distinctes (c’est 100 de plus que 15 jours plus tôt !). Les 54 premières agglomérations ont contribué à près de 70 % de la production indiquant aussi un mouvement de déconcentration de la production entre villes (Tableau 8). 

Les principales aires urbaines publiantes sont Wuhan, Beijing, Shanghai, Hong-Kong, et Guangzhou. Londres et Singapour passent devant Séoul, qui était la cinquième ville la plus publiante 15 jours plus tôt (Carte 4). Le nombre normalisé de publications de Tokyo passe de 1 à 5 ce qui  propulse l’agglomération japonaise parmi les 10 villes les plus publiantes sur le sujet. Quelques espaces urbains se démarquent dans l’hémisphère Sud dont il sera intéressant de suivre la dynamique dans les semaines qui viennent, en particulier : Sao Paulo, Melbourne et Sydney. On remarque aussi l’activité de Riyadh, Téhéran et Beirut au Moyen Orient, sans doute influencée par l’importance prise par l’épidémie en Iran.

Parmi les 381 publications, 187 ont été signées depuis au moins deux agglomérations différentes et 20, depuis plus de 6 agglomérations. Au niveau pays, les principaux liens de collaborations restent entre la Chine et le reste des pays du monde. Le Royaume-Uni développe des coopérations avec les États-Unis et Singapour. L’Inde (Pune en particulier) se connecte à la Chine et la Thaïlande. La Tanzanie s’intègre au réseau scientifique mondial par l’intermédiaire d’une co-publication avec l’Afrique du Sud. De la même manière, le Liban est connecté au réseau par l’intermédiaire de l’Iran (Graphe 3).

Cliquer ici pour explorer le graphe de façon interactive

Au niveau interurbain, les collaborations infranationales restent importantes, en particulier entre villes chinoises. En plus de celles enregistrées 15 jours plus tôt, on observe une coopération privilégiée entre Atlanta et Seattle aux États-Unis, ainsi qu’entre Sapporo, Naha et Tokyo au Japon. Par ailleurs, on enregistre un grand nombre de nouvelles coopérations internationales. Les liens entre Toronto et Xian, Londres et Singapour, Ann Arbor et Shanghai se révèlent importants (Graphe 4).

Cliquer ici pour explorer le graphe de façon interactive

Le 20 Avril 2020

Le 20 Avril 2020, sur les 1095 publications extraites du Web of Science, 886 contiennent des adresses (affiliations professionnelles) permettant de procéder au repérage géographique de leurs auteurs. Les 209 publications restantes sont essentiellement des brèves d’actualité, éditoriaux et lettres.

Les 886 publications repérables au 20 Avril proviennent de 77 pays différents (Tableau 9).

Alors que les publications issues de Chine ont doublé entre le 6 et le 20 Avril, celles venant des États-Unis et d’Italie ont été multipliées par trois, et d’Iran par 5. Le nombre de contributions du Royaume-Uni, de Suisse et d’Allemagne a également plus que doublé sur la période (Carte 5). En revanche, malgré l’importance prise par l’épidémie en Espagne, la participation de ce pays à la production scientifique en lien avec la maladie reste très faible.

Les 5 premiers pays producteurs sont les mêmes que 15 jours plus tôt et pèsent à nouveau 66 % du total. Dans le top 10, Singapour est dépassé par la Suisse, la Corée du Sud, l’Iran (qui intègre le top 10) et le Canada. Le Japon, quitte le top 10, et se retrouve à la 12ème place, derrière l’Australie. L’augmentation moins rapide de la production des pays asiatiques semble confirmer un déplacement vers l’Ouest du centre de gravité des recherches.

Plus encore qu’une diffusion de la thématique à de nouveaux pays, on observe une démultiplication du nombre d’aires urbaines impliquées. Leur nombre passe de 262 à 456. Les 54 premières agglomérations ne participent plus qu’à 62 % du total de la production indiquant la poursuite rapide du mouvement de diffusion spatiale (Tableau 10).

Londres confirme sa place de première ville publiante sur le sujet en Europe en intégrant le top 5 mondial à la place de Guangzhou. Rome et Taipa (île située en face de la péninsule de Macao en Chine) voient leurs contributions multipliées par trois et se retrouvent parmi les 10 premières agglomérations publiantes au détriment de Chengdu et Tokyo. Téhéran enregistre un bond important passant de la 34e place à la 11e (Carte 6).

Parmi les 886 publications, près de la moitié (431) ont été signées depuis au moins deux agglomérations et près de 50, depuis plus de 6 agglomérations. Au niveau pays, les principaux liens de collaborations restent entre la Chine et le reste des pays du monde. Le réseau des États-Unis avec le reste du monde se densifie de façon importante et le lien entre l’Inde et la Thaïlande se renforce. (Graphe 5).

Cliquer ici pour explorer la version interactive du graphe

Les collaborations infranationales restent importantes, notamment en Chine, où la principale coopération est entre Beijing et Wuhan. Au Royaume-Uni, on voit se développer les collaborations Londres – Sheffield et Londres – Bristol  (Graphe 6).

Cliquer ici pour explorer la version interactive du graphe

Le 5 Mai 2020

Parmi les 1913 publications recensées, 1580 ont une adresse ou plusieurs adresses associées. Ces 1580 publications proviennent de 88 pays différents, soit 10 de plus qu’au 20 avril (Tableau 11).

Le rythme d’augmentation a été moins fort qu’au court de la période précédente. Avec un taux de croissance d’1,5, la Chine reste en tête, mais son avance diminue par rapport aux États-Unis qui voient leur production doubler. l’Italie conforte sa 4e place avec 2,3 fois plus de publications qu’au 20 avril. La production iranienne triple ce qui permet à l’Iran d’intégrer le top 5 des pays les plus publiants sur le sujet devant l’Allemagne. La Corée du Sud remonte devant la Suisse, tandis que l’Inde enregistre une progression importante lui permettant d’intégrer pour la première fois le top 10.

Ces évolutions semblent indiquer que si l’épidémie a ralenti dans les pays d’Orient ces dernières semaines, leur implication dans la recherche n’en a pas moins été poursuivie : cela peut évidemment s’expliquer par le décalage entre les rythmes de production des publications et leur rythme de parution. Mais il est à noter que ces évolutions sont variables selon les pays et qu’en ce qui concerne le Japon, nous n’observons pas une poursuite de croissance comparable à celle observée en Corée du Sud. Un développement rapide des recherches est également remarquable dans plusieurs pays de l’Est de l’Europe (Hongrie et Turquie en particulier). Du côté de l’hémisphère Sud, l’Australie et le Brésil continuent de se démarquer, occupant respectivement la 10e et la 15e place mondiale (Carte 6).

La diffusion spatiale se poursuit au niveau des aires urbaines. Les 55 premières agglomérations réalisent désormais un peu moins de 60 % du total de la production (Tableau 12). En tout, ce sont 653 aires urbaines impliquées contre 456 au 20 avril.

La capitale britannique confirme son avance au niveau mondial, son niveau de participation se rapprochant de celui des principales villes chinoises impliquées (Wuhan, Beijing et Hong Kong). New York et Téhéran intègrent le top 10 : leur contribution est 3 fois plus importante qu’au 20 avril. La plupart des villes italiennes, étasuniennes et iraniennes impliquées doublent leur contribution sur cette même période. L’implication croissante de plusieurs pays (États-Unis, Italie, Iran, Brésil) se traduit donc à l’échelle de l’ensemble de leur système national de recherche (Carte 7). L’évolution des liens de collaborations scientifiques entre villes en témoigne encore plus nettement (Graphe 8).

756 publications sont le résultat de coopérations entre scientifiques localisés dans des aires urbaines différentes (48 %), et 399 résultent d’une coopération internationale (25 % du total), indiquant bien que la part de coopération intra-nationale reste majoritaire. Les principaux liens de coopérations entre pays sont entre la Chine et les États-Unis ainsi qu’entre ces deux pays et le Royaume-Uni. L’Italie et l’Iran développent des liens plus importants avec les États-Unis et le Royaume-Uni qu’avec la Chine. En revanche, l’Australie, le Canada et l’Allemagne ont jusqu’ici davantage collaboré avec la Chine qu’avec les États-Unis (Graphe 7).

Cliquer ici pour explorer la version interactive du graphe

Le détail des relations entre villes permet de repérer des liens privilégiés à l’international ainsi que d’importantes connexions domestiques. Le graphe de l’ensemble des relations entre villes devenant trop touffu pour être visualisé dans son ensemble, nous considérons les liens les plus importants (au moins deux co-publications). Le réseau ainsi seuillé ne comprend plus que 126 villes sur 593. Du côté droit de l’image, on voit se dégager plusieurs petits ensembles de villes en forte coopération (groupe sud-coréen, dyade allemande, dyade japonaise etc.). Certains de ces petits groupes rassemblent des villes de pays différents (Pune-Bangkok-Haikou, Bruxelles-Montréal-Marseille). Sur la partie gauche de l’image se détache une grande composante comprenant les villes chinoises, les villes étrangères qui y sont connectées, ainsi que les partenaires de ces dernières : les villes iraniennes se raccrochent à ce réseau via les villes britanniques et les villes brésiliennes s’y intègrent via les villes italiennes (Graphe 8).

Cliquer ici pour explorer dans le détail la composante principale de ce graphe en version interactive.

Comprendre cette géographie

Il peut être surprenant de constater que nous avons affaire à un réseau de coopération d’une telle densité alors même que la question de recherche ne fait qu’émerger et que nous sommes dans une situation où les possibilités d’échanges sont fragilisées par la fermeture des frontières.

Pour mieux comprendre ce que nous observons, il serait utile de différencier les différents types de publications considérées et réaliser des entretiens avec les chercheurs et chercheuses impliquées. On peut supposer que les coopérations avec la Chine se sont avérées essentielles à la fois pour la gestion médicale de la crise et pour la connaissance du virus : les scientifiques chinois ayant procédé rapidement au séquençage du génome, suivi par ceux de l’Institut Pasteur de Paris (Lemke, Janvier 2020). Les laboratoires ont dû se coordonner, partager leurs résultats, programmer des essais cliniques et échanger des spécimens biologiques. C’est le cas avec l’institut Doherty à Melbourne, qui a communiqué dès la fin du mois de Janvier 2020 sur le fait d’avoir réussi à répliquer le virus en laboratoire (Université de Melbourne, Janvier 2020).

Aux échanges accélérés justifiés par l’urgence de la crise, il faut associer ce qui relève des échanges préétablis entre ces laboratoires, ces chercheurs et chercheuses qui s’inscrivent dans des communautés scientifiques préexistantes et avaient déjà été amenés à travailler ensemble auparavant. On peut penser à la communauté des spécialistes des coronavirus, qui sont un type de virus particulier que le Professeur Bruno Canard étudie depuis le début des années 2000 à l’Université Aix-Marseille (Sauvons l’Université, mars 2020).  Au sein de l’ICTV (International Committee on Taxonomy of Viruses), il existe ainsi un groupe d’étude des coronavirus composé d’une majorité de membres américains, allemands et néerlandais (Coronaviridae Study Group).

Le rôle des laboratoires historiques en virologie que sont les Instituts Pasteur de Paris, Hanoi et Dakar et l’Institut Robert Koch en Allemagne dans le suivi de la diffusion du virus et dans la recherche de vaccins est également intéressant à signaler. Pour en savoir plus sur l’histoire de ces deux savants et les instituts qui ont pris leurs noms, voir l’ouvrage et le documentaire éponyme Pasteur et Koch : un duel de géants dans le monde des microbes. Enfin, on remarque le rôle de coordination joué par le STAG-IH (Strategic and Technical Advisory Group for Infectious Hazards), comité d’experts mis en place en 2005 au moment de l’épidémie d’Ebola, qui dispense des rapports et conseils pour l’Organisation Mondiale de la Santé.

C’est ce qui justifie que les initiatives de mises à disposition de la littérature scientifique associée à l’épidémie intègrent une littérature bien antérieure à décembre 2019. Le socle de connaissance nécessaire pour avancer dans ce domaine ne se résume pas aux seules publications parues depuis l’apparition du nouveau coronavirus.

Corpus complémentaires

Pour celles et ceux qui seraient intéressés de creuser davantage ces questions, on peut distinguer plusieurs corpus mis à disposition des chercheurs et chercheuses depuis quelques mois :

  1. La base de données de recherche ouverte COVID-19 (CORD-19), une ressource gratuite de plus de 44 000 articles scientifiques, mise à disposition par l’Institut Allen pour l’IA et de ses partenaires. Une sous-partie de ce corpus a fait l’objet d’une analyse géographique disponible sous forme de preprint en ligne (Dousset & Mothe, 2020). En complément, le projet Neural Covidex (University of Waterloo et NYU) propose des moyens automatisés d’explorer ce corpus. Le Service pour la Science et la Technologie de l’ambassade de France propose également un outil d’exploration interactive de la géographie de ce corpus au niveau pays et institutions (Covid-19: CORD19 Publications Dashboard). Il est aussi possible d’explorer la COVID-19 Open research map, régulièrement mise à jour, qui connecte les document de son corpus d’après une mesure de similarité entre les résumés (Vermej, 2020).
  2. L’ensemble des publications ayant pour mot-clef “coronavirus” de janvier 2000 à mars 2020 disponibles sur la base de données PubMed (6560 documents). Ces publications font l’objet d’une fouille visant à en extraire des relations sémantiques à l’aide du logiciel Gargantext (ISCPIF, 2020), développé par David Chavalarias  (interview dans le journal du CNRS, 2020). Pour d’autres analyses de ce type, on peut suivre les premiers résultats de Chaomei Chen à partir du logiciel CiteSpace (Chen, 2020). Les données PubMed sont également utilisées par Jimi Adams et Ryan Light pour explorer les coopérations et la géographie des publications portant sur le COVID-19  (Adams et Light, 2020).
  3. La base de publications spécialement mise en place par l’Organisation Mondiale de la Santé sur le COVID-19 qui comprend 10 297 publications au 4 mai 2020 : 5014 articles dont 333 du BMJ, 144 de la revue Lancet et 128 de la revue Science (WHO, 2020).
  4. Les archives ouvertes parmi lesquelles une base de 2704 preprints déposés sur MedRxiv et BioRxiv portant uniquement sur le nouveau coronavirus (MedRxiv, 2020). Pour un bilan du nombre de contributions en lien avec le nouveau coronavirus sur archives ouvertes, voir les analyses de Nicholas Fraser et Bianca Kramer (Fraser et Kramer, 2020). Signalons aussi la multiplication des initiatives visant à faciliter la recherche d’informations sur archives ouvertes : aux États-Unis, via le répertoire d’archives ouvertes de l’Université de Harvard DASH, et en France via HAL (Magron, 2020; HAL, 29 avril 2020). La progression du recours aux archives ouvertes en Science Humaines et Sociales est également à signaler. Ainsi la plateforme SocArxiv d’archive ouverte en sociologie s’est récemment félicitée du très bon nombre de preprints déposés en avril 2020, parmi lesquels 68 sur le COVID (SocArxiv, 2020)
  5. Une analyse de la littérature ouverte (en libre accès) depuis plusieurs bases de données (Dimensions, Scopus etc.) par une équipe de scientifiques de l’Institut de technologie de Bandung en Indonésie (Irawan et al., 2020). Une analyse complémentaire tenant compte du rythme d’évolution des contenus sur le Web of Science et Scopus (Torres-Salinas, 2020).
  6. La base de données covid-nma alimentée par l’Institut Cochrane, l’INSERM et l’APHP regroupant à ce jour 626 essais cliniques randomisés. Elle a fait l’objet d’une première analyse incluant une cartographie à l’échelle mondiale (Vuillemot et al., 2020).
  7. La liste alimentée par l’Organisation Mondiale de la Santé des programmes de développement de vaccins en cours (Covid-19 candidate vaccines, 2020). Cette liste a fait l’objet d’une analyse publiée dans Nature reviews (Thanh Le et al., 2020). Ce travail indique que la majorité des initiatives sont actuellement portées par des industries privées nord-américaines.
  8. La plateforme d’exploration de données de publications scientifiques, projets de recherche et brevets sur les Coronavirus et le Covid-19 par la Commission Européenne en coopération avec TIM Analytics (Knowledge for Policy, 2020).
  9. L’initiative de veille scientifique Bibliovid montée par un collectif du Centre Hospitalier de Grenoble avec l’aide d’une pneumologue du Centre Hospitalier de Marseille. Cette plateforme permet de naviguer dans la littérature scientifique sur le Covid classée selon 5 grands types : pronostique, épidémiologique, thérapeutique, diagnostique et recommandations.
  10. La fuite sur Reddit de près de 5000 documents mis à disponibilité par un hacker souhaitant faciliter l’accès à une littérature scientifique d’ordinaire payante aux chercheurs de tous les pays, y compris les pays d’Afrique sub-saharienne (Rakotombrabe, 2020).
  11. Une cartographie des recherches sur les maladies infectieuses à partir des données de la base Scopus réalisée par l’équipe de l’éditeur Elsevier (Elsevier Community, 25 Mars 2020)
  12. L’application de la technologie Scite.AI au cas des publications sur le COVID-19 afin d’identifier les citations à connotation positives et négatives (Kahmsi, 2020)
  13. Le Coronavirus Open Citations Dataset : un jeu de données de publications en accès libre portant sur les Coronavirus comprenant des informations sur 124 295 documents et sur les 42 213 articles cités ou citants de ce corpus (Peroni, 2020). L’accès facilité aux métadonnées issues de Crossref est à rapprocher de cette initiative (Kemp, 2020).
  14. Depuis le 14 avril, le COVID-19 Graph – Knowledge Dashboard développé conjointement par l’équipe AMiner de l’Université de Tsinghua, le Centre chinois des connaissances en sciences et technologies de l’ingénieur, l’hôpital Changgeng de Pékin affilié à l’Université de Tsinghua, le laboratoire d’informatique Alibaba, le centre de recherche de l’Institut de recherche en intelligence artificielle Zhiyuan de Pékin, Sogou Search et Jiepu.  Il fournit des statistiques et des modèles de prévision de l’épidémie mondiale, afin d’évaluer et de prévoir quantitativement le développement et l’état du risque de l’épidémie dans le monde. Il retrace les derniers progrès de l’épidémie dans tous ses aspects, y compris la recherche scientifique, la dynamique gouvernementale et l’opinion sociale.

Enfin, si la présente contribution s’est centrée sur la recherche biomédicale en restreignant la requête aux bases de Sciences et Techniques du Web of Science et en excluant les index de Sciences Humaines et Sociales, cela ne veut pas dire que la recherche sur le coronavirus ne concerne que les champs de la médecine et de la biologie. Cela n’aura échappé à personne que l’épidémie touche à tous les pans de notre société, tant du point de vue de la réponse des services publics et de l’épidémiologie que sur les aspects économiques, sociaux et environnementaux. L’apport des Sciences Humaines et Sociales est particulièrement important dans ce contexte, en témoigne nombre de spécialistes convoqués dans les médias ces dernières semaines pour aborder la question du confinement. Des initiatives spécifiques de coordination de la recherche se mettent en place visant à faciliter les échanges entre la recherche en biomédecine et la recherche en sciences humaines et sociales, notamment sur le plan épidémiologique. On peut penser en France aux actions du comité CARE, ainsi qu’aux initiatives de mises en commun des recherches comme CovidFight.

En savoir plus

Cette note et les résultats présentés ont été obtenus en utilisant l’application NETSCITY. Cette application applique la méthodologie mise en place dans le cadre d’un programme de recherche sur la géographie des sciences qui a débuté en 2010. Elle permet de traiter rapidement de grandes masses de données bibliographiques, de repérer géographiquement la provenance des publications, d’agréger les données au niveau d’aires urbaines comparables et de reconstituer les réseaux de lieux qui s’établissent entre villes et entre pays à l’échelle mondiale.

Cette application, toujours en cours de développement (vos retours d’utilisation sont les bienvenus) est accessible en ligne à l’adresse : https://www.irit.fr/netscity.

L’équipe de développement comprend Laurent Jégou, géographe et géomaticien à l’UMR LISST à Toulouse, Guillaume Cabanac, informaticien et scientomètre à l’UMR IRIT, à Toulouse et moi-même, géographe à l’UMR Géographie-cités à Paris – Aubervilliers.

Deux étudiants de l’IUT d’informatique de Toulouse ont également contribué au développement web. Il s’agit de Nikita Yakimovich et Nils Bourgon.

Un article de conférence scientifique présenté à la Conférence Internationale Science and Technology Indicators à Rome en 2019 permet de situer l’application dans le contexte des applications de traitement de données sur la science et d’en expliquer le fonctionnement. S’y référer :

 
Laurent Jégou et Guillaume Cabanac ont contribué à l’écriture de cette note.