Pour étudier l’organisation spatiale des activités scientifiques, on s’appuie sur les données bibliographiques contenues dans le Web of Science (WoS) de Thomson Scientific ® (Devenu Clarivates Analytics). Jusqu’à présent , nos analyses se sont centrées sur le contenu des années 1999-2001 et 2006-2008.

L’information spatiale contenue dans une notice bibliographique se présente sous la forme de chaînes textuelles : les adresses d’auteurs. Dans les données sources (ISI, Thomson Scientific), un premier niveau de structuration est proposé sous la forme de triplets « ville, province, pays ». Pour simplifier l’information de départ, les triplets sont soumis à des opérations d’homogénéisation à l’aide de catalogues de toponymes ou gazettes. La procédure de géocodage automatique permet ensuite d’associer à chaque triplet un jeu de coordonnées géographiques (une latitude et une longitude). Les coordonnées permettent de localiser chaque publication scientifique sur un plan. Pour travailler à un niveau de résolution homogène à l’échelle du monde, les proches localités sont regroupées pour obtenir des agglomérations. Après avoir retenu une méthode de comptage scientométrique (comptage entier fractionné) et appliqué une procédure de lissage permettant d’atténuer les effets relatifs aux petites fluctuations annuelles (moyennes mobiles d’ordre 3), des tableaux d’information géographique sur la production, les collaborations et citations par agglomérations ou couples d’agglomérations sont obtenus. En plus des analyses statistiques et de réseaux, l’information finale est représentée à l’aide de dispositifs de visualisation complémentaires : cartes, réseaux et graphiques.

graphique_geoscience