à propos des données
Je mets ici quelques ressources pour vous qui peuvent vous aider à trouver des données, ce sont des choses que j’ai mises en place à cet effet.
Vous verrez que j’aime les principes de la recherche reproductible et encourage la science ouverte. La science des données est un outil de la complexité économique.
Sanger W. and Warin Th. (2019) “Jaccard Similarity of 1517 European Political Manifestos across 27 Countries (1945-2017)” Data in Brief, DIS-S-18-02150 [DOI: 10.1016/j.dib.2019.103907]
de Marcellis-Warin N., Sanger W. and Warin Th. (2019) “Text-as-Data Analysis of Political Parties versus Government Parties: To Blend or not to Blend? The Appendix”, DOI: 10.6084/m9.figshare.7781051.v2, pp.1-63, Fe
Pour explorer d’autres sujets : warin.ca/publications.html
EpiBibR Github. EpiBibR signifie «bibliographie basée sur l’épidémiologie pour R». C’est le deuxième plus grand ensemble de données sur la recherche mondiale sur les coronavirus et le plus grand de R. Le package R est sous la licence MIT et en tant que tel est une ressource gratuite basée sur les principes de la science ouverte (recherche reproductible, données ouvertes, code ouvert). La ressource peut être utilisée par des chercheurs, dont le domaine est la scientométrie, mais aussi par des chercheurs d’autres disciplines. Par exemple, la communauté scientifique de l’intelligence artificielle et de la science des données peut utiliser ce package pour accélérer de nouvelles informations de recherche sur le covid-19. Le package suit la méthodologie mise en place par l’Institut Allen et ses partenaires pour créer l’ensemble de données CORD-19 avec quelques différences. Ce dernier est accessible via des téléchargements de sous-ensembles ou via une API REST. Les données fournissent des informations importantes telles que les auteurs, les méthodes, les données et les citations pour permettre aux chercheurs de trouver plus facilement des contributions pertinentes à leurs questions de recherche. Notre package propose 22 fonctionnalités pour les 139 724 références (au 16 avril 2021) et l’accès aux données a été rendu aussi simple que possible afin de s’intégrer efficacement dans presque tous les pipelines de chercheurs (Warin T, “Global Research on Coronaviruses: An R Package”, J Med Internet Res 2020;22(8):e19615, DOI: 10.2196/19615, PMID: 32730218, PMCID: 7423387).
oxfoR Github. oxforR est basé sur l’Oxford COVID-19 Government Response Tracker (OxCGRT) et permet de récupérer leurs dernières données au format R. Le tracker montre les réponses gouvernementales au COVID-19 à travers 17 indicateurs pour tous les pays.
statcanR CRAN Github. Connectez-vous facilement au service de données Web de Statistique Canada avec R. Les données économiques ouvertes (anciennement connues sous le nom de tableaux CANSIM, maintenant identifiées par des ID de produit (PID)) sont accessibles sous forme de bloc de données, directement dans l’environnement R de l’utilisateur.
spiR CRAN Github. En 2015, les 17 Objectifs de Développement Durable des Nations Unies ont été adoptés. «spiR» est une collection de plusieurs ensembles de données ouvertes publiés par le Social Progress Imperative (https://www.socialprogress.org/), y compris le Social Progress Index (une mesure synthétique du développement humain à travers le monde). L’objectif de «spiR» est de fournir des données pour aider les décideurs politiques et les chercheurs à hiérarchiser les actions qui accélèrent le progrès social à travers le monde dans le contexte des objectifs de développement durable. L’indice de progrès social propose une nouvelle perspective sur les défis sociaux et les efforts nécessaires pour accélérer le progrès social conformément aux objectifs de développement durable. Dans ce contexte, l’objectif de ‘spiR’ est de permettre une connexion facile avec R à l’indice de progrès social afin de bénéficier du “pouvoir des foules”. ‘spiR’ est un wrapper R permettant d’accéder facilement aux ensembles de données de l’indice de progrès social.
EpiBibR ExploR ici
statcanR ExploR ici
de Marcellis-Warin, N., Marty, F., Thelison, E., Warin, Th. (2021) “Anti-Trust Index” AI Transparency Institute ici
incluant une plateforme de codage interactive :
Économie industrielle avec R ici
Machine Learning pour le commerce international avec R ici
Pipeline de données avec R ici
Fondements en analyse quantitative pour le commerce international avec R ici
Avec le développement de différents packages de données, j’ai développé plusieurs tutoriels pour collecter des données à partir de ces packages et d’autres API. Consultez mes tutoriels API.