Glossaire des termes utilisés dans le secteur du Big data.
Donnée informelle, plus ou moins structurée : soit issue de l'entreprise (mail, document, bases de données, archive, etc.) soit externe (tous les contenus publiés, échangés sur internet, l'open data, les historiques de recherche et navigation, géo-localisés ou non) transmise par les objets connectés (smartphone, ordinateur, thermostats intelligents, pacemakers, etc.).
C'est la publication de données numériques en ligne garantissant leur libre accès et réutilisation par tous, pour le bien commun et dans l'intérêt public et général. Une donnée brute est dite ouverte si elle est diffusée de manière : complète, opportune, accessible, exploitable, non-discriminatoire, non-propriétaire, libre de droits, permanente et gratuite.
L’informatique en nuage est l'accès omniprésent, à la demande et en libre-service, via un réseau de télécommunications, à des ressources informatiques partagées configurables. Il s'agit d'une délocalisation, d'une dématérialisation de l'infrastructure informatique.
Le Web des données favorise la publication de données structurées en les reliant entre elles pour constituer un réseau global d'informations, facilitant la navigation humaine et les échanges entre les sources et machines. S'appuyant sur les standards du Web, cela permet, sans les dupliquer, d'interroger automatiquement des données, quels que soient leurs lieux de stockage.
Via des méthodes et techniques de découverte de schémas d'informations (statistiques, mathématiques et informatique), il permet de détecter des tendances et de proposer des hypothèses, encore inconnues ou cachées, nichées dans les grandes bases de données.
Il recouvre l’utilisation de techniques d’analyses statistiques et quantitatives, de modèles explicatifs et prédictifs pour influencer la prise de décision, revoir et transformer les méthodes d’approche de la création de valeur.
L’analyse de l’apprentissage ou de l'éducation dans le contexte numérique est dédiée à la mesure, la collecte, l'analyse et la production de rapports sur des processus d'apprentissage. Son but est la compréhension et l'amélioration de l'apprentissage et des environnements pédagogiques.
Il utilise des techniques statistiques et des outils informatiques spécialisés afin d'organiser, de synthétiser et de traduire les informations dont les entreprises ont besoin pour faciliter les prises de décision. Souvent, il ne se cantonne qu'à une seule source ).
Il explore et examine les données de multiples sources disparates. Ayant une vision transverse, il est capable de faire parler les données et d'en sortir des indicateurs et des moyens d'application concrets.