La donnée est devenue un élément essentiel de notre monde contemporain. Elle influence les décisions, les stratégies et même les interactions au sein des entreprises. Cet article vise à expliquer ce qu’est la donnée, en détaillant ses caractéristiques, ses types et ses structures.
Mais qu’est-ce que la donnée ?
- Ce matin, il fait 5°, c’est une donnée. Il est possible de débattre de la mesure de la température (capteur, emplacement, temps, etc.). Cependant, si cela est écarté, le fait qu’il fasse 5° est une donnée brute, un fait.
- S’il fait 5° dehors, alors je dis qu’il fait froid. La donnée n’est plus brute, elle est mise dans un contexte. Elle est interprétée. Cette contextualisation informe la personne qui en a connaissance. La donnée est devenue de l’information. La contextualisation introduit de la subjectivité. En effet, pour certaines personnes, lorsqu’il fait 5°, il ne fait pas froid.
- Si c’est froid, alors je pourrais tomber malade. L’information a été filtrée à travers mon expérience. L’information a été comprise et assimilée. Elle devient connaissance. La connaissance peut être explicite (facile à transmettre car elle peut être formalisée) et connaissance tacite (plus difficile à transmettre car elle ne peut pas être formalisée).
- Si je peux attraper un rhume, alors je vais porter un pull. Je me comporte intelligemment par rapport à ma connaissance. C’est ça l’intelligence. J’ai interprété les données que j’avais, je les ai comparées à ma connaissance pour tirer une conclusion intelligente.
En conséquence, il n’y a pas de relation directe entre l’accumulation de données et la prise de décision intelligente :
- L’accumulation de données peut même empêcher la prise de décision par peur de prendre un risque.
- Il est également possible de prendre des décisions hâtives sans prendre en compte toutes les données.
La donnée est omniprésente
Les données peuvent revêtir de nombreuses formes, comme l’âge d’une personne, la couleur de ses yeux, le nombre de voitures dans un parking ou encore la densité du trafic sur une autoroute. Chaque exemple illustre comment la donnée est omniprésente et peut avoir un impact significatif sur nos décisions quotidiennes, en particulier dans le cadre des entreprises où des décisions éclairées reposent sur des données précises.
Les caractéristiques principales de la donnée
Les données ont 5 caractéristiques principales.
Les sources et la propriété de la donnée
Les entreprises génèrent et collectent leurs propres données internes au cours de leurs opérations quotidiennes.
Par exemple, une entreprise de vente au détail recueille des données sur ses ventes dans ses magasins physiques ou sur le comportement de ses clients sur son site web.
De plus, des partenaires externes peuvent fournir des données qu’ils détiennent, créant ainsi un ensemble riche et varié de données disponibles pour l’analyse.
Les types de données
Les données utilisées dans le big data se divisent principalement en deux catégories : les données qualitatives et quantitatives.
- Les données qualitatives incluent des informations non numériques, telles que des transcriptions d’entretiens ou des notes de terrain en anthropologie. Par exemple, les notes d’une réunion de recrutement peuvent offrir un aperçu précieux des candidats.
- Les données quantitatives sont des informations sous forme numérique, comme la date de naissance ou le salaire d’un employé, qui sont facilement mesurables et analysables.
Les niveaux de structuration des données
Les données peuvent être classées en deux niveaux de structure : structurées et non structurées.
- Les données structurées sont hautement organisées et facilement accessibles dans des bases de données relationnelles. Par exemple, les systèmes de gestion des ressources humaines (SGRH) utilisent des bases de données pour stocker des informations sur les employés, telles que leur nom, leur date d’embauche et leur poste.
- La majorité des données générées aujourd’hui sont non structurées et ne possèdent pas de format prédéfini, ce qui rend leur traitement plus complexe. Par exemple, les commentaires des employés sur des plateformes internes de feedback peuvent être non structurés et nécessitent une analyse qualitative pour en tirer des insights. Organiser et formater ces données non structurées est essentiel pour les rendre exploitables.
Les natures de données
Les données peuvent être classées en deux natures : référentielles et transactionnelles.
- Les données référentielles (ou données de référence) sont des informations qui servent de contexte et de structure pour d’autres données. Elles sont souvent statiques et permettent de décrire des entités, des catégories, des types ou des classifications dans un système d’information. Ces données ne changent pas fréquemment et sont utilisées pour valider ou enrichir d’autres données. Par exemple:
- Dictionnaires de données : Informations sur les champs d’une base de données, telles que le type de données (texte, numérique) et les contraintes (longueur maximale, valeurs autorisées).
- Listes de codes : Codes de départements, types de produits ou catégories de clients dans un système de gestion des ressources humaines ou de gestion des ventes.
- Tables de référence : Une table contenant des informations sur les pays, y compris leur code ISO, leur nom, et leur capitale.
- Les données transactionnelles sont des informations qui enregistrent les activités ou les transactions qui se produisent dans une organisation. Elles sont souvent générées par des actions spécifiques et sont généralement dynamiques, changeant fréquemment en fonction des opérations commerciales. Ces données sont utilisées pour les analyses opérationnelles, les rapports et le suivi des performances. Par exemple:
- Ventes : Enregistrements des ventes réalisées, incluant le montant, le produit, la date, le client et le mode de paiement.
- Commandes : Informations sur les commandes passées, comprenant les produits commandés, les quantités, les dates de commande et les statuts de livraison.
- Interactions clients : Données sur les interactions des clients avec une entreprise, comme les tickets de support, les avis de produits ou les retours.
Les données référentielles et les données transactionnelles ont 3 différences clés :
- Nature : Les données référentielles sont généralement statiques et descriptives, tandis que les données transactionnelles sont dynamiques et enregistrent des événements ou des activités.
- Usage : Les données référentielles fournissent le contexte pour l’analyse des données, tandis que les données transactionnelles sont utilisées pour l’exécution des opérations commerciales et le suivi des performances.
- Fréquence de changement : Les données référentielles changent rarement, tandis que les données transactionnelles sont mises à jour fréquemment à mesure que des transactions se produisent.
Données consolidées vs données individuelles
Il est également essentiel de différencier les données consolidées des données individuelles.
- Les données consolidées sont souvent collectées pour des raisons légales.
- Les données individuelles sont recueillies tout au long du parcours d’un client ou d’un employé.
Par exemple, une entreprise peut utiliser des données consolidées pour des rapports réglementaires, tandis que les données individuelles peuvent être utilisées pour personnaliser les expériences des employés lors des évaluations de performance.
N’hésitez pas à parcourir nos contenus pour continuer à nourrir votre curiosité et votre savoir.
