Rechercher
Fermer ce champ de recherche.

Mise à jour : 

16/12/2024

Votre entreprise doit-elle adopter Hadoop ?

Sommaire

 

Les solutions Big Data font fureur, du moins dans les médias. Il y a des tas d’informations à ce sujet, des tonnes de presse et de messages marketing qui réclament des analyses. 

 

La question est la suivante : de quel type d’analyse votre client a-t-il besoin ? Intelligence commerciale de base ? Gestion des performances opérationnelles en temps réel ? Des analyses sur les données de vente, les opérations, le service client…. marketing ? Quel est le problème et comment pouvez-vous le résoudre en fonction des priorités de l’entreprise ? Ce qui est important pour l’entreprise… et quelle solution peut l’aider à atteindre ses objectifs numéro 1, 2 et 3. J’ai fait part de cette question à mon responsable des ventes d’analyses, et voici sa réponse : il y a un aphorisme qui existe depuis un certain temps mais qui s’applique vraiment ici. Il se lit comme suit : « L’avenir est déjà là ! Il est juste inégalement réparti. 

 

Nous avons tous une tendance naturelle à fuir les choses qui sont nouvelles, différentes ou peu familières. Mais considérez qu’Hadoop a été créé dans un but précis. Compte tenu de l’explosion exponentielle de la quantité de données, les bases de données relationnelles traditionnelles ont été poussées à leur limite. Aucune quantité de partitionnement, de sharding, d’indexation, de techniques en mémoire ne peut résoudre ce problème. (Comme Scotty l’a dit au capitaine Kirk dans de nombreux épisodes de Star Trek : Capitaine, je ne peux pas changer les lois de la physique). Même les bases de données en colonnes, bien que dans de nombreux cas plus rapides que les bases de données relationnelles, ont encore du mal à répondre aux besoins en ressources informatiques. C’est là qu’intervient Hadoop. Il est de notoriété publique qu’il peut stocker de nombreuses données et les traiter également. Mais considérez quelques points saillants de l’architecture HDFS :

 

Nous assistons au début d’une nouvelle ère dans la modélisation des données. En effet, de vastes volumes de données volatiles peuvent désormais être stockés à faible coût et accessibles rapidement via le calcul distribué (10 personnes peignant la pièce en une heure plutôt qu’une seule personne peignant la pièce en 10 heures). L’absence de métadonnées permet aux analystes de modéliser les données de manière dynamique/à la volée en utilisant un paradigme ELT plutôt que le modèle ETL traditionnel et très laborieux dans lequel un entrepôt de données est construit par de nombreuses itérations de différentes configurations de métadonnées par essais et erreurs.

 

Tout cela permet des analyses beaucoup plus longitudinales, car le stockage de 10 ans de données au lieu de 3 ne pose aucun problème.

Les cas d’utilisation abondent – oubliez la recherche d’une aiguille dans une botte de foin – avec l’apprentissage automatique, vous pouvez trouver des aiguilles dans les bottes de foin.

La capacité à faire apparaître des tendances et des modèles inobservables par les humains signifie que la profondeur de la perspicacité analytique s’améliore d’un ordre de grandeur.

Facebook
Twitter
LinkedIn
Image de Léo Paulson
Léo Paulson

Passionné par l'art de vivre au masculin, Léo Paulson explore avec finesse les domaines de la mode, des technologies, et du bien-être. En tant qu'expert en style, il partage des conseils pratiques sur la mode et les montres, tout en s'intéressant aux dernières tendances automobiles et moto. Léo aborde également la santé, les loisirs, et la cuisine, offrant des recommandations pour une vie équilibrée et dynamique. Que vous soyez passionné de tech, de beauté, ou d'animaux, Léo vous guide avec son expertise pour améliorer votre quotidien avec élégance et simplicité.