Synthèse sur le Big Data

Conclusion :

Pour conclure, nous allons vous présenter en quelques points ce qu’il faut retenir du big data.

Tout d’abord le big data comporte les 3 V : Volume, Variété, Vélocité, ainsi qu’éventuellement le 4e V qu’est la valeur.

L’utilité du big data découle assez logiquement de cette définition : extraire des informations importantes et utiles à partir de ressources énormes, en terme de volume mais aussi de diversité (variété des formats). Le fait de traiter de telles informations peut aider à la prise de décision, améliorer la sécurité ou encore augmenter la connaissance client. Les secteurs qui en tirent un bénéfice sont très variés avec l’augmentation des sources d’informations dans tous les domaines. Globalement les domaines qui ont le plus de bénéfices à tirer du big data sont l’industrie (manipulation de grandes base de données), la distribution (amélioration de la connaissance client), la santé (principalement pour les grandes bases de données), les services financiers (pour la prise de décision) et les télécommunications.

En terme de technologie de stockage, le big data ne repose plus sur le SQL classique mais plutôt sur des technologies émergentes comme le NoSQL, le NewSQL, l’in-memory processing ou les bases de données analytiques. Ceci est principalement dû aux problèmes de taille des bases et de la mauvaise gestion de la scalabilité horizontale et verticale du SQL : il est difficile d’augmenter les performances de calcul ou de rajouter des composants en parallèle au-delà d’une certaine limite avec des bases de données en SQL.  Les bases candidates sont nombreuses (Panorama de ces bases de données).

Pour ce qui est du traitement  le nom à retenir est Hadoop, un framework Java modulaire qui permet de distribuer les opérations de traitement de gros volumes de données via un traitement Map Reduce. Ses concurrents qui semblent sortir du lot sont HPCC, Spark et Storm.

Perspective :

Le big data prend une importance croissante dans notre société et pas uniquement dans le milieu des SI. C’est un terme très à la mode qui regroupe de plus en plus de technologies parfois assez différentes dans leur philosophie mais qui permettent toutes de traiter de gros volumes de données.

Le domaine est en constante évolution et les technologies sont à surveiller et redéfinir en l’absence de standard. Aussi il n’y a pas de formation big data et les technologies maîtrisées demandées par les offres d’emplois en lien avec le big data vont plutôt vers la maîtrise de langages de programmation populaires que des connaissances en gestion de bases de données classique (les compétences demandées pour travailler dans le big data)

Attention toutefois, le big data tel que nous l’avons défini ne s’applique pas à tous les domaines ni à toutes les situations, le terme en revanche est tellement à la mode qu’il faut bien faire attention à ce qu’on lit, quelque chose estampillé big data ne l’est pas forcément…

 

Pour notre rapport, le plan sera le même que la façon dont nous avons organisé nos articles :

  1. Définition du big data
  2. Les apports du big data et son utilisation
    1. Utilité de big data
    2. Les secteurs d’utilisation
  3. Les technologies derrière le big data
    1. Les technologies de stockage de l’information
    2. Les technologies de traitement de l’information

Auteurs : Paul-Yves LUCAS & Yamei SUN

License Creative Commons
Cette œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution 3.0 non transposé.

Leave a Reply

Your email address will not be published. Required fields are marked *

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>