BDaaS : en quoi ça consiste ?

6 min
43
0
0
Publié le

Après les SaaS, IaaS et PaaS (pour respectivement service, infrastructure et plateforme en tant que service), un nouvel acronyme fait de plus en plus parler de lui dans le domaine IT. Il s’agit du BDaaS pour Big Data As A Service. Cette forme de cloud computing fonctionne comme les SaaS et le IaaS, à la différence qu’ici ce sont des plateformes et outils de données qui sont fournis par les prestataires de cloud. L’objectif est de permettre aux organisations de traiter, administrer et analyser de grands volumes de données sans encombrer leur système informatique et leurs ressources organisationnelles. Les entreprises peuvent ainsi utiliser des compétences informatiques tierces plutôt que de déployer des systèmes sur site. Le BDaaS peut même devenir un avantage concurrentiel s’il est bien compris et exploité. Découvrez dans cet article comment fonctionne concrètement le BDaaS et quels sont ses atouts.

 

Comment fonctionne le Big Data as a service ?

Les composants principaux des offres BDaaS

 

Le Big Data en tant que service se matérialise sous la forme de logiciels et systèmes dédiés dans le cloud ou dans un service hébergé, géré et exploité par un fournisseur de cloud.

Le marché du BDaaS est aujourd’hui dominé par 3 prestataires principaux :

●      Amazon avec EMR d’Amazon Web Services (AWS) ;

●      Google Cloud avec son offre Dataproc ;

●      Azure HDInsight de Microsoft.

 

Bien que les offres de ces 3 prestataires soient quelque peu différentes, on y retrouve généralement :

●      le framework pour la conception d’applications distribuées Hadoop ;

●      le framework Tez pour la création de programmes de traitement de données interactifs ;

●      HBase, la base de données complémentaire d’Hadoop ;

●      le logiciel d’ordonnancement et de planification de flux de travail Oozie ;

●      le moteur de traitement Apache Spark ;

●      Apache Hive ou Presto, l’infrastructure d’entrepôt de données et le moteur de requête SQL ;

●      des outils d’analyse comme Jupyter Notebook, Zeppelin ou Pig ;

●      des langages de programmation notamment Python, R et Scala.

 

 

Les données des BDaaS sont le plus souvent stockées dans le système de fichiers distribué Hadoop (HDFS) ou dans les services de stockage d’objets cloud tels que Amazon Simple Storage Service, Azure Blob et Google Cloud Storage. Enfin, les plateformes BDaaS peuvent également se connecter à des environnements d’entrepôt de données cloud comme Azure Data Lake Storage, Iceberg, Delta Lake, et Snowflake.

 

Les cas d’utilisation du Big Data as a service

 

Le BDaaS offre différents types d’analyse de données aux entreprises. Il peut s’agir tout aussi bien d’études scientifiques que commerciales et marketing. Par exemple, une organisation peut l’utiliser pour mesurer les retombées d’une campagne de référencement.

Les professionnels de l’It ont également recours aux BDaaS pour :

●      le POC (Proof Of Concept) : le BDaaS permet de valider la faisabilité d’un projet en le testant avec des infrastructures bien dimensionnées et sans investissements matériels coûteux ;

●      l’analyse prédictive qui permet d’exploiter et interpréter les Big Data afin de comprendre les marchés et d’adapter les axes stratégiques ;

●      la gestion de pics de charge : les organisations peuvent utiliser des clusters temporaires pour les montées en charge puis les supprimer ensuite sans avoir besoin de modifier leur SI interne ;

●      le plan de reprise d’activité (PRA) : les entreprises peuvent synchroniser d’importants volumes de données vers les plateformes BDaaS afin de pouvoir y accéder et redémarrer rapidement leur activité en cas d’incident interne.

 

La liste est bien entendu non exhaustive, car les possibilités offertes par le Big Data As A Service sont nombreuses. Diverses entreprises, même en dehors du secteur IT, l’utilisent régulièrement dans leurs activités. Cette solution comporte en effet des avantages majeurs par rapport à des investissements en infrastructures et stockages en interne.

 

Les avantages du BDaaS

Une réduction des coûts

L’argument financier est généralement le premier mis en avant pour le BDaaS et les autres solutions « accessibles en tant que service ».

En effet, le stockage et l’analyse de données ne se limitent pas à l’achat (souvent déjà onéreux) de serveurs. La maintenance (des logiciels et du matériel), la sécurité physique (création de pièces sécurisées, ventilées, etc.) et applicative avec notamment la prévention contre les cyberattaques et vulnérabilités internes doivent également être prises en compte. Enfin, il faut aussi intégrer le coût des licences logicielles.

 

Avec le BDaaS c’est le prestataire de cloud qui prend en charge tout la partie infrastructure, et maintenance pour ces serveurs. Les tarifs d’accès des solutions hébergées représentent

à peine une fraction du coût de ceux des logiciels installés localement. De plus, les entreprises ne payent généralement que le temps d’utilisation ou le volume d’espace de stockage exploité.

 

 

Plus de sécurité

 

Les fournisseurs de BDaaS et plus généralement d’offres cloud font l’objet d’examen et d’inspection approfondie en ce qui concerne la sécurité des données. Ils doivent également se conformer à des normes et standards stricts. Bien entendu, il ne s’agit pas pour autant de déléguer toute la responsabilité de sa cybersécurité à un prestataire de cloud computing.

 

Le BDaaS doit s’intégrer à la politique de sécurité interne de l’entreprise avec notamment :

●      le choix d’un fournisseur de cloud sécurisé ;

●      les contrôles d’accès et d’autorisations aux plateformes BDaaS ;

●      le monitoring du réseau pour surveiller les accès et les autorisations.

 

En revanche, le recours au BDaaS permet de réduire les charges et souvent les ressources humaines liées à la maintenance sécuritaire. C’est le fournisseur de cloud qui effectue les mises à jour de sécurité de ses serveurs et logiciels.

 

Une meilleure disponibilité des données le BDaaS

 

Prenons l’exemple d’une organisation qui stocke ses données sur un serveur interne. Que se passe-t-il en cas de panne du matériel ou d’attaques ? À moins qu'elle n’ait investi dans une sauvegarde hors site ou dans une matrice redondante de disques indépendants (RAID), toutes les données et applications basées sur le serveur sont indisponibles pour une durée indéterminée.

 

Les fournisseurs de cloud et de BDaaS intègrent de base la redondance dans leurs offres. Les données ne sont donc pas stockées sur un seul serveur, mais répliquées sur plusieurs machines qui sont, sauf rares cas, dans plusieurs endroits d’un data center voire dans des centres de données répartis à travers le monde. Cette duplication permet aussi de servir les données stockées au plus près des utilisateurs pour limiter les temps de latence. La plupart des fournisseurs garantissent ainsi une disponibilité de 99,99 %.

 

 

 

Le BDaaS répond donc à de nombreux besoins des entreprises, quel que soit leur domaine d’activité. Ses avantages en font une solution de plus en plus présente dans le milieu professionnel. Les emplois et missions d’architecte Big Data, d’expert Big Data ou encore de cloud devops big data se multiplient.

Et vous en tant que professionnel de l’IT, avez-vous déjà travaillé avec des environnements BDaaS ? Partagez-nous vos témoignages dans le forum.

 

 

Source et liens utiles :

 

Boostez votre carrière

Les meilleures offres d’emploi sont chez Free-Work

Notre CVthèque est la première source de recherche de talents pour + 1 000 entreprises. Déposez votre CV et postulez en un clic !

Continuez votre lecture autour des sujets :
# Trend
# Cloud

Commentaire

Dans la même catégorie