Au cœur de l’actualité Data depuis sa sortie en mai 2023, Fabric est la plateforme analytique proposée par Microsoft qui permet de gérer la donnée sur l’ensemble de son cycle de vie.
Qu’est-ce que Fabric, la plateforme analytique de Microsoft ?
Microsoft Fabric est la nouvelle plateforme analytique unifiée en mode SaaS annoncée par Microsoft en mai 2023 lors de la conférence Build.
Satya Nadella, CEO de Microsoft a ainsi déclaré que Fabric était « the biggest data product announcement since SQL Server ».
La plateforme permet ainsi de suivre la donnée durant tout son cycle de vie dans un environnement hautement intégré. Ses services couvrent l’ensemble des besoins propres à des projets Data : de l’intégration au reporting en passant par le stockage et la création de modèle de ML.
La solution cible autant les grands comptes habitués aux solutions Microsoft que le secteur des « Small and Medium-sized Business » (SMB). Microsoft Fabric se positionne ainsi comme une alternative aux « Modern Data Stack » en réduisant la complexité de ces architectures et les coûts d’intégration avec une solution de bout-en-bout. La promesse est claire : améliorer le « Time to market » en ayant la possibilité de déployer rapidement une architecture Data complète.
La solution a donc pour objectif d’être utilisée tant par des profils techniques (Data Engineer, Data Scientist, Data Analyst) que métier en se basant sur une interface commune.
Les services proposés par Microsoft Fabric
Microsoft Fabric réunit un certain nombre de solutions Microsoft existantes tels qu’Azure Synapse, Azure Data Factory, Azure Machine Learning et Power BI dans une plateforme unifiée en les enrichissant de nouvelles fonctionnalités. Il s’agit d’une nouvelle expérience d’utilisation de ces services portée par une forte interconnectivité qui marque le passage d’une offre PaaS à SaaS.
Les différents services disponibles sont appelés « expériences » dans le lexique de Fabric. Ces expériences, accessibles depuis une interface commune offrent des fonctionnalités complémentaires qui s’adaptent au profil utilisateur en permettant d’utiliser :
- Des solutions orientés Low-code ;
- Des langages de développement comme Python et Spark.
Pour le stockage des données liées aux différentes expériences, Microsoft Fabric s’appuie sur un socle commun : OneLake.
Source : https://learn.microsoft.com/fr-fr/fabric/onelake/onelake-overview
Voici les différents expériences/services intégrés à Microsoft Fabric :
- Data Engineering : Une plateforme Spark pour la transformation des données à grande échelle en créant des Lakehouses, des pipelines de données ou encore des notebooks Spark ;
- Data Warehouse: Un service pour entreposer des données et interagir avec elles à l’aide du langage SQL ;
- Data Science : Un service offrant la possibilité de créer, entrainer et exécuter des modèles de Machine Learning à travers l’utilisation de notebooks et de Azure Machine Learning ;
- Real Time Analytics: Un service pour interroger et analyser de grands volumes de données en temps réel, utile notamment pour des besoins type IoT ou télémétrie. On y retrouve les bases de données KQL et les event streams pour capturer, transformer et acheminer des événements en temps réel vers diverses destinations ;
- Data Factory: Un service pour de l’intégration de données avec des pipelines qu’il est possible de créer via une interface proche de celle d’Azure Data Factory ou via des Dataflows Power Query ;
- Power BI: La solution de Self-Service BI de Microsoft qui permet la production de rapports et de tableaux de bords afin de faciliter la prise de décision en transformant des données brutes en visuels impactant.
A noter également que l’intégration de Microsoft Copilot dans les outils est un véritable accélérateur aux phases de développement
OneLake : Le OneDrive des données
OneLake est la solution de stockage de Fabric managée par Microsoft avec une approche « lake-centric ». Il s’agit d’un conteneur qui va stocker l’ensemble des données utilisées dans Fabric à la manière d’un OneDrive pour des fichiers.
Un lac de données
Pour chaque tenant Microsoft Fabric, un OneLake est automatiquement fournit. Le service est clé en main et il n’y a donc pas de configuration requise. La collaboration et la gouvernance au sein des organisation sont ainsi facilitées.
A noter que pour fonctionner, le service utilise Azure Data Lake Storage (ADLS) Gen2 afin de stocker les données au format Delta Parquet.
Une seule copie de données
L’objectif est d’éviter le déplacement et la duplication de la donnée pour la centraliser à un seul et unique endroit. Pour cela, Fabric propose l’utilisation des « shortcuts ». Il s’agit de références à des données existantes, des liens qui permettent de pointer vers des données internes ou externes à Fabric.
En utilisant les raccourcis, il est ainsi possible d’éliminer des copies de données et de réduire la latence et les coûts associée aux duplications des données. Par exemple entre plusieurs environnements de développement.
Il est ainsi possible de se connecter à des données historiquement hébergées dans Azure, Dataverse ou encore, dans une approche multi-cloud, sur Amazon Web Services (AWS).
Une interface unique
Pour accéder aux différents services proposés par Microsoft Fabric, une interface unique est proposée. Elle permet de basculer d’une expérience à une autre à la volée.
Source : https://learn.microsoft.com/fr-fr/fabric/fundamentals/microsoft-fabric-overview
L’interface reprend les codes de Power BI Service ce qui est prometteur au vu de son adoption couronnée de succès.
On retrouve ainsi au cœur de l’interface le concept d’espace de travail. Comparables à des dossiers de fichiers et à la base de la gouvernance dans Fabric, les espaces de travail sont des séparateurs logiques qui contiennent les différents objets créés sur la plateforme (Dataflows, Lakehouses, Data Warehouses, Rapports, etc.).
Source : https://learn.microsoft.com/fr-fr/fabric/fundamentals/microsoft-fabric-overview/
Tarification de Microsoft Fabric
La tarification de Microsoft Fabric repose sur deux éléments clés : le stockage et le calcul (compute). En somme, une approche plus simple qui se veut moins coûteuse que du « best-of-breed ».
Le stockage
Les données sont stockées dans OneLake et les coûts associés sont similaires à ceux d’Azure Data Lake Storage (ADLS) Gen2. En résumé, ils dépendent de la volumétrie de données et de la région où sont stockées les données. Par exemple, dans la région France Centre, le coût mensuel est de 0,023€ par Go.
La capacité de calcul
Microsoft Fabric étant une plateforme SaaS, le calcul se fait à l’aide d’instances Serverless et est basé sur le concept de capacité, un ensemble dédié de ressources. Avec un pool de ressources, il est possible d’alimenter l’ensemble des charges de travail Fabric et de s’adapter à des variations via du scaling vertical.
- Capacité Fabric – SKU F : Basé sur un modèle « Pay as you go » sans engagement, la facturation est donc liée à l’utilisation et à la seconde. Il faut se rendre sur Azure pour pouvoir y souscrire.
- Capacité Power BI – SKU P : Egalement appelée Power BI Premium et facturée mensuellement avec un engagement (mensuel ou annuel), cette capacité est disponible à travers un abonnement Microsoft 365.
Les capacités Fabric ont ainsi une correspondance avec les capacités Power BI en proposant des performances similaires :
Source : https://learn.microsoft.com/en-us/fabric/enterprise/licenses#capacity
Remarque :
- Une licence Pro sur Power BI est toujours nécessaire pour créer et partager du contenu ;
- Les capacités Power BI avec des SKU A et EM ne permettent pas d’accéder à Microsoft Fabric.
La certification Microsoft Fabric
Microsoft a sorti le 11/01/2024 l’examen « DP-600 : Implémentation de solutions d’analyse à l’aide de Microsoft Fabric » qui permet de devenir certifié « Fabric Analytics Engineer Associate ».
La certification évalue le niveau des candidats concernant les compétences suivantes :
- Planifier, implémenter et gérer une solution pour l’analytique données (10 à 15 %) ;
- Préparer et servir des données (40 à 45 %) ;
- Implémenter et gérer des modèles sémantiques (20 à 25 %) ;
- Explorer et analyser des données (20 à 25%).
En synthèse, la certification DP-600 est un bon point d’entrée pour découvrir plus en détail la plateforme qui couvre l’ensemble des différentes fonctionnalités offertes : les expériences, le stockage, les modèles d’architectures, etc.
Pour conclure
Microsoft Fabric, la nouvelle solution analytique de bout-en-bout proposée par Microsoft, s’annonce comme un concurrent sérieux aux Modern Data Stack. La plateforme actuelle offre de nouvelles perspectives et une nouvelle approche SaaS dans l’environnement Microsoft.
A savoir si le pari sera gagnant ! Seul le futur nous le dira mais la solution a su attirer l’attention du monde de la Data.
De nombreux sujets connexes à Microsoft Fabric émergent et nous les suivons de près chez Aubay Data & AI :
- Les patterns d’architectures Fabric ;
- L’interaction entre Fabric et les services Azure existants ;
- L’intégration de Microsoft Copilot dans les différentes expériences ;
- Le Direct Lake mode pour connecter Power BI à OneLake ;
- Et bien d’autres !
Si vous souhaitez en savoir plus sur notre offre ou vous faire accompagner, n’hésitez pas à contacter nos équipes Data.
Bibliographie
- Accéder à la plateforme Microsoft Fabric : https://app.fabric.microsoft.com/
- Présentation de Microsoft Fabric : https://learn.microsoft.com/fr-fr/fabric/get-started/microsoft-fabric-overview
- Présentation de OneLake : https://learn.microsoft.com/fr-fr/fabric/onelake/onelake-overview
- Pricing de Microsoft Fabric : https://learn.microsoft.com/en-us/fabric/enterprise/licenses#capacity-and-skus
- Certification Microsoft Fabric : https://learn.microsoft.com/fr-fr/credentials/certifications/exams/dp-600/