• Solutions
  • Services
  • Sectors
  • Sharing
  • Over ons

Hoe SAP Datasphere en SAP Databricks elkaar versterken

“Weg met silo’s bouw de brug tussen SAP en Microsoft” Dat was de kernboodschap in onze eerdere blog over de koppeling tussen SAP-systemen en Microsoft-tools zoals Power BI en Microsoft Fabric.

Diezelfde denkwijze geldt nu binnen SAP zelf. Met de introductie van SAP Business Data Cloud maken zowel Datasphere als Databricks deel uit van één platform. Maar hoe verhouden die tools zich tot elkaar? Zijn het concurrerende oplossingen, of juist puzzelstukken in een groter geheel

In deze blog leggen we uit wat dit betekent in de praktijk. Moet je kiezen? Of kunnen beide tools een rol spelen in jouw data-architectuur? 

Wat is SAP Business Data Cloud?

SAP Business Data Cloud is een gedeeld dataplatform. Het brengt vertrouwde SAP-data samen met nieuwe tools voor data science en analytics. De kern van het platform bestaat uit:

  • Een centrale object store waarin data wordt opgeslagen in een open formaat (Delta Lake)

  • Een gedeelde datacatalogus met metadata en toegangsbeheer

  • SAP Datasphere voor modellering en businesslogica

  • SAP Databricks voor werken met data op schaal via Python, SQL, Spark en R

Het belangrijkste principe: beide tools gebruiken dezelfde data, dezelfde beveiliging en dezelfde context.

Wat is het verschil tussen SAP Datasphere en SAP Databricks?

SAP Datasphere en SAP Databricks zijn ontwikkeld voor verschillende gebruikersprofielen en use cases binnen SAP Business Data Cloud. SAP Datasphere richt zich op businessmodellering, semantiek en datagovernance. Het wordt meestal gebruikt door SAP BI-consultants en data stewards die werken met SQL en visuele modelleertools zoals SAP Analytics Cloud. De kracht van Datasphere ligt in het toevoegen van zakelijke betekenis aan data: het toepassen van beveiligingsregels, het definiëren van dimensies, valuta, hiërarchieën en het geschikt maken van data voor enterprise reporting. Met andere woorden: het transformeert ruwe data naar betrouwbare, goed interpreteerbare informatie voor rapportage en planning.

SAP Databricks daarentegen is bedoeld voor meer technische gebruikers, waaronder data-analisten, data engineers en machine learning engineers. Het biedt een code-first omgeving waarin gewerkt wordt met Python, Spark-notebooks en SQL voor grootschalige transformaties, data science en machine learning. De kracht van het platform ligt in flexibiliteit, schaalbaarheid en verwerkingscapaciteit. Gebruikers kunnen eenvoudig SAP- en non-SAP-databronnen integreren, gebruikmaken van serverless compute voor efficiënt resourcemanagement en bewerkte data terugschrijven naar een object store voor verder gebruik. Dit maakt het platform bijzonder geschikt voor het draaien van voorspellende modellen en het bouwen van AI-toepassingen op geïntegreerde enterprisedata.

SAP Datasphere en SAP Databricks vervullen verschillende maar zijn verbonden binnen SAP Business Data Cloud. Datasphere zorgt voor structuur, zakelijke context en governance door businesslogica toe te passen, dimensies, valuta en hiërarchieën te definiëren en toegangsregels op bedrijfsniveau af te dwingen. Databricks bouwt voort op deze basis met grootschalige verwerking, integratie van externe data, modeltraining en flexibele toegangscontrole via Unity Catalog.

Zijn het concurrenten?

Sommige mensen denken van wel. Beide tools bieden mogelijkheden voor datatransformatie en catalogusfuncties. Daarnaast werken teams vaak met verschillende voorkeuren: de één met SAP-tools, de ander met Python en Spark.

Maar binnen SAP Business Data Cloud zijn de tools juist verbonden. De data staat op één centrale plek. Je kunt deze modelleren in SAP Datasphere en gebruiken in SAP Databricks zonder kopieën te maken. Ook kunnen inzichten vanuit Databricks terug gedeeld worden binnen hetzelfde platform.

Kortom: de tools hebben verschillende doelen, maar beconcurreren elkaar niet. Ze kunnen juist onderdeel zijn van één geïntegreerde workflow.

Hoe werken ze samen?

Gedeelde datalaag

Dataproducten die in SAP Datasphere worden gebouwd, worden opgeslagen als Delta-bestanden in de SAP object store. SAP Databricks kan deze bestanden direct uitlezen. Dit voorkomt complexe extract-transform-load-processen (ETL). De toegang is snel en veilig.

Gedeelde governance

SAP Datasphere definieert de semantiek van de data, zoals valuta, eenheden en zakelijke hiërarchieën. Ook bepaalt het wie welke data mag zien. Deze logica wordt hergebruikt in Databricks.

Verschillende rollen, dezelfde data

Een financieel dataproduct kan in SAP Datasphere worden gemaakt en vervolgens op verschillende manieren worden gebruikt:

  • Voor dashboards in SAP Analytics Cloud

  • Voor voorspellende modellen in SAP Databricks

Wat betekent dit voor jouw data-architectuur?

SAP Datasphere is dé omgeving wanneer je behoefte hebt aan gestructureerde, beheerde en betrouwbare data voor rapportages, dashboards en enterprise-brede analytics. Het zorgt ervoor dat je data semantisch klopt, voldoet aan regelgeving en verrijkt is met businesslogica, zodat businessgebruikers deze op een consistente manier kunnen gebruiken.

SAP Databricks gebruik je wanneer je een stap verder wilt gaan: het combineren van SAP-data met non-SAP bronnen, het bouwen van geavanceerde analytics-pijplijnen, het trainen van machine learning-modellen of het uitvoeren van schaalbare datatransformaties.

Je hoeft niet te kiezen tussen de twee. Sterker nog: de beste resultaten ontstaan wanneer teams beide omgevingen begrijpen, en businessmodellering en semantiek combineren met flexibele, technische data-engineering.

Onze kijk erop

SAP heeft beide tools niet voor niets onderdeel gemaakt van één platform. Elke tool heeft een eigen rol, maar samen vormen ze een krachtigere oplossing. Gebruik SAP Datasphere om structuur en controle aan te brengen. Gebruik SAP Databricks om op te schalen en te experimenteren.

Je hoeft niet groots te beginnen. Start met één use case. Bouw een dataproduct in Datasphere en verken het verder in SAP Databricks. Leer wat werkt. En breid dan verder uit.

Hoe begin je met SAP Databricks?

SAP Databricks is op dit moment alleen beschikbaar via controlled availability. De brede uitrol wordt verwacht in 2025. Wil je de mogelijkheden alvast verkennen? Dan moet je SAP Datasphere-omgeving worden omgezet naar een SAP Business Data Cloud-tenant. Deze herconfiguratie wordt door SAP uitgevoerd als onderdeel van hun standaard migratiepad.

Begin klein. Start met één use case. Bouw een dataproduct in SAP Datasphere en verken het vervolgens in SAP Databricks. Gebruik deze ervaring om te leren wat goed werkt in jouw omgeving. Breid daarna uit naarmate de behoefte groeit en het team vertrouwd raakt met beide tools.

Wat kun je nu al doen?

Ben je benieuwd of SAP Databricks past binnen jouw landschap? Of wil je meer waarde halen uit SAP Datasphere? Neem contact met ons op voor een no-nonsense data assessment. We helpen je graag om de mogelijkheden te verkennen voordat je investeert.

Ben jij al een Friend of McCoy?

Als innovatiepartner willen wij graag blijven inspireren. Daarom delen wij graag onze meest relevante content, evenementen, webinars en andere waardevolle updates met jou.