BLOGBUSINESS SCIENCESAP HANA
Ana Carolina

SAP Hana Cloud databases met Jupyter notebooks

'Data-gedreven' is het buzz-woord als het gaat om de meeste organisatorische besluitvorming van vandaag. Bedrijven zijn voortdurend op zoek naar innovatieve manieren om hun enorme hoeveelheden gegevens te analyseren en inzichten te verkrijgen. Deze blog verkent de oneindige mogelijkheden die worden geboden door het gebruik van open-source taal met SAP Hana Cloud, om gegevens te verkrijgen en samen te werken met bedrijfswetenschap. Namelijk, door integratie van Hana-cloud databases met Jupyter-notebooks.

Vraag het aan een datawetenschapper en zij zullen je vertellen over de definitieve voordelen die deze integratie biedt voor hen en het bedrijf (Figuur 1). U heeft toegang tot gestandaardiseerde gegevens, geavanceerde analyses, real-time en gestroomlijnde gegevens, wat leidt tot betere samenwerking tussen bedrijfsteams, schaalbaarheid en prestaties. Dit is wat de verbeterde kracht van een cloudoplossing (SAP Hana Cloud) volledig geïntegreerd met open-source tools (python-bibliotheken en Jupyter Notebooks) kan leveren.

Figure 1 - Powerful outputs from connecting your Jupyter Notebook to SAP Hana Cloud

De kracht van Jupyter-notebook

We hebben gekozen voor Jupyter Notebooks boven andere omgevingen omdat ze uitblinken in hun interactieve en documentatiecapaciteiten, rijke visualisatieondersteuning, samenwerkingsfuncties en het brede scala aan ondersteunde talen. Ze zijn een duidelijke en krachtige keuze voor datawetenschappers en analisten over de hele wereld. Als SAP-partner met diepgaande expertise helpen we organisaties bij het vinden van de beste oplossingen of maatwerk voor hun systemen. We weten hoe het benutten van open-source tools en samenwerken met SAP-datawetenschappers kan helpen hun reis naar gegevensanalyse te transformeren, een concurrentievoordeel te behalen en aanzienlijke waarde te leveren aan hun klanten.

Beveiligde verbindingen en gegevensverzameling

Hieronder laten we zien hoe u Hana Cloud Databases kunt toepassen in Jupyter Notebooks en machine learning-modellen kunt ontwerpen om inzichtelijke voorspellingen voor uw bedrijf te krijgen. Om inzichten uit Hana Cloud-databases te halen, is het essentieel om verbindingen in een Jupyter-notebook tot stand te brengen (ook vanuit meerdere containers en schema's - GESTANDAARDISEERDE DATA-TOEGANG). Zie Figuur 2, 3, 4 en 5. Door gebruik te maken van de "hana_ml" bibliotheek, kunnen we veilig Jupyter Notebooks verbinden met Hana Cloud en de nodige gegevens verzamelen voor analyse en voorbewerking.

Figure 2 - Reading json configuration file and connect to Hana Cloud

Na deze stappen kunnen gegevens worden verzameld uit Hana Cloud in een Jupyter Notebook.

Figure 3 - Table and schema name to enable collect function from hana_ml library

Figure 4 - Collect data from Hana Cloud

Gestroomlijnde gegevensverzameling en voorbewerking

Na het verbinden met Hana Cloud kunnen we gegevens uit de database verzamelen en Query's en voorbereidingsmethoden uitvoeren. Deze gestroomlijnde aanpak stelt organisaties in staat om geünificeerde platforms te gebruiken voor bedrijfswetenschap, het integreren van ETL-processen en datascience-algoritmen. De uitvoer kan vervolgens naadloos worden geïntegreerd met verschillende front-end tools, waardoor rapporten efficiënt worden gegenereerd en inzichtelijke analyse mogelijk is.

Machine Learning in SAP HANA Cloud

In dit gedeelte demonstreren we hoe machine learning-modellen kunnen worden getraind om een data science-pijplijn op te zetten met behulp van Hana Cloud-tabellen. Onze expertise met deze toepassing gaat echter veel verder dan deze beknopte inzichten, en we zijn toegewijd aan samenwerking met klanten om het beste resultaat te bereiken.

We gebruiken gegevens uit de "T_SALES_ORDER_BIKE_SALES" -tabel. We hebben het geselecteerd uit sales_order_df twee kolommen: CREATEDAT en NETAMOUNT:

Hier stellen we voor om een random forest regressor te gebruiken als ML-model. Een random forest is een meta-estimator die verschillende beslissingsbomen voor classificatie past op verschillende submonsters van de dataset en gemiddelden gebruikt om de voorspellende nauwkeurigheid en controle over overpassen te verbeteren. Om te beginnen, werken we met de sales order-gegevens die we splitsen in trainings- en testdatasets (Figuur 5).

Figure 5 –Split in train and test dataset

Figure 6 – Create and fit the Random Forest Regressor Model

Figure 7 – Make predictions on the test dataset, evaluate the model and analyze the predictions made.

Onze random forest regressor heeft goed getraind, heeft een goede root mean squared error en een goede coëfficiënt van bepaling. Het gebruik van ML en het toepassen daarvan op uw database zou gemakkelijker moeten zijn wanneer je werkt met volledig geïntegreerde tools en kennis. Je zal merken dat er verschillende manieren zijn om ML-modellen te bouwen in Jupyter Notebooks. Wat we hier hebben is een eenvoudig overzicht van enkele van de mogelijkheden en een demonstratie van hoe efficiënt een ML-model kan worden getraind met behulp van de Hana Cloud-verbinding. Ben je geïnteresseerd in meer te weten komen? Neem dan contact met ons op. Hier in het Business Science-team bij McCoy kijken we uit naar het creëren van de best geschikte en eenvoudigste oplossingen voor uw SAP-gegevens.

Kansen en oneindige mogelijkheden

De integratie van Hana Cloud Databases met Jupyter Notebooks opent een scala aan mogelijkheden voor datawetenschappers, analisten en bedrijven. Van naadloze toegang tot gegevens tot geavanceerde analyses, real-time streamanalyse, samenwerkende datascience, interactieve visualisatie en schaalbare prestaties - het revolutioneert de manier waarop datagedreven inzichten worden gegenereerd en stelt organisaties in staat om sneller dan ooit tevoren geïnformeerde beslissingen te nemen.

Omarm het onbegrensde potentieel van Hana Cloud en datascience met Business Science @ McCoy. Ontdek verborgen inzichten, neem slimmere beslissingen en overtreffende trap uw concurrenten. De toekomst van intelligente analyse en een wereld van transformerende mogelijkheden wacht op u.