Python is een bredere taal dan R en is bovendien toonaangevend in de data science wereld. Er zijn wat minder analysemogelijkheden dan in R, maar daarentegen kun je met Python beter analyses op grote schaal (big data) uitvoeren of binnen bredere applicaties of websites. Python is aan een indrukwekkende opmars bezig op het gebied van kunstmatige intelligentie/machine learning. Vanuit BI perspectief is Python zeer geschikt voor ophalen, opschonen en wegschrijven van data. Pandas (python library) is heel geschikt voor de data- analyse en manipulatie. Matplotlib wordt gebruikt voor het visualiseren van pandas dataframes. Ook hier geldt dat voor productiedoeleinden (eindgebruikers) eerder gekozen kan worden voor Qlik of Power BI. Jupyter notebook is voor het overzichtelijk en inzichtelijk maken van de analyse.
R is een taal waarin je gespecialiseerde en algemene statistische analyses uitvoert. De enorme database met packages (meer dan tienduizend) zorgt ervoor dat je voor vrijwel iedere analyse perfect terecht kunt in R. De taal is ontwikkeld door academici en statistici en heeft een zeer gedegen basis. Bovendien zijn er goede mogelijkheden binnen R voor het rapporteren en visualiseren van uitkomsten. Dit is alleen lang niet zo compleet en vriendelijk als in Qlik of Power BI. Vaak zie je dat je deze functie gebruikt als je exploratief aan het onderzoeken bent en je het eindresultaat met de business users wil delen op andere platformen zoals Qlik en Power BI.
Naast bovenstaande overeenkomsten zijn er ook verschillen. Het is belangrijk om op de hoogte te zijn van deze verschillen voordat je de keuze maakt voor één van de twee talen.
• R is veel lastiger te leren als je nog geen programmeerkennis hebt. Python code is intuïtief waardoor je ook als leek op het gebied van programmeren snel begrijpt wat er staat in een Python script.
• R wordt gebruikt door academici en binnen R&D afdelingen, Python door ontwikkelaars/ programmeurs
• Python is beter met big data toepassingen dan R
• Python is leidend in machine learning en kunstmatige intelligentie
• Het overgrote deel van data-analyses kan in Python gedaan worden met slechts enkele packages (Numpy, Pandas, Scikit-learn, en Seaborn)
• Python integreert beter in applicaties of websites
• R is echt voor statistische analyses, Python breder toepasbaar. Hierdoor is R vooral geschikt voor zeer specifieke analytische werkzaamheden waar specialistische packages voor ontwikkeld zijn.
• Python code is robuuster en makkelijker te onderhouden dan R code.
• R heeft standaard mooie mogelijkheden om output van analyses te communiceren, in Python is dit minder. Python heeft hier wel een grote inhaalslag gemaakt, waardoor verschillen kleiner zijn geworden.