Op weg naar herhaalbare wetenschap met Jupyter Notebooks

Programma’s spelen een grote rol in de moderne wetenschap. Experimenten die grote hoeveelheden gegevens opleveren, vereisen meestal uitgebreide programmeeranalyse om inzicht te krijgen. Met name op simulatie gebaseerd onderzoek levert resultaten op die uitsluitend berusten op computerondersteunde gegevensgeneratie en daaropvolgende analyse.

In het geval van publicaties vereist het wetenschappelijke principe van reproduceerbaarheid dat studies en processen worden gedocumenteerd en gearchiveerd op een manier die op een later tijdstip kan worden gerepliceerd – door de oorspronkelijke auteurs en andere geïnteresseerde onderzoekers. Technisch gezien zou dit mogelijk moeten zijn via de stappen die door de software worden beheerd. In de praktijk wordt reproduceerbaarheid echter vaak niet gegeven – om verschillende redenen.

Nu publiceren onderzoekers uit Groot-Brittannië, Frankrijk, Noorwegen en Duitsland – onder leiding van Hans Vanguard van MPSD’s New Computational Science Unit – praktische oplossingen voor deze uitdaging op basis van het OpenDreamKit-onderzoeksproject. Ze bevelen een herhaalbare workflow aan die het gebruik van open source software en de levering van geavanceerde analyse- en simulatiesoftware omvat via gebruiksvriendelijke opdrachtinterfaces op hoog niveau. Hierdoor kunnen de wetenschappers de software voor hun onderzoek besturen met behulp van elektronische notebooks, die elke stap automatisch registreren.

Een van de resultaten van dit open-sourcewerk is de Ubermag-simulatieomgeving van magnetisme op nanoschaal. Simulatiesoftware op laag niveau, die is geoptimaliseerd voor een hoge uitvoeringssnelheid, is moeilijk direct te gebruiken en onderzoekers hebben een Python-interface op hoog niveau ontwikkeld om simulaties gemakkelijker te besturen. Ubermag heeft visualisatiefuncties die onmiddellijke visuele feedback geven over simulatieresultaten en kan op natuurlijke wijze worden geïntegreerd in de Jupyter-notebook. Met deze toolkit kan de simulatiestudie nu worden bestuurd vanuit het notitieboek van Jupyter, dat opmerkingen en opdrachten van onderzoekers combineert om de simulatie uit te voeren, onmiddellijk gevolgd door de verkregen resultaten. Het notitieboekje is zo ontworpen dat het dit multi-formaat, bruikbare document kan opnemen en archiveren – en daarmee de sprong voorwaarts maken voor studiereproductie.

READ  Zijn zwarte gaten echt aan het verdampen? Spectrum van wetenschap

“Om de reproduceerbaarheid in de wetenschap te verbeteren, is het niet voldoende om tools of workflows te bieden die de resultaten beter reproduceerbaar maken. Deze tools moeten ook passen bij de manier waarop onderzoekers werken en idealiter leiden tot een verbeterde onderzoekservaring zodat de nieuwe methoden kunnen worden gebruikt op een algemeen aanvaarde schaal. En omarm het ”, zegt Fangoher.

De kwestie van reproductie is de focus geworden van wetenschappers, onderzoeksgemeenschappen en uitgevers. Fangohr legt uit dat “een bijkomend aspect van de discussie is dat reproduceerbaarheid leidt tot hergebruik”. “Als alle stappen van de data-analyse worden gedocumenteerd en gearchiveerd – idealiter in een (misschien lange!) Computeruitvoerbare tekst – zodat ze automatisch kunnen worden herhaald met een druk op de knop, wordt het uitbreiden van deze studie een stuk eenvoudiger.

“Het is momenteel niet ongebruikelijk dat promovendi maanden of jaren besteden aan het reproduceren van gepubliceerde resultaten als basis voordat ze het werk in stap twee kunnen uitbreiden met nieuwe toevoegingen. Met de hier voorgestelde workflows en methoden kunnen we deze tijd terugbrengen tot uren of minuten. , dus het maakt ons groepsonderzoek efficiënter. “

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *