Team principale di R riceve Premio Rousseeuw a Zurigo; premio di 1 milione di USD
Statistica per tutti: premio milionario per i pionieri dell’open source | l’ETH di Zurigo
Statistica per tutti: premio milionario per i pionieri dell’open source
Il software libero e open source R ha cambiato in modo duraturo la ricerca nel campo della statistica e delle scienze dei dati e continua a influenzarla ancora oggi. Ora i pionieri che lo promuovono da circa 30 anni ricevono il Premio Rousseeuw per la statistica, del valore di un milione di dollari USA: tra i vincitori figura il matematico dell’ETH Martin Mächler.
volume_up Leggi ad alta voce
Il Premio Rousseeuw per la statistica, del valore di un milione di dollari USA, quest’anno viene assegnato al team principale del linguaggio di programmazione statistica R.
Il linguaggio di programmazione open source R è una delle soluzioni software più utilizzate al mondo per la statistica e l’analisi dei dati ed è disponibile gratuitamente.
Tra i pionieri dell’open source premiati figura lo statistico Martin Mächler dell’ETH di Zurigo.
La statistica è una chiave per comprendere la realtà: aiuta studenti e ricercatori, così come aziende o enti pubblici, a valutare quanto siano affidabili i loro risultati e quanto bene riescano a cogliere e spiegare un fenomeno. Chi oggi esegue calcoli statistici al computer utilizza molto spesso il linguaggio di programmazione R. Si tratta di uno dei linguaggi di programmazione più utilizzati al mondo ed è disponibile gratuitamente come software open source.
Fin dai suoi esordi negli anni ‘90, R si è affermato sempre più come linguaggio comune per la statistica e l’analisi dei dati. Inoltre, R è uno dei progetti pionieristici nello sviluppo di software libero e open source. Oggi, oltre al software di base, i ricercatori di tutto il mondo hanno a disposizione online circa 23'000 pacchetti di estensione; di conseguenza, non esiste praticamente alcun ambito di ricerca in cui R non venga utilizzato.
In biologia e medicina, ad esempio, R costituisce la base di Bioconductor, il software utilizzato dai laboratori di tutto il mondo per la ricerca sul DNA o sul cancro. Durante la pandemia di Covid-19, R è servito in molti paesi come strumento per monitorare la diffusione del virus. Inoltre, le aziende farmaceutiche utilizzano R per verificare se un nuovo farmaco sia efficace e sicuro.
Riconoscimento per tre decenni di impegno
Da circa 30 anni, al centro del progetto R opera un team di base responsabile dell’ulteriore sviluppo e della garanzia di qualità del software di base. Fin dall’inizio ha fatto parte del team Martin Mächler, professore emerito presso il Seminario di Statistica dell’ETH di Zurigo. Per il loro impegno pluridecennale e per i loro contributi fondamentali al successo del linguaggio di programmazione statistica R, cinque membri del team centrale di R hanno ricevuto oggi il Premio Rousseeuw per la statistica.
Come il Premio Nobel, anche il Premio Rousseeuw belga è dotato di un premio in denaro di un milione di dollari USA. Viene assegnato ogni due anni dalla Fondazione Re Baldovino ed è finanziato dallo statistico Peter Rousseeuw. Rousseeuw è professore emerito della KU Leuven. Ha mosso i primi passi come ricercatore presso l’ETH di Zurigo e in seguito ha lavorato anche nel settore finanziario.
Da strumento didattico a motore di innovazione nella ricerca
La metà del montepremi, ovvero 500'000 dollari USA, andrà ai cinque pionieri dell’open source che hanno guidato lo sviluppo di R: Oltre a Martin Mächler, professore emerito dell’ETH di Zurigo, si tratta dei professori Brian Ripley dell’Università di Oxford, Kurt Hornik dell’Università di Economia di Vienna, Peter Dalgaard della Copenhagen Business School e Luke Tierney dell’Università dell’Iowa.
L’altra metà del premio in denaro va agli altri membri del R Core Team, tra cui i due inventori di R, Robert Gentleman e Ross Ihaka, che vengono espressamente onorati per il loro contributo determinante. Avevano creato R all’inizio degli anni ’90 per l’insegnamento e la ricerca all’Università di Auckland.
All’epoca chiamarono il loro linguaggio statistico R – sia in riferimento ai loro nomi di battesimo, sia come richiamo al più antico linguaggio di programmazione S degli anni ’70 e ’80, su cui R si basa. Lo stesso S funge oggi soprattutto da base per software moderni come Python, il linguaggio di programmazione per l’apprendimento automatico e l’intelligenza artificiale. Di conseguenza, anche John Chambers, l’inventore di S, figura tra i vincitori del premio.
Martin Mächler è entrato a far parte del team R-Core all’inizio degli anni ’90. Dal 1991 è stato collaboratore scientifico e, dal 2020, professore presso il Dipartimento di Statistica. Lì era responsabile della statistica operativa assistita dal computer e si occupava del collegamento tra analisi dei dati e programmazione. Ha studiato e conseguito il dottorato in statistica presso l’ETH di Zurigo, con un’interfaccia con la matematica numerica.
Questo settore della matematica si occupa di risolvere problemi con l’ausilio dei computer nel modo più preciso e affidabile possibile – ad esempio concependo metodi di calcolo tali da garantire stabilità ed evitare il più possibile errori numerici. «All’ETH di Zurigo ho trovato il lavoro dei miei sogni», afferma Mächler. «Già all’epoca, il seminario di statistica perseguiva la visione secondo cui l’informatica statistica e la programmazione fossero fondamentali per l’analisi dei dati e la moderna ricerca statistica.»
Imposta l’ETH di Zurigo come fonte preferita su Google
Sul motore di ricerca Google è possibile selezionare con un clic quali fonti si desidera visualizzare in via prioritaria. In questo modo si vede più rapidamente ciò che è davvero rilevante per l’utente. Selezionate l’ETH di Zurigo come fonte preferita su Google .
La qualità del software come lavoro di squadra
Mächler ha potuto apportare in modo mirato le proprie conoscenze al team centrale di R. Tra i suoi contributi fondamentali al successo pluriennale del software R vi è stato anche quello di garantire che la precisione numerica degli algoritmi sottostanti fosse aumentata e che, in generale, gli algoritmi funzionassero in modo corretto e stabile anche dopo aggiornamenti o estensioni, fornendo risultati affidabili. Allo stesso tempo, ha sfruttato il suo know-how per garantire che il software rendesse trasparenti i problemi emergenti e che gli utenti ricevessero messaggi di errore comprensibili e utili. Mächler ha inoltre contribuito a rendere R molto popolare oggi quando si tratta di visualizzazione di dati o grafici.
«Ciò che mi rende più felice è che il Premio Rousseeuw riconosca lo sforzo collettivo del nostro team, grazie al quale R è diventato il linguaggio di programmazione leader nell’analisi dei dati», afferma Martin Mächler.
Peter Bühlmann, dal 1997 professore di matematica con specializzazione in statistica computazionale all’ETH di Zurigo e per molti anni superiore di Mächler, aggiunge che R ha consentito enormi progressi nella ricerca, poiché il codice R poteva essere pubblicato contemporaneamente alla pubblicazione dei nuovi metodi: «In questo modo i ricercatori hanno potuto applicare immediatamente i nuovi metodi e confrontarli con quelli altrui.» Ciò ha rinnovato la ricerca: «In quanto primo software libero e aperto per i calcoli statistici, R ha contribuito enormemente alla verifica e alla riproducibilità dei risultati scientifici.»
L’open source e il team principale come fattori di successo
Un contributo particolarmente importante di Mächler è stato il suo impegno a favore dello sviluppo aperto di R. Si è adoperato sin dall’inizio affinché il linguaggio di programmazione fosse pubblicato sotto una licenza libera – la GNU General Public License (GPL) – il che ha motivato anche esperti che la pensavano allo stesso modo, come Kurt Hornik a Vienna, a partecipare al progetto R. Questo modello open source rende liberamente accessibili conoscenze e strumenti: il software può essere utilizzato, modificato e distribuito gratuitamente. Poiché il codice sorgente è pubblico, è inoltre possibile comprendere come funzionano i programmi – il che crea trasparenza e fiducia.
Questa forma organizzativa è stata determinante per il successo di R: il team centrale è responsabile dell’ulteriore sviluppo del software di base e ne garantisce la stabilità. Le estensioni, invece – i cosiddetti pacchetti – vengono sviluppate da una vasta comunità. Prima di essere pubblicati, i pacchetti vengono sottoposti a un processo di verifica standardizzato per garantire che soddisfino i requisiti di qualità definiti. Questa distinzione tra garanzia di qualità centralizzata delle basi e apertura alle estensioni ha contribuito in modo significativo alla diffusione e alla qualità di R.
Per Martin Mächler, la retrospettiva sulla storia di R mette in luce i punti di forza del software open source indipendente: «Lo sviluppo di R ci fornisce un insegnamento sul fatto che, in termini di qualità, l’open source è almeno altrettanto valido del software commerciale per l’analisi dei dati e per gli algoritmi statistici. Tuttavia, il fatto che oggi esistano estensioni software specifiche per quasi ogni ambito specialistico è possibile solo grazie all’open source e alla rete di R, che comprende milioni di utenti. Un’azienda da sola non potrebbe realizzare un progetto come R.»
Peter Bühlmann aggiunge: «Il progetto R è l’iniziativa di software scientifico di maggior successo nella statistica moderna e si basa saldamente sui principi di Open Access, Open Source e riproducibilità.» Lui, che è anche membro del comitato direttivo dell’ETH AI Center, afferma – anche in riferimento agli attuali progetti open source dell’ETH di Zurigo (ETH) e del Politecnico federale di Losanna (EPFL) nel campo dell’intelligenza artificiale: «L’open source è un’ottima strategia per le scuole universitarie, perché consente loro di attingere a risorse numerose e distribuite. Allo stesso tempo, possono assumersi la propria responsabilità nella valutazione indipendente delle nuove tecnologie e contribuire allo sviluppo aperto e alla garanzia della qualità di tecnologie nuove e innovative.»
Il premio verrà consegnato il 4 novembre 2026 a Lovanio, alla presenza del re del Belgio.
pagina esterna Il Premio Rousseeuw per la statistica
pagina esterna The R Project for Statistical Computing
2026 di Florian Meyer, Comunicazione