[ImoLUG] Netflix Prize: un problema da 1 milione di dollari

Fabio Fabbri fabio@llgp.org
Mer 28 Maggio 2008 19:22:52 CEST


Vagabondando per internet, ho scoperto il Netflix Prize

http://www.netflixprize.com/

Netflix è il più grande noleggiatore online di DVD, ed ha un sistema di 
rating dei film in cui gli utenti possono dare un voto in "stelle" da 1 a 5.

Nel concorso viene fornito un set di dati con circa 100 milioni di voti 
provenienti da circa 500 mila utenti su 18 mila film. Si deve creare un 
sistema che "preveda" il voto che darebbe un utente di questo campione 
ad uno di questi film, generando circa 3 milioni di stime su cui sarà 
testato il sistema (ovviamente gli organizzatori conoscono i voti che 
sono stati dati realmente su questo set...)

Netflix ha già un sistema, detto "Cinematch", che su quel set di dati ha 
una performance (misurata con la radice dell'errore quadratico medio, 
RMSE) di 0.9525. Chi riesce a sviluppare un sistema con una performance 
migliore del 10% (RMSE 0.8563) si porta a casa il premio di un milione 
di dollari. Inoltre, di anno in anno, viene assegnato un premio di 
50.000$ alla soluzione che raggiunge un traguardo parziale, fissato di 
anno in anno (è partito nel 2006 ed è stato assegnato un premio nel 2007).

Alcuni si stanno avvicinando al traguardo, e non so se sarei all'altezza 
della sfida... Qualcuno ci vuole provare? Appena ho letto l'articolo ho 
pensato a Riccardo Govoni e a BayesFor, magari potrebbe essere pane per 
i loro denti; comunque giro il link per conoscenza alla mailing list...

Fabio Fabbri


Maggiori informazioni sulla lista ImoLUG