[ImoLUG] Netflix Prize: un problema da 1 milione di dollari
Fabio Fabbri
fabio@llgp.org
Mer 28 Maggio 2008 19:22:52 CEST
Vagabondando per internet, ho scoperto il Netflix Prize
http://www.netflixprize.com/
Netflix è il più grande noleggiatore online di DVD, ed ha un sistema di
rating dei film in cui gli utenti possono dare un voto in "stelle" da 1 a 5.
Nel concorso viene fornito un set di dati con circa 100 milioni di voti
provenienti da circa 500 mila utenti su 18 mila film. Si deve creare un
sistema che "preveda" il voto che darebbe un utente di questo campione
ad uno di questi film, generando circa 3 milioni di stime su cui sarà
testato il sistema (ovviamente gli organizzatori conoscono i voti che
sono stati dati realmente su questo set...)
Netflix ha già un sistema, detto "Cinematch", che su quel set di dati ha
una performance (misurata con la radice dell'errore quadratico medio,
RMSE) di 0.9525. Chi riesce a sviluppare un sistema con una performance
migliore del 10% (RMSE 0.8563) si porta a casa il premio di un milione
di dollari. Inoltre, di anno in anno, viene assegnato un premio di
50.000$ alla soluzione che raggiunge un traguardo parziale, fissato di
anno in anno (è partito nel 2006 ed è stato assegnato un premio nel 2007).
Alcuni si stanno avvicinando al traguardo, e non so se sarei all'altezza
della sfida... Qualcuno ci vuole provare? Appena ho letto l'articolo ho
pensato a Riccardo Govoni e a BayesFor, magari potrebbe essere pane per
i loro denti; comunque giro il link per conoscenza alla mailing list...
Fabio Fabbri
Maggiori informazioni sulla lista
ImoLUG