[FoLUG] lemmi (un po' OT)

Marco Baroni baroni@sslmit.unibo.it
Mer 13 Ott 2004 09:52:17 CEST


Ciao a tutti.

Un collega e io stiamo finendo un lemmario elettronico dell'italiano.

Un lemmario e' una lunga lista di forme flesse con lemma e tratti 
morfologici (centinaia di migliaia di forme). Per esempio:

cantano	cantare	VER:ind+pres+3+p
cantavo	cantare	VER:ind+imp+1+s
melanzana	melanzana	NOM:f+s
melanzane	melanzana	NOM:f+p
...

Una risorsa di questo genere e' utile in varie applicazioni di natural 
language processing (per esempio, traduzione automatica, estrazione 
automatica di keywords, eccetera). Per quello che ne sappiamo, i 
lemmari esistenti per l'italiano sono tutti chiusi/commerciali.

Avrei due domande:

1) Vogliamo rendere il lemmario disponibile usando una licenza tipo 
GPL. Tuttavia, il lemmario non e' ne' un programma (anche se verra' 
sempre utilizzato all'interno di programmi), ne' un documento nel senso 
in cui, non so, un romanzo e' un documento... Che licenza dobbiamo 
usare? Esiste una licenza per le ``risorse'' o qualcosa del genere?

2) Che voi sappiate, a progetti liberi tipo OO, ispell e simili 
potrebbe interessare il nostro lemmario, con le dovute modifiche? In 
tal caso, avete suggerimenti su chi contattare?

Molte grazie.

Saluti,

Marco


---
Marco Baroni
University of Bologna
http://sslmit.unibo.it/~baroni



Maggiori informazioni sulla lista FoLUG