[FoLUG] lemmi (un po' OT)
Marco Baroni
baroni@sslmit.unibo.it
Mer 13 Ott 2004 09:52:17 CEST
Ciao a tutti.
Un collega e io stiamo finendo un lemmario elettronico dell'italiano.
Un lemmario e' una lunga lista di forme flesse con lemma e tratti
morfologici (centinaia di migliaia di forme). Per esempio:
cantano cantare VER:ind+pres+3+p
cantavo cantare VER:ind+imp+1+s
melanzana melanzana NOM:f+s
melanzane melanzana NOM:f+p
...
Una risorsa di questo genere e' utile in varie applicazioni di natural
language processing (per esempio, traduzione automatica, estrazione
automatica di keywords, eccetera). Per quello che ne sappiamo, i
lemmari esistenti per l'italiano sono tutti chiusi/commerciali.
Avrei due domande:
1) Vogliamo rendere il lemmario disponibile usando una licenza tipo
GPL. Tuttavia, il lemmario non e' ne' un programma (anche se verra'
sempre utilizzato all'interno di programmi), ne' un documento nel senso
in cui, non so, un romanzo e' un documento... Che licenza dobbiamo
usare? Esiste una licenza per le ``risorse'' o qualcosa del genere?
2) Che voi sappiate, a progetti liberi tipo OO, ispell e simili
potrebbe interessare il nostro lemmario, con le dovute modifiche? In
tal caso, avete suggerimenti su chi contattare?
Molte grazie.
Saluti,
Marco
---
Marco Baroni
University of Bologna
http://sslmit.unibo.it/~baroni
Maggiori informazioni sulla lista
FoLUG