[ImoLUG] Call for Papers : 3 proposte

Mer 19 Set 2007 00:26:49 CEST

ciao a tutti,
vi presento le mie proposte per il call for papers di fine ottobre /
inizio novembre.
Come ho gia' anticipato a Valerio in chat, gli spunti che propongo
sono 3 ma a) potrei non avere il tempo materiale di realizzarli e b)
almeno uno dei 3 deriva da un progetto di ricerca per il quale non
posso essere certo di arrivare a fine ottobre con risultati
presentabili.
Per cui, se le ritenete interessanti, vi chiedo di ordinarle per
preferenza in modo da sapere su cosa concentrarmi.
Ovviamente senza voler rubare spazio a nessuno, non pretendo di
presentare tutte e 3 le idee.

1) Quando un'immagine vale piu' di mille parole
Target audience : Sviluppatori, appassionati di programmazione

Abstract: i progetti software e gli ambienti di runtime con cui ci
confrontiamo quotidianamente hanno ormai una complessita' media che
rende complicata la percezione delle loro relazioni di insieme: e' la
norma avere a che fare con pacchetti software composti da centinaia di
classi e/o soluzioni di rete che coinvolgono decine di nodi
intercomunicanti. Allo stesso modo, il volume dei dati accumulati su
tali sistemi richiede sempre piu' l'utilzzo di tecniche di data mining
e information retrieval per poter aggregare i dati in forma
'comprensibile' . In tutti i casi citati e' spesso conveniente farsi
un'idea preliminare del problema da affrontare. In questo caso sono
spesso comodi dei 'quick & dirty hacks' che ci permettano di ottenere
tale idea senza spendere troppo tempo. Nello speech verranno
presentate alcuni casi d'uso tipici e mostrato come un linguaggio di
scripting ( ruby ) e una libreria opensource ( graphviz ,
http://www.graphviz.org ) possono venire in aiuto a tale scopo.
Esempi :
- diagramma delle interdipendenze di un sistema a componenti : Eclipse
- visualizzazione grafica dei flussi di navigazione degli utenti a
partire dall'analisi dei log di un webservice
- analisi grafica degli step di un processo di make : Ant
- interdipendenze tra le classi di un progetto software
- ottenere diagrammi di comunicazione tra un insieme di servizi
loosely coupled (es. in un ambiente SOA ).

2) Gestire il ciclo vita del software con strumenti opensource
Target audience: architetti software, sviluppatori, chiunque abbia a
che fare con un repository di sorgenti di qualsivoglia progetto.

Abstract: Qualunque progetto software, dal piu' semplice progetto
casalingo ospitato su sourceforge all'intero kernel linux, vive
secondo le leggi non scritte del ciclo vita: sviluppo, testing,
versionamento, rilascio, bugfixing e di nuovo dall'inizio di release
in release. Per quanto alcuni strumenti siamo ormai di uso comune
(es.: cvs o svn ), non appena il progetto prende piede nasce la
necessita' di un sistema di tooling piu' completo. Nell'ipotesi dello
sviluppo di un ipotetico progetto java, nello speech verra' presentato
uno scenario basato completamente sull'uso di software opensource,
comprendente una breve carrellata su :
- un sistema di source control management : svn (http://subversion.tigris.org/)
- un sistema di wiki collaboration, bug tracking e project management
: trac (http://trac.edgewall.org/)
- un sistema per la continuous integration : continuum
(http://maven.apache.org/continuum/) o cruisecontrol (
http://cruisecontrol.sourceforge.net/ ).

Nello specifico scenario di sviluppo di un progetto Java-based, si
accennera' ai software opensource per il build management ( maven ) e
il release repository management ( artifactory ).

3) Dati inattesi: quando la tua azienda ha cose che non sa di sapere.
Presentazione del progetto Bayes-Swarm
Target audience : PMI , chiunque abbia dati sottomano che non sappia
come analizzare, interessati alle tematiche di datamining e analisi
statistica

NOTA: questo speech deriva dal lavoro effettuato sul progetto
bayes-swarm ( http://code.google.com/p/bayes-swarm/ ) attualmente in
attivo sviluppo, ma ancora in stadio embrionale. Non e' garantito che
ci sia materiale sufficiente entro il 31/10 .

Abstract: la categorizzazione delle ere dell'uomo tende a definire
quella corrente come era dell'informazione. In essa, la penetrazione
dell'informatica in qualunque settore e la riduzione dei costi ad essa
collegati, ha aumentato esponenzialmente la tendenza all'accumulo di
dati e informazioni di qualsivoglia genere dalle origini piu'
disparate (siano essi basi dati di potenziali clienti e contatti o log
di auditing di router perimetrali ). Il problema non e' piu' la
rilevazione e salvataggio di tali dati, ma piuttosto la loro analisi e
l'estrazione di informazioni significative da una massa apparentemente
informe. Poter riconoscere andamenti ricorrenti ( patterns ) e
similarita' diventa quindi un elemento di vantaggio, fonte di business
e opportunita' di risparmio. Siamo gia' in contatto con diverse
soluzioni commerciali basate su questa filosofia : ad esempio il
sistema pubblicitario AdWords di Google o i suggerimenti per
l'acquisto di Amazon.
Lo speech mostrera' come, tramite l'utilizzo di software opensource (
ruby, python ) e di analisi statistica ( R , http://www.r-project.org/
), sia possibile affrontare il problema in una classica applicazione
del genere: l'estrazione di trends all'interno di flussi di notizie,
quali ad esempio, le headilnes di testate giornalistiche o popolari
feed rss.
Verranno presentate le metodologie classiche di estrazione dati ( ETL
, spidering , crawling ) e alcuni esempi delle analisi statistiche
applicabili ( trends, scatterplots di correlazioni, predizione su reti
neurali , modelli econometrici ).

Fatemi sapere, ciao a tutti!
-- Riccardo Govoni