[Flug] R: Re: corsi data mining da itnernet

amengoni29@inwind.it amengoni29@inwind.it
Mar 7 Maggio 2013 19:08:18 CEST


Grazie tante Carlo,

apprezzo moltissimo i tuoi suggerimenti.....la volta scorsa sono riuscito a 
ripartire da ubuntu con il sistema in crash...adesso sto  provando open suse.



riguardo al progetto. l'obiettivo sarebbe di tirare giu' con delle macro dei 
dati da internet al minuto. Sono dati finanziari di borsa. Vediamo molto 
grossolanemente sulla borsa italiana ci sono circa 400 titoli e dunque una 
rilevazione al minuto per 400 titoli per 8,5 ore fanno 204 mila dati al giorno 
con uno stock di minimo  1 anno sono 74 milioni

dal momento che il pc dovrebbe rimanere sempre acceso meglio utilizzare 
raspberry consuma meno......ma risucirà a fare il lavoro ?


inoltre e' vero i formati sono balordi e spesso mi sono bloccato......ma 
comunque è un livello di difficoltà anche questo....



come credi mi possa muovere ?


grazie acnora

andrea




----Messaggio originale----
>Da: baffa@arcetri.astro.it
>Data: 06/05/2013 12.51
>A: <flug@lists.linux.it>
>Ogg: Re: [Flug] corsi data mining da itnernet
>
>On 05/05/2013 10:08 AM, amengoni29@inwind.it wrote:
>> Buongiorno a tutti,
>> volevo alcune informazioni secondo Voi ci sono dei corsi basici per 
imparare a
>> crearsi con delle macro da open office calc dei sistemi di raccolta dati da
>> internet, finanziari, economici ?
>> mi interesserebbe molto....ma trovo molte difficoltà a causa dati 
protetti....e
>> poi ci sono manuli per macro solo per excell e non per open office ceh sono
>> leggermente diversi....e non sono un cannone con linux.....
>> la mia idea era di utilizzare un raspberry  (basso costo di utilizzo) che
>> accumuli dati....
>> 
>
>Ciao,
>non conosco corsi di questo tipo, c'e' un vecchio libro a riguardo, che pero'
>non copre specificatamente solo open/libreoffice: Spidering Hacks.
>Temo pero' che tu ti stia mettendo in un'impresa molto piu' grossa di quanto 
non
>sembri. A meno che tu non sia interessato a piccoli gruppi di dati ben
>localizzati, gli spider girano su sistemi GROSSI. Gia' usare open/libreoffice 
e'
>un grosso appesantimento, mentre un raspberry ha muscoli decisamente 
limitati.
>
>La frase sui dati protetti mi impensierisce un po'. Di solito chi spende 
risorse
>per proteggere dei dati pubblicati su web ha una ragione per farlo, se ne 
puo'
>discutere l'eticita', ma...
>Ma magari intendi che sono in un formato balordo...
>
>Se pero' ho capito male e tu vuoi, per esempio, raccogliere 'solo' i valori 
di
>borsa di un mercato specifico e farci su un minimo di conti, be' allora e'
>probabilmente fattibile, magari in python (molto piu' potente delle macro
>citate) e puoi pensare ad un vecchio portatile o ad raspberry.
>
>Giusto i miei 2cent
>Ciao
>carlo
>-- 
> Dott.Carlo Baffa              INAF - Osservatorio Astrofisico di Arcetri
> baffa@arcetri.astro.it             Largo Fermi 5   I-50125-Firenze ITALY
> http://www.arcetri.astro.it/~baffa                 Fax (+39) 055 5609713
>-------------------------------------------------------------------------
> http://www.skysoft.org           The new Astronomical Software Directory
>_______________________________________________
>flug mailing list
>flug@lists.linux.it
>http://lists.linux.it/listinfo/flug
>




Maggiori informazioni sulla lista flug