[Golem] r software

amengoni29@inwind.it amengoni29@inwind.it
Mer 18 Apr 2018 23:25:54 CEST


Ciao a tutti,


ho partecipato ieri sera alla interessantissima presentazione su R software. E' stato segnalato ieri sera di manifestare il proprio interesse su casi di studio in modo eventualmente di articolareil prossimo incontro come laboratorio con i casi pratici.

Mi interessa moltissimo. Spero si riesca ad organizzare.


In particolare sottopongo il mio caso di interesse da raggiungere con R software.


Si tratta di una applicazione economico finaziaria di web mining e aggiornamento di dati finanziari ed economici estrapolati dalla rete.


Priama occorre definire le fonti dei dati a cui attingere. si tratta di prezzi di valute, azioni, indici. M1 money supply

Spesso i siti piu' diffusi presentano delle protezioni in chiaro o delle protezioni implicite, come ad esempio inserimento random su serie storiche di dati completamente fuori range, oppure missing (NA). Occorre quindi verificare la qualità dei dati sulle serie storiche con una routine di controllo. Inoltre una volta definiti i dati oggetto di interesse, costruire una banca dati per ogni singolo valore di circa 5/10 anni.  Esempio la borsa italiana ha circa 450 titoli con 260 osservazioni annuali quindi 2600 osservazioni su time frame di 10 anni.  Verificare prima le dimensioni del problema in termini di design . Il pc a disposizione avrà 4 giga di ram, quindi modesto.

Una volta creato il database, dovrà essere aggiornato end of the day . focus su una selezioni di vettori i quali dovranno essere analizzati con svariate funzioni di R (principalmente staitstiche ma anche innovative come statistico genetiche e altre.

poi la rappresentazione con ggplot2 o shiny o altri packages di R che hanno una immediatezza sconosciuta a Excel.

Molto importante è la definizione di siti affidabili e un metodo di verifica o controllo dei dati (molto spesso alterati intenzionalmente) che confermano il vecchio adagio della staitstica dove la qualità dei risultati delle elaborazioni non puo'm essere superirore alla qualità dei dati immessi, oltre ad essere profondamente consapevoli che la statistica ed R quindi possono rappresentare anche l'arte di mentire con precisione........consentitemi una battuta.


grazie ancora per la conferenza e la qualità dei relatori.


Spèero si riesca ad organizzare un altro evento, ho esplicitato il mio interesse in dettaglio....


tanti saluti a tutti



andrea


Maggiori informazioni sulla lista golem