[LUGDucale-ml] Piccolo help per modificare un file di testo

Edoardo Nembro edoardo.nembro@gmail.com
Ven 18 Dic 2015 12:40:00 CET


Ciao Denis,
grazie mille! Il file è di oltre 6500 righe, nulla di privato, è solo una
corsa che ho fatto con un gruppo di amici...
Avevo intuito che dovessi fare uso delle espressioni regolari ma non mi era
chiaro come specificare di quante righe
fosse l'espressione. Alla fine sono riuscito a trovare una guida abb
semplice a sed e ho ottenuto quello che volevo con il comando

*sed -e '/<extensions>/,/<\/extensions>/d' input.xml > output.xml*

che limita l'espressione regolare tra i 2 tag...
Decisamente devo trovare qualche guida per imparare a sfruttare meglio i
comandi da terminale!

Grazie ancora,
Edo

Il giorno 18 dicembre 2015 12:05, Denis LUGDucale <
thenis.lugducale@gmail.com> ha scritto:

> regular expressions?
>
> https://www.youtube.com/watch?v=EkluES9Rvak
>
> Molto educativo.
> Senza imparare ad utilizzare vi potresti sfruttare la shell e utilizzare "
> cat | grep -e "expression" > newfile " ed eliminare selettivamente le righe
> che corrispondono all'espressione
>
> Di sicuro hai fretta. quanto lungo è il file?
> Si può darci una occhiata? Quanta fretta hai?
>
> Denis
>
> Il giorno 18 dicembre 2015 11:41, Edoardo Nembro <edoardo.nembro@gmail.com
> > ha scritto:
>
>> Ciao a tutti,
>> magari qualcuno di voi sa come aiutarmi a eliminare da un lunghissimo
>> file XML una struttura ripetuta un sacco di volte.
>> In pratica ho un file che è una specie di log fatto da una serie di punti
>> scritti in questo modo:
>>
>>
>>
>>
>> *<trkpt lat="45.3059740" lon="8.8906140">    <ele>94.6</ele>
>> <time>2015-12-17T18:07:19Z</time></trkpt>*
>>
>> Alcuni di questi punti hanno delle informazioni aggiuntive perchè vengono
>> da un dispositivo diverso e sono scritti come
>>
>>
>>
>>
>>
>>
>>
>>
>>
>> *<trkpt lat="45.3059740" lon="8.8906140">    <ele>94.6</ele>
>> <time>2015-12-17T18:07:19Z</time>    <extensions>
>> <gpxtpx:TrackPointExtension>      <gpxtpx:hr>176</gpxtpx:hr>
>> </gpxtpx:TrackPointExtension>    </extensions>   </trkpt>*
>>
>> con il valore che ho evidenziato in grassetto che cambia sempre (se può
>> aiutare è sempre di 3 cifre, quindi il numero
>> di caratteri per blocco è sempre uguale).
>>
>> Devo eliminare da tutto il file tutti i blocchi compresi tra <extensions>
>> ed </extensions>, avete consigli su come procedere?
>>
>> Grazie
>> Edo
>>
>>
>> --
>> Mailing list info: http://lists.linux.it/listinfo/lugducale
>>
>>
>
>
> --
> Mailing list info: http://lists.linux.it/listinfo/lugducale
>
>
-------------- parte successiva --------------
Un allegato HTML è stato rimosso...
URL: <http://lists.linux.it/pipermail/lugducale/attachments/20151218/772171e4/attachment.html>


Maggiori informazioni sulla lista LUGDucale