<div dir="ltr"><div><div><a href="http://agg.to">agg.to</a> : <br>zap non va' bene, non mi costruisce un report dei link del sito ma solo degli alert trovati, e comunque non fa' per me<br></div>ho invece trovato Web Scraper, che e' un'estensione del browser Chrome, e se riesco ad addestrarlo per il mio sito credo sia veramente valido<br></div>A.<br></div><div class="gmail_extra"><br><div class="gmail_quote">2015-06-25 8:48 GMT+02:00 Alessandro Fava <span dir="ltr"><<a href="mailto:alessandro.fava.69@gmail.com" target="_blank">alessandro.fava.69@gmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><div><div><div>Grazie secco,<br></div>ho appena istallato ZAP e lo sto' facendo girare con lo spider ajax attraverso l'engine HtmlUnit (guarda caso con firefox si produceva su Wiin7 lo stesso errore di crawljax "appcrash at xul.dll") ..... vediamo cosa produrra', e che plugin ci sono :-)<br><br></div>Grazie il Katta per le info, Scrapy pero' per essere usato al meglio con js+ajax mi pare necessiti di creare del codice in python.<br><br></div>Riguardo alle esigenze vorrei solo documentare struttura ed elenco contenuti di due siti (collaudo e produzione) per confrontarli tra loro e ricercare almeno i 404. Cio' che devo gestire di ajax e' il pagination down e vorrei trovare qualcosa di pronto all'uso che lo faccia da se'.<br><br></div>Alessandro <br><div><div><div><div><br></div></div></div></div></div><div class="gmail_extra"><br><div class="gmail_quote">2015-06-24 22:40 GMT+02:00 il Katta <span dir="ltr"><<a href="mailto:ilkatta88@gmail.com" target="_blank">ilkatta88@gmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><br></div>Ciao,<div>Non credo di aver capito bene cosa stai cercando, ma se ti interessa un framework per testing gli strumenti di cui ho sentito più parlare sono seleniumHQ [1] e phantomJS [2], purtroppo non ho abbastanza esperienza per dirti di più.</div><div><br></div><div>Se invece di accontenti di un semplice crawer senza motore js io mi sono trovato abbastanza bene con Scrapy [3], che però, appunto, è uno spider, il suo principale uso è estrarre e collezionare informazioni...</div><div><br></div><div class="gmail_extra">Saluti.<br><div class="gmail_quote"><br></div><div class="gmail_quote">[1] <a href="http://www.seleniumhq.org/" target="_blank">http://www.seleniumhq.org/</a></div><div class="gmail_quote"><br></div><div class="gmail_quote">[2] <a href="http://phantomjs.org/" target="_blank">http://phantomjs.org/</a> </div><div class="gmail_quote"><br></div><div class="gmail_quote">[3] <a href="http://scrapy.org/" target="_blank">http://scrapy.org/</a></div></div></div>
<br><span class="HOEnZb"><font color="#888888"><br>
--<br>
Sito BgLUG: <a href="http://www.bglug.it" rel="noreferrer" target="_blank">http://www.bglug.it</a><br>
Mailing list: <a href="http://lists.linux.it/listinfo/bglug" rel="noreferrer" target="_blank">http://lists.linux.it/listinfo/bglug</a><br></font></span></blockquote></div><br></div>
</blockquote></div><br></div>