Estrarre URL

Vedi tutte le pagine e le modifiche recenti o scarica i sorgenti nella pagina


Estrarre url da un testo e’ una cosa che capita spesso di fare. Pensate ad esempio, se voleste scrivere un programa come wget o teleport pro, dovreste scaricare una pagina web, poi cercare i link al suo interno, e poi scaricare quelle nuove pagine e ricominciare. Grazie al modulo URI questo diventa facilissimo:
    require "uri" 

    URI.extract("bla bla baa http://foo.bar.com/foobar mailto:pippo@mai.com")
    #=> ["http://foo.bar.com/foobar", "mailto:foo@bar.com"]
Come vedete il modulo URI cattura, appunto, un uri, sta poi a voi verificare che sia http o ftp o altro. Questo modulo permette anche di analizzare un singolo uri, e trarne informazioni utili, ma questo e’ fuori dall’interesse di questa ricetta :)
Updated on November 26, 2005 13:02 by Ruby Fan (151.37.150.7)