Note: Testo rimosso dalla rev 1  e Testo aggiunto nella rev2

EstrarreURL

Estrarre url da un testo e’ una cosa che capita spesso di fare. Pensate ad esempio, se voleste scrivere un programa come wget o teleport pro, dovreste scaricare una pagina web, poi cercare i link al suo interno, e poi scaricare quelle nuove pagine e ricominciare. Grazie al modulo URI questo diventa facilissimo:


    require "uri"
URI.extract("bla"uri" 

    URI.extract("bla bla baa http://foo.bar.com/foobar mailto:pippo@mai.com")
mailto:pippo@mai.com")
    #=> ["http://foo.bar.com/foobar",["http://foo.bar.com/foobar", "mailto:foo@bar.com"]"mailto:foo@bar.com"]

Come vedete il modulo URI cattura, appunto, un uri, sta poi a voi verificare che sia http o ftp o altro. Questo modulo permette anche di analizzare un singolo uri, e trarne informazioni utili, ma questo e’ fuori dall’interesse di questa ricetta :)

Created on November 25, 2005 13:36 by il gruppo (256.256.256.256)