Luckxander Postado Junho 29, 2007 Denunciar Share Postado Junho 29, 2007 Alguém sabe como faço para pegar as urls dentro de um determinado diretório ?Como o escript abaixo pego o html da url fornecida, mas na verdade preciso adaptá-lo para ao invés de pegar o html, pegar os links dentro do diretório da url.import urllib2a = urllib2.urlopen('http://www.site.com/')html = a.read()a.close()print htmlno caso acima preciso de um retorno com links tipo: http://www.site.com, http://www.site.com/contato, http://www.site.com/clientes, http://www.site.com/produtos, ... etc. Citar Link para o comentário Compartilhar em outros sites More sharing options...
0 Kakao Postado Junho 29, 2007 Denunciar Share Postado Junho 29, 2007 O Beaultiful Soup é um HTML parser e pode te ajudar:http://www.crummy.com/software/BeautifulSoup/ Citar Link para o comentário Compartilhar em outros sites More sharing options...
Pergunta
Luckxander
Alguém sabe como faço para pegar as urls dentro de um determinado diretório ?
Como o escript abaixo pego o html da url fornecida, mas na verdade preciso adaptá-lo para ao invés de pegar o html, pegar os links dentro do diretório da url.
import urllib2
a = urllib2.urlopen('http://www.site.com/')
html = a.read()
a.close()
print html
no caso acima preciso de um retorno com links tipo: http://www.site.com, http://www.site.com/contato, http://www.site.com/clientes, http://www.site.com/produtos, ... etc.
Link para o comentário
Compartilhar em outros sites
1 resposta a esta questão
Posts Recomendados
Participe da discussão
Você pode postar agora e se registrar depois. Se você já tem uma conta, acesse agora para postar com sua conta.