Ir para conteúdo
Fórum Script Brasil
  • 0

Pesquiza de URLs em um texto usando Python


denosmacedo

Pergunta

Ola! =)

Pessoal tenho um texto e tow querendo recuperar todas as URLs escritas nele... por exemplo:

Nessa comunidade python http://www.google.com é meu http://www.orkut.com primeiro poster...

Python tem algum metodo que dado essa string me retornasse essas duas URLs (google e orkut)? ou algo parecido?

Desde já,

Obigado pla ajuda

Link para o comentário
Compartilhar em outros sites

2 respostass a esta questão

Posts Recomendados

  • 0

Está ai fera!

Ele te gerará uma lista com os links!

# -*- coding: cp1252 -*-
# --- Desenvolvido por Utech ---
texto = "essa comunidade python http://www.google.com é meu http://www.orkut.com primeiro poster"
def retira_link(texto):
    links = list() #gera a lista que terá os links
    i = 0
    while True: # loop infinito até que pare!
        if texto[i:].find("http://") >= 0: # Se existe a tag ele obterá indice positivo
                comeca = texto[i:].find("http://")+i #Pega o indice de onde começou e mais de onde partiu
                
                if texto[i:].find(".com.br") >= 0:
                     acaba = texto[i:].find(".com.br")+len(".com.br")+i

                elif texto[i:].find(".com") >= 0:
                    acaba = texto[i:].find(".com")+len(".com")+i

                elif texto[i:].find(".net") >= 0:
                    acaba = texto[i:].find(".net")+len(".net")+i

                elif texto[i:].find(".org") >= 0:
                    acaba = texto[i:].find(".org")+len(".org")+i

                elif texto[i:].find(" ") >= 0:
                    acaba = texto[i:].find(" ")+len(" ")+i

                else:
                    acaba = -1

                if acaba >= 0:
                    i = acaba
                    links.append(texto[comeca:acaba])
                else:
                    break
        else:
            break

    return links

Editado por Utech
Link para o comentário
Compartilhar em outros sites

Participe da discussão

Você pode postar agora e se registrar depois. Se você já tem uma conta, acesse agora para postar com sua conta.

Visitante
Responder esta pergunta...

×   Você colou conteúdo com formatação.   Remover formatação

  Apenas 75 emoticons são permitidos.

×   Seu link foi incorporado automaticamente.   Exibir como um link em vez disso

×   Seu conteúdo anterior foi restaurado.   Limpar Editor

×   Você não pode colar imagens diretamente. Carregar ou inserir imagens do URL.



  • Estatísticas dos Fóruns

    • Tópicos
      152,1k
    • Posts
      651,8k
×
×
  • Criar Novo...