Ir para conteúdo
Fórum Script Brasil
  • 0

Robô para capturar Informações de um site e extrair num BD (Python)


LukeThomaz

Pergunta

Galera, preciso muito da ajuda de vocês. Sou iniciante em Python, porém surgiu uma oportunidade numa Empresa na qual eu precisaria fazer isso:

 

Desenvolver um programa (robô) que capture informações brutas de alguma fonte (pdf, txt, site…).
Extraia dados relevantes/estruturados para posterior apresentação (WebService, Arquivo…)
Guarde a informação em um banco de dados.
Sugestões de Temas/Fontes:
   - PDF de Diarios Oficiais Judiciarios ou
   - Portais Judiciarios ou
   - Portais de Noticias
Sugestões de Apresentação:
   - WebService ou
   - Tela ou
   - Gerar Documentos (csv)
Lembre-se, a ideia é transformar a informação bruta em dados uteis… utilizando métodos de extração, armazenamento, mineração e entrega da informação/dados.
Deve ser utilizada a linguagem  Python.
O armazenamento é preferencialmente em Mongo, mas pode ser utilizado Postgres ou MySQL.
 
 
Quem puder me auxiliar, eu agradeço. Pois estou desde Segunda sozinho tentando fazer, pesquisando no Google e encontrando tutoriais com furos... Eu estou esgotado! Já tentei Uma peeenca de coisas e tenho até amanhã às 19hs para entregar via email. Se existir alguma alma caridosa, eu iria agradecer mt!!!
 
Obs: Vale lembrar que já instalei uma peeenca de coisas e no final, na parte que seria da captura dos dados, todo tutorial que encontrei tinha furo em algum download (não funcionava) ou outra coisa.
 
Deus abençoe!!!
 
Luciano Coelho
Link para o comentário
Compartilhar em outros sites

2 respostass a esta questão

Posts Recomendados

Participe da discussão

Você pode postar agora e se registrar depois. Se você já tem uma conta, acesse agora para postar com sua conta.

Visitante
Responder esta pergunta...

×   Você colou conteúdo com formatação.   Remover formatação

  Apenas 75 emoticons são permitidos.

×   Seu link foi incorporado automaticamente.   Exibir como um link em vez disso

×   Seu conteúdo anterior foi restaurado.   Limpar Editor

×   Você não pode colar imagens diretamente. Carregar ou inserir imagens do URL.



  • Estatísticas dos Fóruns

    • Tópicos
      152,3k
    • Posts
      652,5k
×
×
  • Criar Novo...