Galera, preciso muito da ajuda de vocês. Sou iniciante em Python, porém surgiu uma oportunidade numa Empresa na qual eu precisaria fazer isso:
Desenvolver um programa (robô) que capture informações brutas de alguma fonte (pdf, txt, site…).
Extraia dados relevantes/estruturados para posterior apresentação (WebService, Arquivo…)
Guarde a informação em um banco de dados.
Sugestões de Temas/Fontes:
- PDF de Diarios Oficiais Judiciarios ou
- Portais Judiciarios ou
- Portais de Noticias
Sugestões de Apresentação:
- WebService ou
- Tela ou
- Gerar Documentos (csv)
Lembre-se, a ideia é transformar a informação bruta em dados uteis… utilizando métodos de extração, armazenamento, mineração e entrega da informação/dados.
Deve ser utilizada a linguagem Python.
O armazenamento é preferencialmente em Mongo, mas pode ser utilizado Postgres ou MySQL.
Quem puder me auxiliar, eu agradeço. Pois estou desde Segunda sozinho tentando fazer, pesquisando no Google e encontrando tutoriais com furos... Eu estou esgotado! Já tentei Uma peeenca de coisas e tenho até amanhã às 19hs para entregar via email. Se existir alguma alma caridosa, eu iria agradecer mt!!!
Obs: Vale lembrar que já instalei uma peeenca de coisas e no final, na parte que seria da captura dos dados, todo tutorial que encontrei tinha furo em algum download (não funcionava) ou outra coisa.
Pergunta
LukeThomaz
Galera, preciso muito da ajuda de vocês. Sou iniciante em Python, porém surgiu uma oportunidade numa Empresa na qual eu precisaria fazer isso:
Link para o comentário
Compartilhar em outros sites
2 respostass a esta questão
Posts Recomendados
Participe da discussão
Você pode postar agora e se registrar depois. Se você já tem uma conta, acesse agora para postar com sua conta.