Galera, preciso muito da ajuda de vocês. Sou iniciante em Python, porém surgiu uma oportunidade numa Empresa na qual eu precisaria fazer isso:
Desenvolver um programa (robô) que capture informações brutas de alguma fonte (pdf, txt, site…).
Extraia dados relevantes/estruturados para posterior apresentação (WebService, Arquivo…)
Guarde a informação em um banco de dados.
Sugestões de Temas/Fontes:
- PDF de Diarios Oficiais Judiciarios ou
- Portais Judiciarios ou
- Portais de Noticias
Sugestões de Apresentação:
- WebService ou
- Tela ou
- Gerar Documentos (csv)
Lembre-se, a ideia é transformar a informação bruta em dados uteis… utilizando métodos de extração, armazenamento, mineração e entrega da informação/dados.
Deve ser utilizada a linguagem Python.
O armazenamento é preferencialmente em Mongo, mas pode ser utilizado Postgres ou MySQL.
Quem puder me auxiliar, eu agradeço. Pois estou desde Segunda sozinho tentando fazer, pesquisando no Google e encontrando tutoriais com furos... Eu estou esgotado! Já tentei Uma peeenca de coisas e tenho até amanhã às 19hs para entregar via email. Se existir alguma alma caridosa, eu iria agradecer mt!!!
Obs: Vale lembrar que já instalei uma peeenca de coisas e no final, na parte que seria da captura dos dados, todo tutorial que encontrei tinha furo em algum download (não funcionava) ou outra coisa.
Deus abençoe!!!
Luciano Coelho