Olá, colegas, tudo bem?
Me chamo Matheus, sou novo no fórum e na linguagem, estou na ânsia do aprendizado para facilitar e tornar mais eficiente minhas atividades no trabalho.
Poderiam me ajudar com a questão a seguir?
Preciso escrever um Script que acesse essa pagina: http://doweb.rio.rj.gov.br/portal/visualizacoes/view_html_diario/3933 e guarde todos os números que contenham 6 números juntos, como 525149, 525183, 525221, etc.
Se vocês repararem, esse padrão de 6 números sequenciais não se repete em outro lugar a não ser para identificar os arquivos que serão utilizados conforme abaixo:
Após capturar todos esses "blocos" de números, preciso substituir no final desse outro link:
http://doweb.rio.rj.gov.br/apifront/portal/edicoes/publicacoes_ver_conteudo/525109.
http://doweb.rio.rj.gov.br/apifront/portal/edicoes/publicacoes_ver_conteudo/XXXXXX.
Após abrir os documentos no segundo link, quero automatizar salvar todos esses arquivos no meu servidor local.
Posteriormente, trabalharei em um script que fará a leitura dos dados desses arquivos salvos (em pdf, em txt, excel, etc.) para procurar termos específicos sempre utilizados aqui, como Processo, Contato, Ata, etc.
Poderiam me auxiliar, por gentileza?
Forte abraço, sucesso!