Ir para conteúdo
Fórum Script Brasil
  • 0

Script para leitura de padrão númerico


TheMenestrel

Pergunta

Olá, colegas, tudo bem?

 

Me chamo Matheus, sou novo no fórum e na linguagem, estou na ânsia do aprendizado para facilitar e tornar mais eficiente minhas atividades no trabalho.

 

Poderiam me ajudar com a questão a seguir?

 

Preciso escrever um Script que acesse essa pagina: http://doweb.rio.rj.gov.br/portal/visualizacoes/view_html_diario/3933 e guarde todos os números que contenham 6 números juntos, como 525149,  525183, 525221, etc.

Se vocês repararem, esse padrão de 6 números sequenciais não se repete em outro lugar a não ser para identificar os arquivos que serão utilizados conforme abaixo:

Após capturar todos esses "blocos" de números, preciso substituir no final desse outro link: 

http://doweb.rio.rj.gov.br/apifront/portal/edicoes/publicacoes_ver_conteudo/525109.

http://doweb.rio.rj.gov.br/apifront/portal/edicoes/publicacoes_ver_conteudo/XXXXXX.

Após abrir os documentos no segundo link, quero automatizar salvar todos esses arquivos no meu servidor local.

Posteriormente, trabalharei em um script que fará a leitura dos dados desses arquivos salvos (em pdf, em txt, excel, etc.) para procurar termos específicos sempre utilizados aqui, como Processo, Contato, Ata, etc.

 

Poderiam me auxiliar, por gentileza?

 

Forte abraço, sucesso!

Link para o comentário
Compartilhar em outros sites

2 respostass a esta questão

Posts Recomendados

  • 0

Consegui pegar todos os números e consegui criar o padrão

O script e está assim:

 

import re
import requests

padrao_identificador = re.compile(r'\d{6}')

diario = requests.get('http://doweb.rio.rj.gov.br/portal/visualizacoes/view_html_diario/3933')

Todos = re.findall(padrao_identificador, diario.text)

print(Todos)

Na sequência consegui trocar o final dos links com o script:

 

for Todos2 in Todos:

    ##print(Todos2)

    diario2 = ('http://doweb.rio.rj.gov.br/apifront/portal/edicoes/publicacoes_ver_conteudo/'+Todos2)
   
    print(diario2)

print('Final')

Agora preciso fazer o python iniciar esses links e salvar todos os documentos em um único arquivo word ou PDF.

 

Alguma sugestão de como fazer isso?

 

Att.

Link para o comentário
Compartilhar em outros sites

Participe da discussão

Você pode postar agora e se registrar depois. Se você já tem uma conta, acesse agora para postar com sua conta.

Visitante
Responder esta pergunta...

×   Você colou conteúdo com formatação.   Remover formatação

  Apenas 75 emoticons são permitidos.

×   Seu link foi incorporado automaticamente.   Exibir como um link em vez disso

×   Seu conteúdo anterior foi restaurado.   Limpar Editor

×   Você não pode colar imagens diretamente. Carregar ou inserir imagens do URL.



  • Estatísticas dos Fóruns

    • Tópicos
      152,3k
    • Posts
      652,5k
×
×
  • Criar Novo...