Sou novato em python, e estou tentando resolver o problema abaixo mas não acho uma solução, se alguém puder ajudar, ficarei agradecido.
No texto importado do site abaixo # Início do Código, há um número de "Processo", exemplo =("0005467-10.2011.8.19.0053"), que aparece 7 vezes repetido apenas o que está em negrito. Como faço para encontrar todos os processos citados pela decisão no texto? Tenho que criar um dicionário chamadocitacoes_tjrj, onde cada chave é um processo citado pela decisão guardada emtjrj_1_text. O valor associado a cada uma dessas chaves deve ser um dicionário contendo as seguintes informações a respeito do processo:
1) o ID (definido como NNNNNNN-DD) - nome da chave = "id";
2) o ano de protocolo - nome da chave = "ano";
3) o código do ramo da justiça - nome da chave = "cod_just";
4) o código do tribunal - nome da chave = "cod_trib";
5) o código do órgão competente para o julgamento - nome da chave = "org_julg".
Deram como exemplo o código abaixo onde localizamos as posições da palavra "consum".
indexes_list = []
for instance in range(tjrj_1_text.count("consum")):
if not indexes_list:
new_index = tjrj_1_text.find("consum")
else:
new_index = tjrj_1_text.find("consum", max(indexes_list) + len("consum"), len(tjrj_1_text))
indexes_list.append(new_index)
Pergunta
Leandro Henrique Manhani Moreira
Bom dia a todos !
Sou novato em python, e estou tentando resolver o problema abaixo mas não acho uma solução, se alguém puder ajudar, ficarei agradecido.
No texto importado do site abaixo # Início do Código, há um número de "Processo", exemplo =("0005467-10.2011.8.19.0053"), que aparece 7 vezes repetido apenas o que está em negrito. Como faço para encontrar todos os processos citados pela decisão no texto? Tenho que criar um dicionário chamado
citacoes_tjrj
, onde cada chave é um processo citado pela decisão guardada emtjrj_1_text
. O valor associado a cada uma dessas chaves deve ser um dicionário contendo as seguintes informações a respeito do processo:1) o ID (definido como NNNNNNN-DD) - nome da chave = "id";
2) o ano de protocolo - nome da chave = "ano";
3) o código do ramo da justiça - nome da chave = "cod_just";
4) o código do tribunal - nome da chave = "cod_trib";
5) o código do órgão competente para o julgamento - nome da chave = "org_julg".
Deram como exemplo o código abaixo onde localizamos as posições da palavra "consum".
indexes_list = []
for instance in range(tjrj_1_text.count("consum")):
if not indexes_list:
new_index = tjrj_1_text.find("consum")
else:
new_index = tjrj_1_text.find("consum", max(indexes_list) + len("consum"), len(tjrj_1_text))
indexes_list.append(new_index)
print(indexes_list)
# Início do Código
import requests
google_url = "https://drive.google.com/uc?export=download&id="
file_id = "1JJ4Qf1gt1o2tTryhUFuCfloqFBJYkqdC"tjrj_1 = requests.get(google_url + file_id).content
tjrj_1_text = tjrj_1.decode(encoding = "latin9")
Se alguém puder ajudar !! Obrigado
Link para o comentário
Compartilhar em outros sites
0 respostass a esta questão
Posts Recomendados
Participe da discussão
Você pode postar agora e se registrar depois. Se você já tem uma conta, acesse agora para postar com sua conta.