Ir para conteúdo
Fórum Script Brasil
  • 0

Yagami Shizui

Pergunta

Bom dia.

Estou com dificuldade na raspagem de dados utilizando a biblioteca BeautifulSoup, onde a ausencia de dados dentro das <td> não é coletada. Eu gostaria de saber se existe algum parametro que devo especificar durante a busca  find_all()  ou se devo fazer um len() no conteudo pego pelo meu for lendo o tamanho do conteudo coletado na tabela e depois guardando em alguma lista

 

#!/usr/bin/python3
import pandas as pd
from bs4 import BeautifulSoup
import requests
import pandas as pd

gid = []
cidade = []
lista = pd.read_csv('/home/fabio/Downloads/Nova_lista.csv')

for i in lista['gid']:
    gid.append(i)

    for p in lista['nome']:
        cidade.append(p)
 
link = ('http://iridl.ldeo.columbia.edu/SOURCES/SOURCES/.USGS/.LandDAAC/.MODIS/.1km/.8day/.version_005/.Terra/.NSA/.Day/.LST/T/(Jan%202001)/(Mar%202015)/RANGE/X/-82/-34/RANGEEDGES/Y/-38.0/12.0/RANGEEDGES/T/monthlyAverage/home/.jdcorral/.Brazil/.mun_2016_03_21/.the_geom/gid/GID/VALUE/%5BX/Y%5Dweighted-average/T+exch+table-+text+text+skipanyNaN+-table+.html')


with open('df_temp_day.csv' , 'a') as f:


    for i in lista['gid']:

        page = requests.get(link.replace('GID','%s'%i))
        soup = BeautifulSoup(page.text,'lxml')
        tabela = soup.find_all('table',text=False)


        for td in tabela:
            linha = td.find_all('td')
            
            k = 0
            p = 1
            while k <= len(linha) and p <= len(linha):

                mes = str(linha[k].get_text())
                variavel = str(linha[p].get_text())
                k +=2
                p +=2
                n = gid.index(i)
                f.writelines('"%s", %s, "%s" ,"gid %s"\n' %(mes,variavel,cidade[n],i))
                
                print('"%s", %s, %s %s' %(mes,variavel,cidade[n],i))

 

 

Obs : Neste codigo eu já estou testando o parametro text=False, mas não sei realmente o que faz

Link para o comentário
Compartilhar em outros sites

0 respostass a esta questão

Posts Recomendados

Até agora não há respostas para essa pergunta

Participe da discussão

Você pode postar agora e se registrar depois. Se você já tem uma conta, acesse agora para postar com sua conta.

Visitante
Responder esta pergunta...

×   Você colou conteúdo com formatação.   Remover formatação

  Apenas 75 emoticons são permitidos.

×   Seu link foi incorporado automaticamente.   Exibir como um link em vez disso

×   Seu conteúdo anterior foi restaurado.   Limpar Editor

×   Você não pode colar imagens diretamente. Carregar ou inserir imagens do URL.



  • Estatísticas dos Fóruns

    • Tópicos
      152,1k
    • Posts
      651,8k
×
×
  • Criar Novo...