Jump to content
Fórum Script Brasil
  • 0

Extrair dados de uma tabela em um arquivo PDF


Question

Bom dia a todos!

Estou desenvolvendo uma solução onde a partir do upload de um relatório PDF eu possa fazer comparativo com dados no banco de dados.

Sendo para para isso preciso de uma API ou outra funcionalidade que eu possa ler os dados na tabela do relatório coluna por coluna. 

Achei algumas APIs pagas mas tive problemas na adaptação. Cheguei até a ter a ideia de converter o PDF para HTML e usar o simple_dom_html mas também tive dificuldades de achar algo mais automatizado.

Poderiam me dar uma luz, por favor?

Link to post
Share on other sites

2 answers to this question

Recommended Posts

  • 0
7 horas atrás, lowys disse:

Olá! De onde veio esse relatório?

Peça para te enviarem em outro formato.

Já tentou esse: https://github.com/smalot/pdfparser

Tentei o pdfparser mas ele pega os dados sem todos juntos em texto plano, alguns separados por espaços e returns. Pelo que vi dá pra capturar o que quero usando um jogo de explodes no PHP mas vi dar ujm grande trabalho.

Eu estou fazendo o seguinte no momento: Converto o PDF para HTML neste site: http://www.pdfonline.com/easyconverter/sdk/pdf-to-html/index.htm , e leio as classes CSS  através do JQuery. O bom que este site gera o código com ótima formatação, fora a separação em classes.

Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Answer this question...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.



  • Forum Statistics

    • Total Topics
      148719
    • Total Posts
      644508
×
×
  • Create New...