Ir para conteúdo
Fórum Script Brasil
  • 0

Lendo arquivos .pdf e .doc no Linux‏


Renato Penna

Pergunta

Bom dia povo! Estou tentando ler arquivos .doc e .pdf no Linux, mas não consigo. Estou tentando usar o comando $conteudo = shell_exec("catdoc $arq"); mas retorna vazio (como se o arquivo não tivesse nada escrito). Quando eu uso a forma padrão ($fp = fopen($arq,"r"); $conteudo = fread($fp,filesize($arq));) ele retorna um monte de lixo:

&(%[+bjbj.+Y[[[[[[$Z%%%Y%Y%%%J%E%%% %%:Teste para leitura de arquivo word com php*+hAhx+,1h. A!#$%f666666666vvvvvvvvv6666666666666666666666666666666666666666666666666666666hH6666666666666666666666666666666666666666666666666666666666666666662 @Pp2( @Pp @Pp @Pp @Pp @Pp @Pp8XVOJQJ_HmHnHsHtHJJNormaldCJ_HaJmHsHtHA Fonte parg. padroTiTTabela normal4l4a,k ,Sem listaPK![Content_Types].xmljEr(Iw},-j4wP-t#b{UTUhd})*1PW)T9l#$yi};@(Hu*Dz/$X3aZ,Dj3bi3?/[G!-Rk.s..a?PK!6_rels/.relsj}Q%v/C/}(hO= C?hv=%[xp{_P1HORBdJE4b$q_6LR7O,En7Lib/SePK!kytheme/theme/themeManager.xmlM @}w7c(EbCA7KY,e.,H,lxIsQ}# +!,$j=GW)E+&8PK!.atheme/theme/theme1.xmlYMoE#F{omvGuhF[xw;jf7q7J(/z4IA!35.=D4;IOH]YxME$&TVIS1V(Z Ym_&JplG@nN&z@Fj$K_PA!&g=!nmreDLC[OF{KFY7qoku)lVgd.[/_v[LXrd8xR{(b4[@2lz &QLb(fXYJ&x,(R7vKZ Ia:?xpxGIXzg=2PCsu=o.G4& h9QLI(q}938ztzHSE+$_b9rQkZViV2n*=8OSyZ:ppH_/P%#:viNEcfYdEBUVWTXEUJg/RAC8D*-Um6]Ptuyz*&Qh*6w+D?CprloSnpJoBc3chTYok#=pGn=wOikZoiBszLPjui&eEEMl8;64HpU)LO3e:(xf)HyrB(-4gfpZa2khN-aT3V4ov/]f$pp@icAs@THNZIZ[}iRYqy$JyH9,AZjyi)D]n%lXlE6ljWYDK/eby_L&WVcJT14fS!:UJA?y6Xg1K#[]y%[bTRlwvSL)4.XtzxCJ#Lw@,e_}aN}jHPT$dfl,YdTI]Zd+zoPnIhYC=!kkl1Qn6MB]-_f MR+Wh1,QH*:[A@V_.ap64+lt7stG5;Mb8s9xjI11qM2%M2K94uo%PK!theme/theme/_rels/themeManager.xml.relsMwoo&56?$Q,.aic21h:qm@RN;do7gK(M&$R(.1rJT8VAHu}$b{P8g/]QAs(#L[PK-![Content_Types].xmlPK-!6+_rels/.relsPK-!kytheme/theme/themeManager.xmlPK-!.atheme/theme/theme1.xmlPK-!theme/theme/_rels/themeManager.xml.relsPK]?xml version=1. encoding=UTF-8 standalone=yes?a:clrMap xmlns:a=http://schemas.openxmlformats.org/drawingml/26/main bg1=lt1 tx1=dk1 bg2=lt2 tx2=dk2 accent1=accent1 accent2=accent2 accent3=accent3 accent4=accent4 accent5=accent5 accent6=accent6 hlink=hlink folHlink=folHlink/+++8@(BS?*-*-*-xA+-@** **+@UnknownG* Times New Roman5Symbol3.* Arial7.{ @CalibriACambria Mathqzz%%!r**2HP$Px2!xxrenato.pennarenato.pennaOh+8DPdltrenato.pennaNormal.dotmrenato.penna2Microsoft Office Word@F#@xJ@xJ%.+,hpediouro*Ttulo !#$Root EntryFpJ)1TableWordDocumentSummaryInformation(DocumentSummaryInformation8CompObj}F+Documento do Microsoft Office Word 97-23MSWordDocWord.Document.89q

Alguém sabe como ler arquivos .doc e .pdf no Linux com PHP corretamente ?

Desde já agradeço,

Renato.

Link para o comentário
Compartilhar em outros sites

2 respostass a esta questão

Posts Recomendados

  • 0

Achei a solução, obrigado!

$pos = strpos($documento,'.');
$tam = strlen($documento);
$qtd_caracteres_extensao = $tam-$pos;
$extensao_arquivo = substr($documento,($pos+1),$qtd_caracteres_extensao);
        
if($extensao_arquivo=="doc")
{
    $conteudo = shell_exec("catdoc $arq");
}
elseif($extensao_arquivo=="pdf")
{
    $conteudo = shell_exec('pdftotext $arq -');
}

Link para o comentário
Compartilhar em outros sites

Participe da discussão

Você pode postar agora e se registrar depois. Se você já tem uma conta, acesse agora para postar com sua conta.

Visitante
Responder esta pergunta...

×   Você colou conteúdo com formatação.   Remover formatação

  Apenas 75 emoticons são permitidos.

×   Seu link foi incorporado automaticamente.   Exibir como um link em vez disso

×   Seu conteúdo anterior foi restaurado.   Limpar Editor

×   Você não pode colar imagens diretamente. Carregar ou inserir imagens do URL.



  • Estatísticas dos Fóruns

    • Tópicos
      152,3k
    • Posts
      652,5k
×
×
  • Criar Novo...