Fórum Script Brasil
Saltando Linhas Inesperadamente

Guest - MarcelComputacao -


Guest - MarcelComputacao -

o arquivo de entrada do programa é o seguinte : :)


alexandre 456123789

anderson 1245698456

antonio 123456456

carlos 91257581

cesar 987458

rosemary 789456125

a saida do programa deveria ser assim: :D

1 alexandre 434,99 MB 16,85%

2 anderson 1187,99 MB 46,02%

3 antonio 117,73 MB 4,56%

4 carlos 87,03 MB 3,37%

5 cesar 0,94 MB 0,04%

6 rosemary 752,88 MB 29,16%

entretanto, :o ela esta sendo assim : :o

1 alexandre 434,99 MB 16,85%


anderson 1187,99 MB 46,02%


antonio 117,73 MB 4,56%


carlos 87,03 MB 3,37%


cesar 0,94 MB 0,04%


rosemary 752,88 MB 29,16%

o codigo é o seguinte : :unsure:

def converteMega(byte):
    return float(byte)/pow(1024,2)

def percentualUso(valor_parcial, total):
    return float(valor_parcial)*100/float(total)

f = open('usuarios.txt','r')

bloco =
i = 0
soma = 0
quantidade = 0
media = 0
lista = []
x = 0
nomes = [] 
espacos = []
string = ''

while True:

   snumero = ''
   snome = ''

   if (i+1) == len(bloco):
       media = soma/quantidade
       while x < len(espacos):
           perc = '%10.2f' % percentualUso( converteMega(espacos.__getitem__(x)), soma ) + ' %'
           no = nomes.__getitem__(x)
           esp = '%10.2f MB' % converteMega( espacos.__getitem__(x) )
           string =  str(x+1) + '\t' + no + '\t' + str(esp) + '\t' + str(perc)
           print string
           x += 1

       so = 'Espaco total ocupado: %.2f MB' % soma
       me = 'Espaco medio ocupado: %.2f MB' % media
   while bloco[i] != ' ':
       snome = snome + bloco[i]   
       i += 1

   while bloco[i] == ' ':  
       i += 1
   while bloco[i] != '\n':
       snumero = snumero + bloco[i]
       i += 1
   soma += converteMega(snumero)    
   quantidade += 1


alguém sabe me dizer o que esta errado com esse programa ? :( :unsure:

Eu ajeitei o programa. Veja linhas 1, 27 e 53. Parece que você está lendo o arquivo byte a byte por uma exigência de algum curso, o que é normal para exercitar algoritmos. Mas se não for isso ler um arquivo texto linha a linha é muito mais simples e evita as muitas armadilhas do byte a byte.

Qual a vantagem neste caso de se usar __getitem__()? Eu troquei pela indexação simples [].

import sys

def converteMega(byte):
    return float(byte)/pow(1024,2)

def percentualUso(valor_parcial, total):
    return float(valor_parcial)*100/float(total)

f = open('usuarios.txt','r')

bloco =
i = 0
soma = 0
quantidade = 0
media = 0
lista = []
x = 0
nomes = []
espacos = []
string = ''

while True:

   snumero = ''
   snome = ''

   if (i) == len(bloco):
       media = soma/quantidade
       while x < len(espacos):
           perc = '%10.2f' % percentualUso( converteMega(espacos[x]), soma ) + ' %'
           no = nomes[x]
           esp = '%10.2f MB' % converteMega( espacos[x] )
           string =  str(x+1) + '\t' + no + '\t' + str(esp) + '\t' + str(perc)
           print string
           x += 1

       so = 'Espaco total ocupado: %.2f MB' % soma
       me = 'Espaco medio ocupado: %.2f MB' % media
   while bloco[i] != ' ':
       snome = snome + bloco[i]  
       i += 1

   while bloco[i] == ' ':  
       i += 1
   while bloco[i] != '\n':
       snumero = snumero + bloco[i]
       i += 1
   if bloco[i] == '\n': i += 1
   soma += converteMega(snumero)    
   quantidade += 1


Guest - MarcelComputacao -

usei __getitem__() sem conhecer ao certo as diferencas entre ele a indexacao simples. :) . então era por isso que esta dando aquele problema para saltar de linhas ? :unsure:

Guest - MarcelComputacao -

a proposito, para fazer o tratamento nesse arquivo, da forma como o resultado deve ser gerado, obrigatoriamente devo ler caracter por caracter correto ? :blink:

usei __getitem__() sem conhecer ao certo as diferencas entre ele a indexacao simples. :) . então era por isso que esta dando aquele problema para saltar de linhas ? :unsure:

Não. O problema de saltar linha era causado por um erro no algoritmo. Compare o seu programa com o programa que eu coloquei e veja a diferença (eu citei as linhas diferentes).

a proposito, para fazer o tratamento nesse arquivo, da forma como o resultado deve ser gerado, obrigatoriamente devo ler caracter por caracter correto ? :blink:

Não. Ler caracter por caracter é a pior solução. A melhor solução é ler linha a linha com f.readline(). E fica melhor ainda se os campos do arquivo estiverem separados por tab porque aí basta fazer linha.split('\t') para ter uma lista com todos os campos daquela linha.

Guest - MarcelComputacao -

Ler caracter por caracter é a pior solução. A melhor solução é ler linha a linha com f.readline().

mas ler linha por linha implica em varias operacoes de i/o. Isto representa um custo muito grande se o arquivo tiver dois milhoes de tuplas, por exemplo. Neste caso, teremos que fazer 2.000.000 de acessos ao arquivo. Enquanto que ao usar, acessaremos o arquivo somente uma vez e os dados ficarao na memoria ram a partir desse momento, que é mais rapida do que a memoria secundaria. Por isso, ainda estou convencido de que com o desempenho é melhor. ;)

mas ler linha por linha implica em varias operacoes de i/o. Isto representa um custo muito grande se o arquivo tiver dois milhoes de tuplas, por exemplo. Neste caso, teremos que fazer 2.000.000 de acessos ao arquivo.

Não são dois milhões de acessos ao arquivo. São tantos quantos o tamanho do buffer de leitura determinar. Aliás o tamanho do buffer é o terceiro parâmetro que pode ser passado para a função open(). Se omitido, o tamanho é o default do sistema. Se você passar um tamanho razoável, digamos 10 ou 100 mil bytes, o desempenho será muito bom.

Enquanto que ao usar, acessaremos o arquivo somente uma vez e os dados ficarao na memoria ram a partir desse momento, que é mais rapida do que a memoria secundaria. Por isso, ainda estou convencido de que com o desempenho é melhor. ;)

Não faça isso com um arquivo grande. Se o arquivo tiver um tamanho parecido ou maior que a memória disponível o sistema vai usar memória virtual e o desempenho vai despencar.

A otimização prematura é a raiz de muitos problemas em programação. Não otimize a não ser que você consiga provar com testes que a otimização vai ser importante. A otimização torna o seu código quebradiço e obscuro e geralmente não vale a pena. Este é um dos mandamentos da boa prática de programação e quem já passou sufocos aprendeu a respeitar.

O erro de algoritmo do seu código, difícil de achar, foi exatamente por quebrar esta regra. Isto com um programa de poucas linhas. Imagine quando voce estiver envolvido com um sistema de milhares ou dezenas de milhares de linhas. Escreva códigos simples e claros. Deixe a esperteza para as horas certas.

Guest - MarcelComputacao -

é possivel aumentar o desempenho desse programa, caso o arquivo de entrada seja maior ? :unsure: usando threads ? :) tem alguma ideia de como eu poderia fazer isso ? :blink:

Dado este arquivo com os campos separados por tab:

alexandre    456123789
anderson    1245698456
antonio    123456456
carlos    91257581
cesar    987458
rosemary    789456125
Eu faria assim:
espaco_ocupado_total = 0
lista = []
MB = 1024 * 1024

f = open('usuarios_tab.txt', 'r')
for linha in f:
   lista[-1][1] = float(lista[-1][1])
   espaco_ocupado_total += lista[-1][1]

lista.sort(None,key=lambda l: l[1])
for linha in lista:
   print '%s\t%.2f\t%.2f' % (
      linha[1] / MB,
      100 * linha[1] / espaco_ocupado_total

Duas das muitas alternativas são usar CGI ou mod_python. Se você lê ou adivinha ou pouco de inglês consulte o meu tutorial:

Também deve existir muita coisa em português no site do python Brasil.

Tente fazer alguma coisa. Se não der certo poste aqui o que você tentou que a gente ajuda.

estou tentando usar o mod_python e quando eu testo o programa:

def index():
   s = """\
<h2>Hello World!</h2>
   return s

ocorre o seguinte erro no navegador: :(

def index(): s = """\ 
Hello World!
""" return s

estou testando assim:


o que esta errado com meu teste ? :unsure:

Baixe e instale o mod_python daqui:

Adicione esta linha ao httpd.conf:

LoadModule python_module modules/
O caminho deve apontar para o diretório onde está o módulo a ser executado. De preferência um diretório dentro de htdocs. Eu testei no Windows porque provavelmente é o que você está usando:
<Directory "c:/arquivos de programas/xampp/htdocs/python">
   SetHandler mod_python
   PythonHandler mod_python.publisher
   PythonDebug On

fiz conforme voce sugeri kakao. Até instalei o xampp, mas agora está dando o erro abaixo quando eu executo da seguinte forma: http://localhost/xampp/python/. :(

Objeto não encontrado!

A URL requisitada não foi encontrada neste servidor. Se você digitou o endereço (URL) manualmente, por favor verifique novamente a sintaxe do endereço.

Se você acredita ter encontrado um problema no servidor, por favor entre em contato com o webmaster.

Error 404


11/14/06 15:47:35

Apache/2.2.3 (Win32) DAV/2 mod_ssl/2.2.3 OpenSSL/0.9.8d mod_autoindex_color PHP/5.2.0

o que pode ser isso ?

fiz conforme voce sugeri kakao. Até instalei o xampp, mas agora está dando o erro abaixo quando eu executo da seguinte forma: http://localhost/xampp/python/. :(

Ele só vai encontrar algo neste endereço se o nome do programa for Se não for você tem que passar o nome do programa:


ontem eu havia tentado tambem passando conforme você sugeriu agora, mas o erro era o mesmo. :(

Desculpe-me, mas tambem ocorreu um outro erro agora, com o xampp. Quando eu inicializo o xampp, eu coloquei para iniciar o apache como servico automaticamente, mas o apache não quer iniciar. Quando eu mando restartar o apache então ele fala que ocorreu um erro na linha 142 do arquivo httpd.conf e diz que não pode carregar o arquivo no servidor :(

eu fiz a instalacao do mod_python que voce falou e ao final da instalacao mandei carregar o mod_python no apache do diretorio xampp

Se o diretório Python é:

"c:/arquivos de programas/xampp/htdocs/python"

Então o endereço web vai ser:


É mais fácil se o diretório Python estiver em htdocs, caso contrário é necessário mudar a configuração do Apache.

Veja qual é a linha 142 e poste aqui.

apaguei o xampp, ele tava me causando muitos problemas :angry: e então baixei e instalei o VertrigoServ e agora o apache está funcionando beleza :D . Mas quando mudo as configuracoes do arquivo httpd.conf para executar scripts do python, aí dá pau no servidor e ele nem funciona quando eu digito localhost no browser. Apaguei as linhas de configuracao do python do httpd.conf e o apache voltou a funcionar. O que pode estar acontecendo ? :(

Existe uma versão de instalação do mod_python para cada versão do Apache. Se você mudou a versão do Apache quando instalou o XAMPP o mod_python não vai mais funcionar.

Para ver a versão do apache que está instalada abra uma janela DOS e:

C:\Documents and Settings\cpn>"C:\Arquivos de programas\xampp\apache\bin\httpd.exe" -v
Server version: Apache/2.2.3
Server built:   Aug 13 2006 19:16:43

Depois baixe e instale a versão do mod_python correspondente.

