[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Xeon quad - desempenho no debian



Quanto ao kernel, não há problema pois os processadores são EMT64 e não há distinćão entre o kernel para AMD ou intel nesse caso (amd64 equivalente a emt64 a grosso modo). Quanto aos fatores externos das máquinas, as duas têm placas-mãe similares, intel. As memórias são ECC 533MHZ, ambas dual channel. Certo, vamos ver abaixo as saídas do top e htop para cada maquina. Só lembrando que a quad E5345 são quatro nucleos por porcessador e a 5140 dois núcleos por processador. Mas pensando de maneira grosseira, mesmo sendo a aplicacao serial e usando apenas um processador em casa maquina, a tecnologia de cada nucleo do E5345 é melhor que a do 5140, logo a E5345 era para ser mais rapida que a 5140 com condićões similares do restante do hardware. Outra coisa que não compreendi em uma das sugestões foi como o 5140 pode estar trabalhando mais que o 5345, sendo que dei o mesmo nice para cada processo e não fiz nada diferente e as máquinas são dedicadas a esses processos. Como posso deixar cada processor extrair o máximo de capacidade de processamento? Quando temos várias máquinas diferentes podemos montar um tipo cluster e rodar aplicaćões em paralelo com MPI com exemplo, isso não é possível e máquinas como muitos núcleos como o quad ou os dual core? Obrigado pelos comentários.

quad E5345

top - 10:45:59 up 23:29,  1 user,  load average: 0.97, 0.97, 0.99
Tasks: 124 total,   3 running, 121 sleeping,   0 stopped,   0 zombie
Cpu0  :  0.3%us,  0.0%sy,  0.0%ni, 99.7%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu1  :  0.0%us,  0.0%sy,  0.0%ni,100.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu2  :  0.0%us,  0.0%sy,100.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu3  :  0.0%us,  0.0%sy,  0.0%ni,100.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu4  :  0.0%us,  0.0%sy,  0.0%ni,100.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu5  :  0.0%us,  0.0%sy,  0.0%ni,100.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu6  :  0.0%us,  0.0%sy,  0.0%ni,100.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu7  :  0.0%us,  0.0%sy,  0.0%ni,100.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Mem:   8175036k total,  2746304k used,  5428732k free,    25760k buffers
Swap:  2040212k total,        0k used,  2040212k free,   421468k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
 7218 scarara   27   2 2192m 2.1g 3064 R  100 27.0   1017:46 siesta-machado
    1 root      15   0  6124  684  564 S    0  0.0   0:04.61 init
    2 root      RT   0     0    0    0 S    0  0.0   0:00.00 migration/0
    3 root      34  19     0    0    0 S    0  0.0   0:00.00 ksoftirqd/0
    4 root      RT   0     0    0    0 S    0  0.0   0:00.00 watchdog/0
    5 root      RT   0     0    0    0 S    0  0.0   0:00.00 migration/1
    6 root      34  19     0    0    0 S    0  0.0   0:00.00 ksoftirqd/1
    7 root      RT   0     0    0    0 S    0  0.0   0:00.00 watchdog/1
    8 root      RT   0     0    0    0 S    0  0.0   0:00.00 migration/2
    9 root      34  19     0    0    0 S    0  0.0   0:00.00 ksoftirqd/2
   10 root      RT   0     0    0    0 S    0  0.0   0:00.00 watchdog/2

saida htop

  1  [|                         0.7%]     Tasks: 40 total, 2 running
  2  [                          0.0%]     Load average: 0.99 0.97 0.99
  3  [                          0.0%]     Uptime: 23:32:48
  4  [                          0.0%]
  5  [                          0.0%]
  6  [                          0.0%]
  7  [||||||||||||||||||||||||100.0%]
  8  [                          0.0%]
  Mem[||||||||||         1829/7983MB]
  Swp[                      0/1992MB]

  PID USER     PRI  NI  VIRT   RES   SHR S CPU% MEM%   TIME+  Command
 7218 scarara   27   2 1774M 1740M  3064 R 100. 23.8 17h01:27
siesta-machado
15397 jonathan  15   0 12060  1448  1096 R  0.0  0.0  0:00.11 htop
15366 jonathan  15   0 35748  2068  1312 S  0.0  0.0  0:00.01 sshd:
jonathan@pts    1 root      15   0  6124   684   564 S  0.0  0.0 
0:04.61 init [2]
 1651 root      21  -4 10604   756   328 S  0.0  0.0  0:00.09 udevd
--daemon
 2609 daemon    15   0  4820   520   404 S  0.0  0.0  0:00.01
/sbin/portmap
 2845 root      15   0  3728   636   504 S  0.0  0.0  0:00.06
/sbin/syslogd
 2851 root      15   0  2656   388   308 S  0.0  0.0  0:00.00
/sbin/klogd -x


Para CPU 5140
top - 13:53:55 up 23:38,  2 users,  load average: 2.99, 2.97, 2.91
Tasks:  97 total,   5 running,  92 sleeping,   0 stopped,   0 zombie
Cpu0  :  0.0%us,  0.0%sy,100.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu1  :  0.0%us,  0.0%sy,  0.0%ni,100.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu2  :  0.0%us,  0.0%sy,100.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu3  :  0.0%us,  0.0%sy,100.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Mem:   8175548k total,  4240636k used,  3934912k free,    41428k buffers
Swap:  1951888k total,        0k used,  1951888k free,   183488k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
 3736 joice     27   2 1035m 1.0g 3180 R  100 12.6   1379:52 siestamkl64
 4997 jonathan  27   2  883m 856m 3168 R  100 10.7   1188:44 siestaimklamd64
 6090 scarara   27   2 2009m 1.9g 3064 R  100 24.7   1034:49 siesta-rosa
14356 jonathan  15   0 10604 1388 1032 R    0  0.0   0:00.01 top
    1 root      15   0  6124  684  564 S    0  0.0   0:03.82 init
    2 root      RT   0     0    0    0 S    0  0.0   0:00.01 migration/0
    3 root      34  19     0    0    0 S    0  0.0   0:00.00 ksoftirqd/0
    4 root      RT   0     0    0    0 S    0  0.0   0:00.00 watchdog/0
    5 root      RT   0     0    0    0 S    0  0.0   0:00.00 migration/1
    6 root      34  19     0    0    0 S    0  0.0   0:00.00 ksoftirqd/1
    7 root      RT   0     0    0    0 S    0  0.0   0:00.00 watchdog/1
    8 root      RT   0     0    0    0 S    0  0.0   0:00.00 migration/2
    9 root      34  19     0    0    0 S    0  0.0   0:00.00 ksoftirqd/2
   10 root      RT   0     0    0    0 S    0  0.0   0:00.00 watchdog/2
   11 root      RT   0     0    0    0 S    0  0.0   0:00.00 migration/3
   12 root      34  19     0    0    0 S    0  0.0   0:00.00 ksoftirqd/3


saida htop

  1  [||||||||||||||||||||||||100.0%]     Tasks: 46 total, 4 running
  2  [                          0.0%]     Load average: 2.99 2.97 2.91
  3  [||||||||||||||||||||||||100.0%]     Uptime: 23:39:00
  4  [||||||||||||||||||||||||100.0%]
  Mem[|||||||||||||||||  3924/7983MB]
  Swp[                      0/1906MB]

  PID USER     PRI  NI  VIRT   RES   SHR S CPU% MEM%   TIME+  Command
 3736 joice     27   2 1035M 1007M  3180 R 100.  6.4 23h00:37
siestamkl64
 6090 scarara   27   2 2009M 1974M  3064 R 100. 12.6 17h15:34
siesta-rosa
 4997 jonathan  27   2  883M  856M  3168 R 99.5  5.5 19h49:28
/usr/local/siesta/14395 jonathan  15   0 12056  1444  1092 R  0.7  0.0 
0:00.04 htop
14356 jonathan  16   0 10604  1388  1032 S  0.0  0.0  0:00.03 top
    1 root      15   0  6124   684   564 S  0.0  0.0  0:03.82 init [2]
 1451 root      21  -4 10604   740   328 S  0.0  0.0  0:00.04 udevd
--daemon
 2288 daemon    15   0  4824   500   376 S  0.0  0.0  0:00.01
/sbin/portmap















Junior Polegato - Linux <linux@juniorpolegato.com.br> escreveu:
Jonathan Martins escreveu:
> Ola pessoal,
>
> Tenho aqui duas maquinas, uma com dois processadores Intel(R) Xeon(R)
> CPU 5140 @ 2.33GHz 8GB ram disco rigido 80GB SAS e outra com dois
> processadores quad Intel(R) Xeon(R) CPU E5345 @ 2.33GHz 8GB de ram e
> disco rigido SAS 80GB, as duas com 4MB de cache. A quad é bem melhor,
> em tese, que a 5140. As duas estao com debian etch, kernel
> 2.6.18-4-amd64. Os 8GB de ram estão reconhecidos corretamente, tudo
> certinho. Essa máquina é utilizada para cálculos pesados, baseados em
> aplicaÄ?ões feitas em fortran. "rodando" aplicaÄ?ões semelhantes nas
> duas máquinas estou percebendo que a quad E5345 está mais lenta que a
> 5140, mas teoricamente a quad é bem superior! O uso o compilador intel
> fortran 9.1. Isso não é estranho? Gostaria de ouvir a opinião de
> colegas sobre como entender o uso dos processadores no quad core, já
> que cada pastilha tem 4 nucleos, é como se fossem processadores em
> paralelo? Se eu utilizar uma aplicaÄ?ão serial essa aplicaÄ?ão vai
> utilizar apelas um dos processadores e ou outros ficarão ociosos?
> Vejam a saida do top de cada um dos processadores
>
> E5345
> Cpu(s): 0.0%us, 0.0%sy, 25.1%ni, 74.9%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
>
> 5140
> Cpu(s): 0.0%us, 0.0%sy, 75.0%ni, 25.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
>
> Mesmo rodando uma aplicaÄ?ão serial, para os processadores elas são
> distribuidas paralelamente? Se ela utiliza apenas um processador, tem
> como fazer essa paralelizaÄ?ão, como se fosse um cluster? Alguém tem
> alguma sugestão para eu investigar o porquê do desempenho mais baixo
> do quad core em relaÄ?ão a um dual core, sendo que o resto do hardware
> é semelhante (inclusive a taxa de transferência de dados do disco
> rigido, 7200rpm)?
> Grato pelos comentários e sugestões.

Olá,

Vê-se pelas linhas das CPUs que todo o processamento está me "nice"
(xx.x%ni), o que não é bom se realmente seu programa está rodando, pois
"qualquer" outro processo ganhará prioridade de execução. Nota-se que no
5140 o não-processamento (idle) está em 25,0% (25.0%id) e no E5345 está
em 74,9% (74.9%id), o que significa que o 5140 está trabalhando mais
(75%) que o E5345 (25%), porém, a grosso modo, o E5345 tem o dobro do
poder de processamento se o 5140 for de 1 núcleo ou 4x se for de 2
núcleos. Supondo que o 5140 seja de 2 núcleos (não vou procurar saber
agora), então, comparando com o E5345, este estaria com 38% versus 25%,
sendo portanto mais rápido. Supondo que o 5140 seja de 1 núcleo, então,
comparando com o E5345, este estaria com 19% versus 25%, sendo portanto
mais lento. Creio que tenha dado para entender a idéia a grosso modo.
Acho que deve colocar o processo em nível usuário com prioridade mais
alta, isso seria um ganho, porém vê-se que o processamento não chega a
100%, o que implica que o gargalo não é o processamento e sim outra
coisa, provavelmente inerente à placa mãe, memória, HD, etc.
Quanto ao programa seqüencial, este é alternado entre as CPUs, mas não
tem suas partes executadas em paralelo, o que implica que este programa
terá (teoricamente) o mesmo tempo de processamento em 1 CPU de
velocidade X como em n CPUs de mesma velocidade.

--
Atenciosamente,

Junior Polegato

Um peregrino de problemas; Um pergaminho de soluções!
Página Profissional: http://www.juniorpolegato.com.br


--
To UNSUBSCRIBE, email to debian-user-portuguese-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org




J. R. Martins

Linux user number 388562

__________________________________________________
Fale com seus amigos de graça com o novo Yahoo! Messenger
http://br.messenger.yahoo.com/


Reply to: