Re: Xeon quad - desempenho no debian
Quanto ao kernel, não há problema pois os processadores são EMT64 e não há distinćão entre o kernel para AMD ou intel nesse caso (amd64 equivalente a emt64 a grosso modo). Quanto aos fatores externos das máquinas, as duas têm placas-mãe similares, intel. As memórias são ECC 533MHZ, ambas dual channel. Certo, vamos ver abaixo as saídas do top e htop para cada maquina. Só lembrando que a quad E5345 são quatro nucleos por porcessador e a 5140 dois núcleos por processador. Mas pensando de maneira grosseira, mesmo sendo a aplicacao serial e usando apenas um processador em casa maquina, a tecnologia de cada nucleo do E5345 é melhor que a do 5140, logo a E5345 era para ser mais rapida que a 5140 com condićões similares do restante do hardware. Outra coisa que não compreendi em uma das sugestões foi como o 5140 pode estar trabalhando mais que o 5345, sendo que dei o mesmo nice para cada processo e não fiz nada diferente e as máquinas são dedicadas a esses processos. Como
posso deixar cada processor extrair o máximo de capacidade de processamento? Quando temos várias máquinas diferentes podemos montar um tipo cluster e rodar aplicaćões em paralelo com MPI com exemplo, isso não é possível e máquinas como muitos núcleos como o quad ou os dual core? Obrigado pelos comentários.
quad E5345
top - 10:45:59 up 23:29, 1 user, load average: 0.97, 0.97, 0.99
Tasks: 124 total, 3 running, 121 sleeping, 0 stopped, 0 zombie
Cpu0 : 0.3%us, 0.0%sy, 0.0%ni, 99.7%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu1 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu2 : 0.0%us, 0.0%sy,100.0%ni, 0.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu3 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi,
0.0%si, 0.0%st
Cpu4 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu5 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu6 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu7 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 8175036k total, 2746304k used, 5428732k free, 25760k buffers
Swap: 2040212k total, 0k used, 2040212k free, 421468k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
7218 scarara 27 2 2192m 2.1g 3064 R 100
27.0 1017:46 siesta-machado
1 root 15 0 6124 684 564 S 0 0.0 0:04.61 init
2 root RT 0 0 0 0 S 0 0.0 0:00.00 migration/0
3 root 34 19 0 0 0 S 0 0.0 0:00.00 ksoftirqd/0
4 root RT 0 0 0 0 S 0 0.0 0:00.00 watchdog/0
5 root RT 0 0 0 0 S 0
0.0 0:00.00 migration/1
6 root 34 19 0 0 0 S 0 0.0 0:00.00 ksoftirqd/1
7 root RT 0 0 0 0 S 0 0.0 0:00.00 watchdog/1
8 root RT 0 0 0 0 S 0 0.0 0:00.00 migration/2
9 root 34 19 0 0 0 S 0 0.0 0:00.00 ksoftirqd/2
10 root RT 0 0 0 0
S 0 0.0 0:00.00 watchdog/2
saida htop
1 [| 0.7%] Tasks: 40 total, 2 running
2 [ 0.0%] Load average: 0.99 0.97 0.99
3 [ 0.0%] Uptime: 23:32:48
4 [ 0.0%]
5
[ 0.0%]
6 [ 0.0%]
7 [||||||||||||||||||||||||100.0%]
8 [ 0.0%]
Mem[|||||||||| 1829/7983MB]
Swp[ 0/1992MB]
PID USER PRI NI VIRT RES SHR S CPU% MEM% TIME+ Command
7218 scarara
27 2 1774M 1740M 3064 R 100. 23.8 17h01:27
siesta-machado
15397 jonathan 15 0 12060 1448 1096 R 0.0 0.0 0:00.11 htop
15366 jonathan 15 0 35748 2068 1312 S 0.0 0.0 0:00.01 sshd:
jonathan@pts 1 root 15 0 6124 684 564 S 0.0 0.0
0:04.61 init [2]
1651 root 21 -4 10604 756 328 S 0.0 0.0 0:00.09 udevd
--daemon
2609 daemon 15 0 4820 520 404 S 0.0 0.0 0:00.01
/sbin/portmap
2845 root 15 0 3728 636 504 S 0.0 0.0 0:00.06
/sbin/syslogd
2851
root 15 0 2656 388 308 S 0.0 0.0 0:00.00
/sbin/klogd -x
Para CPU 5140
top - 13:53:55 up 23:38, 2 users, load average: 2.99, 2.97, 2.91
Tasks: 97 total, 5 running, 92 sleeping, 0 stopped, 0 zombie
Cpu0 : 0.0%us, 0.0%sy,100.0%ni, 0.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu1 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu2 : 0.0%us, 0.0%sy,100.0%ni, 0.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu3 : 0.0%us, 0.0%sy,100.0%ni, 0.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 8175548k total, 4240636k used, 3934912k free, 41428k buffers
Swap:
1951888k total, 0k used, 1951888k free, 183488k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
3736 joice 27 2 1035m 1.0g 3180 R 100 12.6 1379:52 siestamkl64
4997 jonathan 27 2 883m 856m 3168 R 100 10.7 1188:44 siestaimklamd64
6090 scarara 27 2 2009m 1.9g 3064 R 100 24.7 1034:49 siesta-rosa
14356 jonathan 15 0 10604 1388 1032 R 0 0.0 0:00.01 top
1 root 15 0 6124 684 564 S 0 0.0 0:03.82 init
2 root RT
0 0 0 0 S 0 0.0 0:00.01 migration/0
3 root 34 19 0 0 0 S 0 0.0 0:00.00 ksoftirqd/0
4 root RT 0 0 0 0 S 0 0.0 0:00.00 watchdog/0
5 root RT 0 0 0 0 S 0 0.0 0:00.00 migration/1
6 root 34 19 0 0 0 S 0 0.0 0:00.00 ksoftirqd/1
7
root RT 0 0 0 0 S 0 0.0 0:00.00 watchdog/1
8 root RT 0 0 0 0 S 0 0.0 0:00.00 migration/2
9 root 34 19 0 0 0 S 0 0.0 0:00.00 ksoftirqd/2
10 root RT 0 0 0 0 S 0 0.0 0:00.00 watchdog/2
11 root RT 0 0 0 0 S 0 0.0 0:00.00
migration/3
12 root 34 19 0 0 0 S 0 0.0 0:00.00 ksoftirqd/3
saida htop
1 [||||||||||||||||||||||||100.0%] Tasks: 46 total, 4 running
2 [ 0.0%] Load average: 2.99 2.97 2.91
3 [||||||||||||||||||||||||100.0%] Uptime: 23:39:00
4 [||||||||||||||||||||||||100.0%]
Mem[||||||||||||||||| 3924/7983MB]
Swp[ 0/1906MB]
PID USER PRI NI
VIRT RES SHR S CPU% MEM% TIME+ Command
3736 joice 27 2 1035M 1007M 3180 R 100. 6.4 23h00:37
siestamkl64
6090 scarara 27 2 2009M 1974M 3064 R 100. 12.6 17h15:34
siesta-rosa
4997 jonathan 27 2 883M 856M 3168 R 99.5 5.5 19h49:28
/usr/local/siesta/14395 jonathan 15 0 12056 1444 1092 R 0.7 0.0
0:00.04 htop
14356 jonathan 16 0 10604 1388 1032 S 0.0 0.0 0:00.03 top
1 root 15 0 6124 684 564 S 0.0 0.0 0:03.82 init [2]
1451 root 21 -4 10604 740 328 S 0.0 0.0 0:00.04 udevd
--daemon
2288 daemon 15 0 4824 500 376 S 0.0 0.0 0:00.01
/sbin/portmap
Junior Polegato - Linux <linux@juniorpolegato.com.br> escreveu: Jonathan Martins escreveu:
> Ola pessoal,
>
> Tenho aqui duas maquinas, uma com dois processadores Intel(R) Xeon(R)
> CPU 5140 @ 2.33GHz 8GB ram disco rigido 80GB SAS e outra com dois
> processadores quad Intel(R) Xeon(R) CPU E5345 @ 2.33GHz 8GB de ram e
> disco rigido SAS 80GB, as duas com 4MB de cache. A quad é bem melhor,
> em tese, que a 5140. As duas estao com debian etch, kernel
> 2.6.18-4-amd64. Os 8GB de ram estão reconhecidos corretamente, tudo
> certinho. Essa máquina é utilizada
para cálculos pesados, baseados em
> aplicaÄ?ões feitas em fortran. "rodando" aplicaÄ?ões semelhantes nas
> duas máquinas estou percebendo que a quad E5345 está mais lenta que a
> 5140, mas teoricamente a quad é bem superior! O uso o compilador intel
> fortran 9.1. Isso não é estranho? Gostaria de ouvir a opinião de
> colegas sobre como entender o uso dos processadores no quad core, já
> que cada pastilha tem 4 nucleos, é como se fossem processadores em
> paralelo? Se eu utilizar uma aplicaÄ?ão serial essa aplicaÄ?ão vai
> utilizar apelas um dos processadores e ou outros ficarão ociosos?
> Vejam a saida do top de cada um dos processadores
>
> E5345
> Cpu(s): 0.0%us, 0.0%sy, 25.1%ni, 74.9%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
>
> 5140
> Cpu(s): 0.0%us, 0.0%sy, 75.0%ni, 25.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
>
> Mesmo rodando uma aplicaÄ?ão serial, para
os processadores elas são
> distribuidas paralelamente? Se ela utiliza apenas um processador, tem
> como fazer essa paralelizaÄ?ão, como se fosse um cluster? Alguém tem
> alguma sugestão para eu investigar o porquê do desempenho mais baixo
> do quad core em relaÄ?ão a um dual core, sendo que o resto do hardware
> é semelhante (inclusive a taxa de transferência de dados do disco
> rigido, 7200rpm)?
> Grato pelos comentários e sugestões.
Olá,
Vê-se pelas linhas das CPUs que todo o processamento está me "nice"
(xx.x%ni), o que não é bom se realmente seu programa está rodando, pois
"qualquer" outro processo ganhará prioridade de execução. Nota-se que no
5140 o não-processamento (idle) está em 25,0% (25.0%id) e no E5345 está
em 74,9% (74.9%id), o que significa que o 5140 está trabalhando mais
(75%) que o E5345 (25%), porém, a grosso modo, o E5345 tem o dobro do
poder de
processamento se o 5140 for de 1 núcleo ou 4x se for de 2
núcleos. Supondo que o 5140 seja de 2 núcleos (não vou procurar saber
agora), então, comparando com o E5345, este estaria com 38% versus 25%,
sendo portanto mais rápido. Supondo que o 5140 seja de 1 núcleo, então,
comparando com o E5345, este estaria com 19% versus 25%, sendo portanto
mais lento. Creio que tenha dado para entender a idéia a grosso modo.
Acho que deve colocar o processo em nÃvel usuário com prioridade mais
alta, isso seria um ganho, porém vê-se que o processamento não chega a
100%, o que implica que o gargalo não é o processamento e sim outra
coisa, provavelmente inerente à placa mãe, memória, HD, etc.
Quanto ao programa seqüencial, este é alternado entre as CPUs, mas não
tem suas partes executadas em paralelo, o que implica que este programa
terá (teoricamente) o mesmo tempo de processamento em 1 CPU de
velocidade X como
em n CPUs de mesma velocidade.
--
Atenciosamente,
Junior Polegato
Um peregrino de problemas; Um pergaminho de soluções!
Página Profissional: http://www.juniorpolegato.com.br
--
To UNSUBSCRIBE, email to debian-user-portuguese-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org
J. R. Martins
Linux user number 388562
__________________________________________________
Fale com seus amigos de graça com o novo Yahoo! Messenger
http://br.messenger.yahoo.com/
Reply to: