Производительность процессора

Обмен опытом по установке Линукс на разные аппаратные конфигурации

Модераторы: Olej, vikos

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

Производительность процессора

Непрочитанное сообщение Olej » 26 апр 2019, 11:47

Здесь уже давно была тема, например, Производительность диска, или, например, относительно сети Скорость сетевого соединения ... и т.д.
1. А как быть для сравнения производительности разных моделей процессоров?
2. Или, ещё интереснее бывает, как сравнить, по порядку величины, ожидаемую производительность совершенно разных типов процессоров ... например Intel X86_64 vs 32-битного ARM?
3. Тем более, что реальная производительность определяется не столько даже процессором, сколько кэш-памятью: а). числом её уровней, б). размером на каждом уровне, в). скоростью и эффективностью аппаратного использования на каждом уровне.

P.S. Совершенно понятно, что "производительность процессора" - совершенно условная вещь + сравнение 2-х разных процессоров будет сильно отличаться на разных классах задач... Вопрос только в оценке порядка величины: будет ли процессор А производительнее процессора Б в 10 раз или нет?

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

Re: Производительность процессора

Непрочитанное сообщение Olej » 26 апр 2019, 11:51

Olej писал(а): 1. А как быть для сравнения производительности разных моделей процессоров?
Иногда, по простоте душевной, заглядываются на BogoMIPS:

Код: Выделить всё

olej@ACER:~$ lscpu
Архитектура:         x86_64
CPU op-mode(s):      32-bit, 64-bit
Порядок байт:        Little Endian
Address sizes:       39 bits physical, 48 bits virtual
CPU(s):              2
On-line CPU(s) list: 0,1
Thread(s) per core:  1
Ядер на сокет:       2
Сокетов:             1
NUMA node(s):        1
ID прроизводителя:   GenuineIntel
Семейство ЦПУ:       6
Модель:              60
Имя модели:          Intel(R) Celeron(R) CPU G1840 @ 2.80GHz
Степпинг:            3
CPU MHz:             2304.031
CPU max MHz:         2800,0000
CPU min MHz:         800,0000
BogoMIPS:            5586.91
Виртуализация:       VT-x
L1d cache:           32K
L1i cache:           32K
L2 cache:            256K
L3 cache:            2048K
NUMA node0 CPU(s):   0,1
Флаги:               fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx pdpe1gb rdtscp lm constant_tsc arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc cpuid aperfmperf pni pclmulqdq dtes64 monitor ds_cpl vmx est tm2 ssse3 sdbg cx16 xtpr pdcm pcid sse4_1 sse4_2 movbe popcnt xsave rdrand lahf_lm abm cpuid_fault epb invpcid_single pti tpr_shadow vnmi flexpriority ept vpid ept_ad fsgsbase tsc_adjust erms invpcid xsaveopt dtherm arat pln pts
Но это вообще не показатель скорости - это то, сколько пустых циклов (NOP) процессор выполнит в секунду... Для Intel x86 - это удвоенная цифра тактовой частоты, а для ARM - это вообще неизвестно что!

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

Re: Производительность процессора

Непрочитанное сообщение Olej » 14 сен 2019, 20:31

Код: Выделить всё

olej@ACER:/usr/lib/lmbench/bin/x86_64-linux-gnu$ sudo apt install hardinfo
[sudo] пароль для olej:
Чтение списков пакетов… Готово
Построение дерева зависимостей       
Чтение информации о состоянии… Готово
Следующие НОВЫЕ пакеты будут установлены:
  hardinfo
Обновлено 0 пакетов, установлено 1 новых пакетов, для удаления отмечено 0 пакетов, и 1 пакетов не обновлено.
Необходимо скачать 322 kB архивов.
После данной операции объём занятого дискового пространства возрастёт на 890 kB.
Пол:1 http://deb.debian.org/debian buster/main amd64 hardinfo amd64 0.5.1+git20180227-2 [322 kB]
Получено 322 kB за 0с (753 kB/s)
Выбор ранее не выбранного пакета hardinfo.
(Чтение базы данных … на данный момент установлено 410369 файлов и каталогов.)
Подготовка к распаковке …/hardinfo_0.5.1+git20180227-2_amd64.deb …
Распаковывается hardinfo (0.5.1+git20180227-2) …
Настраивается пакет hardinfo (0.5.1+git20180227-2) …
Обрабатываются триггеры для desktop-file-utils (0.23-4) …
Обрабатываются триггеры для mime-support (3.62) …
Обрабатываются триггеры для man-db (2.8.5-2) …
Изображение

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

Re: Производительность процессора

Непрочитанное сообщение Olej » 03 фев 2020, 15:45

Тесты Intel linpack x64 - производительность процессора на вычислительных операциях.
Можно взять здесь: Intel® Math Kernel Library
Sep 10, 2019
11.6 MB

Код: Выделить всё

olej@ACER:~/Загрузки$ ls -l l_mklb_p_2019.6.005.tgz 
-rw-r--r-- 1 olej olej 11877836 фев  3 14:46 l_mklb_p_2019.6.005.tgz

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

Re: Производительность процессора

Непрочитанное сообщение Olej » 03 фев 2020, 15:58

Если это всё хозяйство разархивировать и запустить для вот такого, к примеру, процессора:

Код: Выделить всё

olej@ACER:~/intel_linpack/benchmarks_2019/linux/mkl/benchmarks/linpack$ lscpu
Архитектура:         x86_64
CPU op-mode(s):      32-bit, 64-bit
Порядок байт:        Little Endian
Address sizes:       39 bits physical, 48 bits virtual
CPU(s):              2
On-line CPU(s) list: 0,1
Thread(s) per core:  1
Ядер на сокет:       2
Сокетов:             1
NUMA node(s):        1
ID прроизводителя:   GenuineIntel
Семейство ЦПУ:       6
Модель:              60
Имя модели:          Intel(R) Celeron(R) CPU G1840 @ 2.80GHz
Степпинг:            3
CPU MHz:             1736.930
CPU max MHz:         2800,0000
CPU min MHz:         800,0000
BogoMIPS:            5586.90
Виртуализация:       VT-x
L1d cache:           32K
L1i cache:           32K
L2 cache:            256K
L3 cache:            2048K
NUMA node0 CPU(s):   0,1
Флаги:               fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx pdpe1gb rdtscp lm constant_tsc arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc cpuid aperfmperf pni pclmulqdq dtes64 monitor ds_cpl vmx est tm2 ssse3 sdbg cx16 xtpr pdcm pcid sse4_1 sse4_2 movbe popcnt tsc_deadline_timer xsave rdrand lahf_lm abm cpuid_fault epb invpcid_single pti ssbd ibrs ibpb stibp tpr_shadow vnmi flexpriority ept vpid ept_ad fsgsbase tsc_adjust erms invpcid xsaveopt dtherm arat pln pts md_clear flush_l1d
То получим:

Код: Выделить всё

olej@ACER:~/intel_linpack/benchmarks_2019/linux/mkl/benchmarks/linpack$ ./runme_xeon64 
This is a SAMPLE run script for running a shared-memory version of
Intel(R) Distribution for LINPACK* Benchmark. Change it to reflect
the correct number of CPUs/threads, problem input files, etc..
*Other names and brands may be claimed as the property of others.
./runme_xeon64: 28: [: -gt: unexpected operator
Пн фев  3 14:51:43 EET 2020
Sample data file lininput_xeon64.

Current date/time: Mon Feb  3 14:51:43 2020

CPU frequency:    2.793 GHz
Number of CPUs: 1
Number of cores: 2
Number of threads: 2

Parameters are set to:

Number of tests: 15
Number of equations to solve (problem size) : 1000  2000  5000  10000 15000 18000 20000 22000 25000 26000 27000 30000 35000 40000 45000
Leading dimension of array                  : 1000  2000  5008  10000 15000 18008 20016 22008 25000 26000 27000 30000 35000 40000 45000
Number of trials to run                     : 4     2     2     2     2     2     2     2     2     2     1     1     1     1     1    
Data alignment value (in Kbytes)            : 4     4     4     4     4     4     4     4     4     4     4     1     1     1     1    

Maximum memory requested that can be used=16200901024, at the size=45000

=================== Timing linear equation system solver ===================

Size   LDA    Align. Time(s)    GFlops   Residual     Residual(norm) Check
1000   1000   4      0.050      13.3139  9.180157e-13 3.130669e-02   pass
1000   1000   4      0.050      13.3163  9.180157e-13 3.130669e-02   pass
1000   1000   4      0.044      15.1536  9.180157e-13 3.130669e-02   pass
1000   1000   4      0.046      14.4407  9.180157e-13 3.130669e-02   pass
2000   2000   4      0.311      17.1975  4.632739e-12 4.029915e-02   pass
2000   2000   4      0.318      16.8034  4.632739e-12 4.029915e-02   pass
5000   5008   4      5.158      16.1656  2.211803e-11 3.084181e-02   pass
5000   5008   4      4.882      17.0797  2.211803e-11 3.084181e-02   pass
10000  10000  4      36.657     18.1919  9.308554e-11 3.282290e-02   pass
10000  10000  4      35.662     18.6998  9.308554e-11 3.282290e-02   pass
^C

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

Re: Производительность процессора

Непрочитанное сообщение Olej » 03 фев 2020, 16:08

Olej писал(а):
03 фев 2020, 15:58
для вот такого, к примеру, процессора:
А вот здесь, на страничке продавца процессоров - НИКС - имеем сравнительную табличку по GFlops + Цена(руб.) (что особенно представляет интерес! ;-) - "цена/качество") для разных типов процессоров.
Начиная с 8.62 GFlops и до 131.8 GFlops.

Там же находим процессор близкий к тестируемому:
Процессор CPU Intel Celeron G1620 2.7 GHz / 2core / SVGA HD Graphics / 0.5+2Mb / 55W / 5 GT / s LGA1155

И для него их значение 17.62 GFlops, что близко к результатам нашего теста.

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

Re: Производительность процессора

Непрочитанное сообщение Olej » 03 фев 2020, 16:15

Olej писал(а):
03 фев 2020, 15:58
Если это всё хозяйство разархивировать и запустить для вот такого, к примеру, процессора:
Там же, в комплекте, ещё 2 группы тестов от Intel:

Код: Выделить всё

olej@ACER:~/intel_linpack/benchmarks_2019/linux/mkl$ ls -l benchmarks 
итого 12
drwxr-xr-x 5 olej olej 4096 окт 18 17:29 hpcg
drwxr-xr-x 2 olej olej 4096 фев  3 14:51 linpack
drwxr-xr-x 2 olej olej 4096 окт 18 17:29 mp_linpack
Вот что об этом пишут в readme.txt архива:
This package contains the Intel(R) Distribution for LINPACK* Benchmark,
and Intel(R) Optimized High Performance Conjugate Gradient Benchmark
for Linux* OS.

Please refer to the chapter "LINPACK, MP LINPACK, and HPCG Benchmarks" in
online version of Intel(R) Math Kernel Library (Intel(R) MKL) User's Guide
(http://software.intel.com/en-us/mkl-for-linux-userguide) and readme files
in individual benchmark directories for usage instructions.
А по указанному URL находим детальное описание и руководство пользоватля по всем тестам - Developer Guide for Intel® oneAPI Math Kernel Library for Linux (Beta)
Отправлено: ноября 14, 2019

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

Re: Производительность процессора

Непрочитанное сообщение Olej » 03 фев 2020, 16:58

Для разнообразия + несколько других процессоров (+ и других дистрибутивов Linux):

Код: Выделить всё

olej@nvidia:~/intel_linpack/benchmarks_2019/linux/mkl/benchmarks/linpack$ lscpu
Архитектура:         x86_64
CPU op-mode(s):      32-bit, 64-bit
Порядок байт:        Little Endian
CPU(s):              4
On-line CPU(s) list: 0-3
Потоков на ядро:     2
Ядер на сокет:       2
Сокетов:             1
NUMA node(s):        1
ID прроизводителя:   GenuineIntel
Семейство ЦПУ:       6
Модель:              37
Имя модели:          Intel(R) Core(TM) i5 CPU         660  @ 3.33GHz
Степпинг:            5
CPU МГц:             1283.626
CPU max MHz:         3326,0000
CPU min MHz:         1197,0000
BogoMIPS:            6649.87
Виртуализация:       VT-x
L1d cache:           32K
L1i cache:           32K
L2 cache:            256K
L3 cache:            4096K
NUMA node0 CPU(s):   0-3
Флаги:               fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc cpuid aperfmperf pni pclmulqdq dtes64 monitor ds_cpl vmx smx est tm2 ssse3 cx16 xtpr pdcm pcid sse4_1 sse4_2 popcnt aes lahf_lm pti ssbd ibrs ibpb stibp tpr_shadow vnmi flexpriority ept vpid dtherm ida arat flush_l1d

Код: Выделить всё

olej@nvidia:~/intel_linpack/benchmarks_2019/linux/mkl/benchmarks/linpack$ ./runme_xeon64 
This is a SAMPLE run script for running a shared-memory version of
Intel(R) Distribution for LINPACK* Benchmark. Change it to reflect
the correct number of CPUs/threads, problem input files, etc..
*Other names and brands may be claimed as the property of others.
./runme_xeon64: 28: [: -gt: unexpected operator
Пн фев  3 15:42:26 EET 2020
Sample data file lininput_xeon64.

Current date/time: Mon Feb  3 15:42:26 2020

CPU frequency:    2.048 GHz
Number of CPUs: 1
Number of cores: 2
Number of threads: 2

Parameters are set to:

Number of tests: 15
Number of equations to solve (problem size) : 1000  2000  5000  10000 15000 18000 20000 22000 25000 26000 27000 30000 35000 40000 45000
Leading dimension of array                  : 1000  2000  5008  10000 15000 18008 20016 22008 25000 26000 27000 30000 35000 40000 45000
Number of trials to run                     : 4     2     2     2     2     2     2     2     2     2     1     1     1     1     1    
Data alignment value (in Kbytes)            : 4     4     4     4     4     4     4     4     4     4     4     1     1     1     1    

Maximum memory requested that can be used=12800801024, at the size=40000

=================== Timing linear equation system solver ===================

Size   LDA    Align. Time(s)    GFlops   Residual     Residual(norm) Check
1000   1000   4      0.039      17.1185  9.180157e-13 3.130669e-02   pass
1000   1000   4      0.043      15.7289  9.180157e-13 3.130669e-02   pass
1000   1000   4      0.041      16.4066  9.180157e-13 3.130669e-02   pass
1000   1000   4      0.043      15.4766  9.180157e-13 3.130669e-02   pass
2000   2000   4      0.279      19.1263  4.632739e-12 4.029915e-02   pass
2000   2000   4      0.278      19.2062  4.632739e-12 4.029915e-02   pass
5000   5008   4      3.885      21.4647  2.211803e-11 3.084181e-02   pass
5000   5008   4      3.863      21.5848  2.211803e-11 3.084181e-02   pass
10000  10000  4      29.399     22.6831  9.308554e-11 3.282290e-02   pass
10000  10000  4      29.760     22.4079  9.308554e-11 3.282290e-02   pass
^C
Olej писал(а):
03 фев 2020, 16:08
на страничке продавца процессоров - НИКС
Процессор CPU Intel Core i5-4570 3.2 GHz / 4core / SVGA HD Graphics 4600 / 1+6Mb / 84W / 5 GT / s LGA1150 46.47
Здесь с ними существенное расхождение, в 2 раза ... но у меня старое поколение Intel i5 ...

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

Re: Производительность процессора

Непрочитанное сообщение Olej » 03 фев 2020, 17:05

Olej писал(а):
03 фев 2020, 16:58
Для разнообразия + несколько других процессоров
Это старенький серверный Intel Xeon:

Код: Выделить всё

[olej@xenix linpack]$ lscpu
Архитектура:         x86_64
CPU op-mode(s):      32-bit, 64-bit
Порядок байт:        Little Endian
Address sizes:       38 bits physical, 48 bits virtual
CPU(s):              4
On-line CPU(s) list: 0-3
Thread(s) per core:  1
Ядер на сокет:       4
Сокетов:             1
NUMA node(s):        1
ID прроизводителя:   GenuineIntel
Семейство ЦПУ:       6
Модель:              23
Имя модели:          Intel(R) Xeon(R) CPU           E5462  @ 2.80GHz
Степпинг:            6
CPU MHz:             1999.731
CPU max MHz:         2803,0000
CPU min MHz:         2403,0000
BogoMIPS:            4666.14
Виртуализация:       VT-x
L1d cache:           32K
L1i cache:           32K
L2 cache:            6144K
NUMA node0 CPU(s):   0-3
Флаги:               fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ht tm pbe syscall nx lm constant_tsc arch_perfmon pebs bts rep_good nopl cpuid aperfmperf pni dtes64 monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr pdcm dca sse4_1 lahf_lm pti tpr_shadow vnmi flexpriority dtherm

Код: Выделить всё

[olej@xenix linpack]$ ./runme_xeon64 
This is a SAMPLE run script for running a shared-memory version of
Intel(R) Distribution for LINPACK* Benchmark. Change it to reflect
the correct number of CPUs/threads, problem input files, etc..
*Other names and brands may be claimed as the property of others.
./runme_xeon64: строка 28: [: слишком много аргументов
Пн фев  3 15:44:41 EET 2020
Sample data file lininput_xeon64.

Current date/time: Mon Feb  3 15:44:41 2020

CPU frequency:    1.330 GHz
Number of CPUs: 1
Number of cores: 4
Number of threads: 4

Parameters are set to:

Number of tests: 15
Number of equations to solve (problem size) : 1000  2000  5000  10000 15000 18000 20000 22000 25000 26000 27000 30000 35000 40000 45000
Leading dimension of array                  : 1000  2000  5008  10000 15000 18008 20016 22008 25000 26000 27000 30000 35000 40000 45000
Number of trials to run                     : 4     2     2     2     2     2     2     2     2     2     1     1     1     1     1    
Data alignment value (in Kbytes)            : 4     4     4     4     4     4     4     4     4     4     4     1     1     1     1    

Maximum memory requested that can be used=7200601024, at the size=30000

=================== Timing linear equation system solver ===================

Size   LDA    Align. Time(s)    GFlops   Residual     Residual(norm) Check
1000   1000   4      0.034      19.5067  9.350298e-13 3.188692e-02   pass
1000   1000   4      0.032      20.7371  9.350298e-13 3.188692e-02   pass
1000   1000   4      0.032      20.5769  9.350298e-13 3.188692e-02   pass
1000   1000   4      0.033      20.3414  9.350298e-13 3.188692e-02   pass
2000   2000   4      0.213      25.0965  4.428513e-12 3.852264e-02   pass
2000   2000   4      0.210      25.4312  4.428513e-12 3.852264e-02   pass
5000   5008   4      2.851      29.2433  2.464584e-11 3.436664e-02   pass
5000   5008   4      2.863      29.1245  2.464584e-11 3.436664e-02   pass
10000  10000  4      20.372     32.7343  9.609760e-11 3.388499e-02   pass
10000  10000  4      20.384     32.7149  9.609760e-11 3.388499e-02   pass
15000  15000  4      67.245     33.4666  2.216813e-10 3.491517e-02   pass
15000  15000  4      67.164     33.5069  2.216813e-10 3.491517e-02   pass
18000  18008  4      115.355    33.7103  3.460971e-10 3.790188e-02   pass
18000  18008  4      115.424    33.6902  3.460971e-10 3.790188e-02   pass
20000  20016  4      158.007    33.7589  3.585702e-10 3.174132e-02   pass
20000  20016  4      157.697    33.8252  3.585702e-10 3.174132e-02   pass
^C

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

Re: Производительность процессора

Непрочитанное сообщение Olej » 03 фев 2020, 17:54

Olej писал(а):
03 фев 2020, 16:58
+ несколько других процессоров
Ноутбучный Intel i7 4-5-летней давности:

Код: Выделить всё

[olej@DELL linpack]$ lscpu
Архитектура:         x86_64
CPU op-mode(s):      32-bit, 64-bit
Порядок байт:        Little Endian
Address sizes:       36 bits physical, 48 bits virtual
CPU(s):              8
On-line CPU(s) list: 0-7
Thread(s) per core:  2
Ядер на сокет:       4
Сокетов:             1
NUMA node(s):        1
ID прроизводителя:   GenuineIntel
Семейство ЦПУ:       6
Модель:              30
Имя модели:          Intel(R) Core(TM) i7 CPU       Q 720  @ 1.60GHz
Степпинг:            5
CPU MHz:             956.225
CPU max MHz:         1600,0000
CPU min MHz:         933,0000
BogoMIPS:            3191.87
Виртуализация:       VT-x
L1d cache:           32K
L1i cache:           32K
L2 cache:            256K
L3 cache:            6144K
NUMA node0 CPU(s):   0-7
Флаги:               fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc cpuid aperfmperf pni dtes64 monitor ds_cpl vmx smx est tm2 ssse3 cx16 xtpr pdcm sse4_1 sse4_2 popcnt lahf_lm pti ssbd ibrs ibpb stibp tpr_shadow vnmi flexpriority ept vpid dtherm ida flush_l1d

Код: Выделить всё

[olej@DELL linpack]$ ./runme_xeon64 
This is a SAMPLE run script for running a shared-memory version of
Intel(R) Distribution for LINPACK* Benchmark. Change it to reflect
the correct number of CPUs/threads, problem input files, etc..
*Other names and brands may be claimed as the property of others.
./runme_xeon64: строка 28: [: слишком много аргументов
Пн фев  3 16:50:02 EET 2020
Sample data file lininput_xeon64.

Current date/time: Mon Feb  3 16:50:02 2020

CPU frequency:    1.595 GHz
Number of CPUs: 1
Number of cores: 4
Number of threads: 4

Parameters are set to:

Number of tests: 15
Number of equations to solve (problem size) : 1000  2000  5000  10000 15000 18000 20000 22000 25000 26000 27000 30000 35000 40000 45000
Leading dimension of array                  : 1000  2000  5008  10000 15000 18008 20016 22008 25000 26000 27000 30000 35000 40000 45000
Number of trials to run                     : 4     2     2     2     2     2     2     2     2     2     1     1     1     1     1    
Data alignment value (in Kbytes)            : 4     4     4     4     4     4     4     4     4     4     4     1     1     1     1    

Maximum memory requested that can be used=12800801024, at the size=40000

=================== Timing linear equation system solver ===================

Size   LDA    Align. Time(s)    GFlops   Residual     Residual(norm) Check
1000   1000   4      0.036      18.3937  1.104172e-12 3.765511e-02   pass
1000   1000   4      0.036      18.6366  1.104172e-12 3.765511e-02   pass
1000   1000   4      0.036      18.6420  1.104172e-12 3.765511e-02   pass
1000   1000   4      0.036      18.6591  1.104172e-12 3.765511e-02   pass
2000   2000   4      0.261      20.5003  5.204365e-12 4.527160e-02   pass
2000   2000   4      0.260      20.5071  5.204365e-12 4.527160e-02   pass
5000   5008   4      3.782      22.0469  2.122924e-11 2.960246e-02   pass
5000   5008   4      3.783      22.0441  2.122924e-11 2.960246e-02   pass
10000  10000  4      29.501     22.6052  9.308554e-11 3.282290e-02   pass
10000  10000  4      29.506     22.6007  9.308554e-11 3.282290e-02   pass
^C

Ответить

Вернуться в «Железо для Linux»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 6 гостей