Знайте, Intuit, лекция, оценка на представянето на касетъчни системи, които използват тест Linpack

5.4. Задача 3. Стартирайте тестовата Linpack

Ефективността. Linpack тест показва при решаване на система за линейни уравнения. по същество зависи не само от физическите характеристики на изчислителни възли (като възли процесори за изпълнение, включени в системата за компютри, размерите на памет, характеристиките на преносна среда, и т.н.), но също и от параметри на проблема - размерът на матрица, решетка топология , размер на блока, към който първоначалното вектор счупване и т.н.

Най-общо казано, броят на параметрите на проблема да повлияят на резултата (времеви решения, и в крайна сметка - индекс на ефективност) - е достатъчно големи. По този начин, тестване на тест компютърна система Linpack е пореден изпълнение на тестове, които се различават едни от други параметри на проблема, за да изберете такива параметри, на които тестът за тази конкретна компютърна система, показваща най-добрите резултати. Най-важните параметри, които имат максимален ефект върху резултатите от теста са: размер на матрицата, изчислителна параметър решетка топология. описва разпределението на вектори. Останалата част от опитните параметри, които също оказват влияние върху крайния резултат, но се смята, че този ефект е по-малък от този на по-горе параметри.

Като се има предвид всички по-горе, Linpack разработчиците тестови създаде така нареченият тест черупка. чиято мисия е последователното прилагане на серия от тестове, в съответствие с конкретния сценарий. сценарий за тестване, описана в HPL файл. DAT (по подразбиране трябва да бъде в същата директория, от които можете изпълнете тестовете), в което са посочени основните параметри на алгоритъма. За да се улесни тестване в HPL файл. DAT може да се прилага последователност от параметри, серия от тестове се извършва с всички посочени стойности.

По-долу е извадка конфигурационен файл HPL а. DAT за бенчмарка Linpack. който линии са номерирани за удобство

В съответствие 1.2 файл, използван за идентифициране на файл и повече никаква роля (трябва да се отбележи, че те са били прехвърлени в HPL.out резултат файл). Line 3.4 определи как ще бъде сключването на резултатите от тестовете. 5.6 линия включва измерение за прехвърляне на проблема да бъде решен по време на теста. Линии 7,8 определят различни изпълнения параметър NB. Трябва да се отбележи, че тестът е проектирано по такъв начин, че изброява всички възможни изпълнения, дадени параметри, като по този начин в продължение на три различни размери и два варианта NB тест шест пъти се изпълнява. Тъй като броят на различни параметри в конфигурационния файл е голям, че е необходимо да бъдат внимателни, да не забравят за тази функция. Линии 10,11,12 определят различни изпълнения на мрежа П Р, за които ще се извършват тестове. Линия 13 уточнява, постоянна. Останалите редове (14-31) определят други параметри на алгоритъм, който в този раздел не се счита.

Резултатът от теста е доста обемист файл. където за всеки набор от параметри, посочени в конфигурационния файл съдържа изпълнението постигната на теста, както и на разположение решения грешката.

По-долу е фрагмент от файла (в този пример работи се извършва на едно място):

Тъй като реално компютърната система, всеки отделен тест (решаване на специална система за линеен метод уравнения с добре определени параметри) отнема доста дълго време, интересен е въпросът, от които се задават параметрите в конфигурационния файл, така че, от една страна, изпълнява твърде много тестове, и, от друга страна, не пропускайте стойността на параметрите, на които се постигат оптимална работа.

Частична, отговорът на този въпрос е даден в документ HPL настройка (WWW съхранява в указателя, заедно с други документи на теста), част - на друго място (виж, например, [3] и [5].).

Очевидно е, че ние можем да формулираме следните практически правила:

  1. Тъй като общият ефект е повишаването на производителността по време проблем растеж измерение, измерение на проблема трябва да бъде максимално разрешения за размера на RAM, които притежават изчислителни възли (в излишък от количеството на наличната памет, обработва диск започва пейджинг, който драстично намалява производителността). Тъй като матрицата се разпределя между всички възли изчислителни, общият размер на матрицата трябва да съответства на тази "общо" обем памет на всички изчислителни възли. Тъй като матрицата се разпределя равномерно между възлите, възли с по-малък размер на RAM, може да намали общата производителност на системата.
  2. Очевидно е, че най-добрите фигури изпълнение са постигнати за решетки или "най-тясната" (вид 1hN), или възможно най-близо до "квадрат" (вид от оптичен където P и Q -. Затвори). Тъй като по принцип, наблюдаваното увеличение на производителността с увеличаване на броя на изчислителни възли (при условие, сходството на основните им характеристики), трябва да се изгради решетка, така че изчисленията се по възможно най-голям брой изчислителни възли.

По отношение на NB параметър стойност (параметър разпределение), след това стойността му зависи от характеристиките на паралелно компютърна система като цяло, и трябва да бъдат избрани поотделно (обикновено в интервала 16-256).

Работещи теста търси стандартни програми MPI:

където X - редица процеси, които искате да се изпълнява. Този номер трябва да съответства на PxQ максимална стойност. посочено в HPL файл. DAT. Трябва да се отбележи, че както при започване на всяко друго приложение, MPI. името на изпълнимия файл трябва да бъде разтворимо във всеки един от възлите. Стандартният начин е да се създаде общ ресурс, който е на разположение на всеки възел, поставяне на изпълнимия файл от дела, както и стартиране, подобна на следната команда:

В този файл HPL. DAT трябва да бъде в същата директория.

Ако трябва да укажете в имената домакини, които трябва да изпълняват теста, можете да използвате конфигурационния файл (конфигурационен файл формат се дава в случай на начало mpiexec полезност без параметри).