Ефективните клъстери разтвори
* Оборудване SCI (и поддръжка на софтуер) позволява изграждането на така наречените каша топологии без използването на ключове
Фигура 10. тясно свързани многопроцесорни система с асиметричен достъп до паметтаЕдна интересна особеност на комуникационните интерфейси, които осигуряват ниска латентност, е фактът, че въз основа на тях е възможно да се изгради системи с NUMA архитектура, както и системи, които могат да симулират софтуер ниво многопроцесорни системи SMP. Предимството на тази система е, че можете да използвате стандартни операционни системи и софтуер, насочени към използването на SMP решения, но поради високите, няколко пъти по-висока от interprocessor взаимодействието на ОМП латентност, изпълнение на такава система ще maloprognoziruemo.
Има няколко различни подходи към компютърни системи за програмиране паралелни:
на стандартни широко използвани езици за програмиране с помощта на комуникационните библиотеки и интерфейси за организиране interprocessor комуникация (PVM, MPI, HPVM, MPL, OpenMP, ShMem)
използването на специализирани езици паралелно програмиране и паралелни разширения (паралелни реализации на Fortran и C / C ++, ADA, Modula-3)
използване на автоматичен и полуавтоматичен паралелно извършване на последователни програми (BERT 77, FORGE, КАП, семки, VAST)
Програмни езици се използват стандартни процедури паралелни специализирани библиотеки, които са насочени към решаването на проблемите в специфични области, като линейната алгебра, методи Монте Карло, генетични алгоритми, изображения, молекулно химия и т.н. (ATLAS, DOUG, GALOPPS, NAMD, ScaLAPACK).
Има и много инструменти, които улесняват проектирането на паралелни програми. Например:
CODE - Graphics система за създаване на паралелни програми. Паралелна програма е представен като графика, на върха на която е последователност на програмата. За да изпраща съобщения от PVM и MPI библиотеки.
TRAPPER - търговски продукт на немските Genias на фирмата. Графично среда за програмиране, която включва компоненти за изграждане на паралелен софтуер.
В опита на потребителите високо-производителни клъстер система, най-ефективни са програми, написани специално по отношение на комуникацията необходимостта interprocessor. И въпреки факта, че програмирането в пакети, които използват общата интерфейс към паметта или инструменти за автоматично паралелно извършване, много по-удобно, най-често срещаните днес, MPI и PVM библиотеки.
С оглед на огромния популярност MPI (Минавайки интерфейс съобщение), което искате малко за това да се каже.
За да се оцени функционалността на MPI Искам да представим на Вашето внимание парцел с площ от момента на решаване на системи линейни уравнения, в зависимост от броя на процесорите в клъстера. Cluster базирани на Intel процесори и система възел свързване SCI (Scalable Съгласувано интерфейс). Това е особен проблем, и не разбирам резултатите като общ модел за предсказване на изпълнението на желаната система.
Фигура 11. зависимост от времето на решаване на системи линейни уравнения в зависимост от броя на процесорите в клъстерсредства за изпълнение на High Availability Cluster
Висока надеждност Клъстерите могат да бъдат групирани в:
Споделено Нищо архитектура (архитектура сподели нищо)
Споделено диск архитектура (архитектура споделен диск)
Фигура 12. Споделено Нищо АрхитектураАрхитектура без разпределение на ресурсите не използва споделена система за съхранение. Когато тя се използва, всеки възел има своите дискови устройства, които не се споделят клъстер система възли. В действителност, само на комуникационните канали са разделени на хардуер.
Фигура 13. архитектура споделен дискАрхитектура сподели-диск, традиционно използван за изграждане на клъстер системи с висока наличност, насочени към обработката на големи обеми от данни. Такава система включва обща система за съхранение на данни и връзките на възли, които разпространяват достъп до споделени данни. При висока система за съхранение на енергия, когато се занимават с дейности, ориентирани към тяхната обработка архитектура с общ диск е по-ефективно. В този случай, няма нужда да се запази няколко копия на данни и в същото време, ако един възел не успее, задачите могат да бъдат незабавно на разположение на други възли.
В случай, че проблемът е логично може да споделя данни с цел да се поиска от определена група от исканията могат да се обработват с помощта на част от данни, системата за споделено нищо не може да бъде по-ефективно решение.
Фигура 14. хетерогенна система клъстерНай-популярните търговски системи са две възлови за срив клъстери. Разграничаване Active-Active (Active-Active) и Active-пасивен (Active-пасивен) модел изпълнение на отказоустойчивост и системи клъстер в разпределението на софтуерни ресурси.
Фигура 15. Модел Active-Active Фигура 16. Активен активни клъстер с 3 възлиПотребителите често са изправени пред същия проблем, когато трябва да се осигури безпогрешна работа на готови софтуерни решения. За съжаление, Active-Active модел в този случай не работи. За тези ситуации, да се използва модел, в който се предоставя от задачите, изпълнявани от миграция на възел, на провали, на други възли. По този начин, ние се изпълнението на Active-пасивен.
Фигура 17. Модел Active-пасивниКато се има предвид, че в много случаи, ние можем да се прекъсне дадена задача на няколко разпределителни сфери на отговорност, както и на факта, че, като цяло, компанията, необходими за извършване на различни задачи, изпълнява така наречения модел на псевдо Active-Active.
Фигура 18. Активен активни Псевдо касетъчни възли 3Ако е необходимо да се гарантира, безпогрешна работа на множество софтуерни ресурси, това е достатъчно, за да добавите нова система за домакин, и работи на клъстер от изискваните задачи, които в случай на повреда на това устройство ще бъде прехвърлена към изпълнение на друг възел. Този модел се изпълнява в ReliantHA софтуер за OS Caldera OpenUnix и Unixware, която подкрепя групиране, от 2 до 4 възела в мезенхимни стволови клетки (Microsoft Cluster Service) и Linux Failover Cluster модел.
Системата за комуникация при касетъчните системи устойчиви на грешки може да бъде построен на същото оборудване както в купове високо-производителни. Но в случай на архитектурата с общ диск, става необходимо да се осигури високоскоростен достъп до споделена система за съхранение на данни. Този проблем има много решения днес.
Ако използвате един прост модел 2-възел, достъп диск може да бъде изградена чрез тяхното директно свързване към споделения SCSI шината,
Фигура 19. Архитектура на споделена SCSI автобусили с помощта на независима подсистема диск с вграден SCSI към SCSI контролер. В последния случай, устройствата са свързани с вътрешни независими канали за подсистемата диск.
Фигура 20. модел с SCSI за SCSI диск подсистемаВъзможността за използване на SCSI към SCSI подсистемата диск е по-мащабируема и устойчиви на грешки функции. Въпреки факта, че има и друг мост между устройството и дисковете, скоростта на такава система обикновено е по-висока, тъй като ние се комутируем достъп до устройството (положението е подобно на използването на главината и преминаването в локалната мрежа). За разлика от изпълнението с достъп за разделяне на диск обща SCSI шина, отделна подсистема независим диск е удобен начин за изграждане на системи с не единични точки на недостатъчност и възможността за изграждане на множество възли конфигурации.
Наскоро един нов популярен сериен интерфейс за SCSI протокол - FC (на Fibre Channel). Въз основа на ФК т.нар склад мрежа - SAN (Storage Area Network).
Фигура 21. клъстер система с SAN базирани на на Fibre ChannelОсновните предимства на Fibre Channel могат да включват почти всички от неговите характеристики.
Висока скорост на данните
Протокол за независимост (нива 0-3)
Дълги разстояния между точки
Ниска латентност при предаването на къси пакети
Висока надеждност на предаване
Неограничено надграждане
Тези големи възможности на Fibre Channel, получени благодарение на факта, че в своите дизайнерски специалисти са участвали в областта на двата канала и мрежови интерфейси, и те са в състояние да се съчетаят в едно FC интерфейс на положителните черти на двете.
За да се разбере значението на ФК давам сравнение маса FC и паралелно SCSI интерфейс.
Таблица 2. Таблица Сравнителни характеристики на FC и SCSI паралелен интерфейс
от точка до точка изпълнение на една изключително сложна схема на автоматичното включване на
Днес ФК устройства са по-скъпи от устройства с паралелен SCSI, но разликата в цената през последните години драстично намалени. Дискове и устройства за съхранение са почти равни по стойност на паралелни SCSI внедряванията, значителна разлика в цената на само FC адаптери.
Има и друг интересен вариант на архитектурата на клъстера - клъстер система с общата памет (включително RAM) общата памет клъстер. В действителност, тази група може да функционира като модел умерено свързан многопроцесорна система и са тясно свързани. Такава система, както бе споменато по-рано в тази статия, се нарича NUMA.
Фигура 22. Модел клъстер общата паметCluster Обща памет използва софтуер (касетъчни услуги), която осигурява единен системен образ (имидж единна система), дори ако клъстера е изградена като споделена нищо архитектура, която се вижда от операционната система.
В края на историята на системите за касетъчните високо достъпна, искам да дам статистика за престой на различни системи.
Фигура 23. Сравнение на среден престой на различни системиКакто можете да видите, висока наличност клъстер система не е панацея, като същевременно намалява времето за престой. Ако една проста система е много критичен, а след това използването на система клас отказоустойчива или непрекъсната наличност, от този клас имат наличието на системата е много по-висока от клас High Availability система.
Примери на тестваните разтвори
От успеха на всяка технология се оказа примери за практическото му прилагане, искам да ви покажа някои варианти на най-важното, според мен, клъстерни решения.
Първа на клъстери с висока производителност.
В IBM SP2 се използват като възли на машината RS / 6000 SP Switch2 свързан ключ. Проверка на ключа - 500 MB / сек в една посока, на забавяне стойност - 2.5 микросекунди.
Compaq AlphaServer SC. Единици - 4-процесор тип система Compaq AlphaServer ES45, свързани чрез комуникационен интерфейс QsNet на параметрите от които са споменати по-горе.
В същия списък суперкомпютър са машини, изградени върху обичайните Intel платформи и SCI и Myrinet превключватели и дори обикновен Бързо и Gigabit Ethernet. Освен това, както в първите две изпълнения, както и системите за високо касетъчни, въз основа на обичайното оборудване, MPI пакети се използват за програмиране.
И накрая, искам да дам един красив пример за мащабируема система висока наличност клъстер. Моделът на хардуер IBM DB / 2 клъстер решение за отказоустойчива високоскоростен база за обработка на данни.
Фигура 24. IBM DB2 клъстерТова е всичко. Ако някой има някакви въпроси, типове и желание да общуват - добре дошли. Моето място ще намерите в края на статията.
"Определянето на размера паралелни архитектури", - Грег Pfister, старши технически щаб държави в IBM.
"Възможно ли е да защита при срив на Windows?", - Наталия Пирогов, материали издателство "Отворени системи".
"Използването на паралелно проблеми системи в слабо обвързани клъстер" - M.N.Ivanov.
"Отказоустойчива компютри фирми Стратус", - Виктор Schnitman, издателски материали "отворени системи."
"Днешните високо-производителни компютри", - V. Schnitman, информация и анализ на информационните технологии Център.
"Стъпка за мрежи за съхранение," информационни и аналитични материали фирми USTAR.
"Развитието на архитектурата на виртуален интерфейс" - ". Отворени системи" Торстен фон Ейкън, Вернер Vogels, издателски материали
Материали лаборатория по Паралелни Информационни технологии "компютърен център на Московския държавен университет."
Материали клъстер Computing Info Center.
Материали SCI Европа.
Материали VI форум (Virtual Архитектура Developers Forum).
Материали от Caldera.
Материали компании Dolphinics.
Материали компании Emulex.
Материали компании KAI Софтуер, подразделение на Intel Americas, Inc. (KAI).
Материали компании Myricom, Inc.
Материали компания Oracle.
Препоръки подкрепа от страна на Intel.