Разпределени бази данни

Основната функция на всяка база данни е в подкрепа на независимостта, целостта и съгласуваността на данните по отношение на колективното използване.

А разпределена база данни се състои от няколко, вероятно припокриване или дублиращи части, съхранявани в различни компютри изчислителна мрежа. Въпреки това, разпределени потребителя база данни не трябва да се знае как неговите компоненти са поставени във възлите на мрежата, и в момента е в базата данни като цяло (това свойство се нарича прозрачност). Работа с такава база данни с помощта на система за управление на разпределени бази данни (RDBMS). Част от разпределена база данни, бе домакин на отделен компютърна мрежа, може да се контролира от собствен (местно) база данни. В локалната база данни не е задължително да е същото в различни мрежови възли. Комбинирането на нееднакви местни бази данни в един разпределена база данни е сложна научна и техническа предизвикателство. Решаването му изисква голям набор от научни изследвания и експериментални разработки.

Софтуер разпределени системи за управление на бази данни (RDBMS) обикновено има слоеста архитектура (фиг. 1).

Разпределени бази данни

Фиг. 1. Нива разпределени бази данни

Ако се прави разлика работа с разпределени бази данни и работата с отдалечената база данни. Във втория случай, потребителят е ясно свързан с източника на данни.

2. Основни принципи на разпределената обработка

Помислете за основните принципи на разпределената обработка.

Местна автономия. Този принцип означава, че сделките в този сайт са контролирани от него, вие не трябва да се очаква от другите възли, въпреки че в реални системи, не е пълна автономия, тъй като има много ситуации, които изискват координирани работните площадки.

Независимост от централния възел. Принципът означава, че всички възли се появяват като равни, в противен случай това може да повреди цялата система в центъра на щетите.

Непрекъсната работа. Принципът означава, че системата трябва да бъде висока степен на надеждност и наличните данни. Надеждност - е вероятността, че системата работи и работи във всеки даден момент. Системите могат да поддържат цялата гама от методи за подобряване на надеждността (огледални дискове, архивиране сървъри, multimachine клъстери и т.н.)

Независимо от местоположението. Принципът е прозрачност на данни за местоположението.

Независимост от фрагментация. Таблицата е разделен на групи, които се съхраняват на различни дискови секции (дискове). Раздробяването е желателно да се подобри производителността на системата, тъй като на таблиците се чете едновременно. Повишена маса наличност, дори ако тя е повредена част е намалена конкурентоспособност операции. Те са най-добре пазената където те се използват по-често. Има два основни вида: фрагментация на хоризонтални и вертикални (в действителност, това е работата на проекцията и пробата).

Независимост от репликация. Репликация е полезна по две причини: за постигане на максимална ефективност и увеличаване на наличността. Asynchronous асиметричен - това е репликация, където една единица - основният собственик на основното копие на таблицата с възможността да се направят промени в нея, и автоматична поддръжка на неограничен брой копия в други възли за достъп само за четене. Asynchronous симетричен - репликация на данни, когато е на разположение, за да се промени по всяко възел данни и автоматично да се разпространяват до всички копия.

Разпределени заявки за обработка. В разпределени системи усложнява оптимизатор, тъй като това е изключително важно да се намери най-ефективния стратегията за изпълнение на заявка. Възможно използване на паралелни операции. Оптимално трансфер на данни между възлите. Свързване индекси.

Разпределени управление сделка. Основен дизайн, който ви позволява да записвате на "правилното" състояние на базата данни е сделка. Съгласно сделката се реализира логическа единица работа с база данни, която не я доведе до последователно състояние. То може да включва стотици операции (например да осъвремени-заявки), а базата данни работа може да бъде в състояние на несъвместимост. Но в края на базата данни трябва да бъде в последователно състояние. С други думи сделката - представяне като атомни (неделими) действията на един или повече операции на базата данни, не води до нарушаване на целостта на базата данни.

Двуфазов комит сделка - когато една сделка се извършва под контрола на сървъра на координираща институция. Първа фаза: координатора, получил SOMMIT инструкция изпраща на останалата част от съобщението до сървъра относно подготовката за фиксиране. Сървърите са отговорни за възможността за фиксиране. Втора фаза: координатора, след като получи всички доказателства, реши да извърши или отмяната на сделката. съгласуваност на данните може да се поддържа с помощта на тригери и съхранени процедури. Тригери - начин за автоматизиране на действия на базата данни. Trigger - е специална процедура, която се задейства, когато дадено условие, работа и т.н. Съхранена процедура се съхранява под формата на компилиран и оптимизирани сървъри, в резултат на изчислението се прехвърля клиентските машини към сървъра, намаляване на трафика в мрежата.

Разпределени Речник на данните. Речникът е не само обичайната информация за него, но и съхранява цялата информация за настаняване, фрагментация, репликация. Речник себе си може да бъде в един възел да бъде повторен в изцяло или частично.

Multi-скала и мулти-платформа. Този принцип означава независимост от хардуер, операционна система независими, независими от мрежата.

Независимост от базата данни. Принцип означава отклонение от еднаквост. Всички бази данни трябва да поддържат същия интерфейс. В разнородни системи изискват специален софтуер - шлюзове за организиране на прозрачен обмен между различните бази данни.