Разпределени бази данни и разпределена база данни - абстрактен, страница 1

Съвременните обеми на съхраняваните данни, задължителни изисквания за наличието и скоростта на обработка, динамиката на системите го прави важен за изучаване на факторите, които влияят на качеството на базата данни в основата на съвременните информационни системи.

До края на 80-те години има нови условия на труд за DB: големи количества информация се появяват на много места (например, търговия на дребно, печат и други производствени). Източникът на големи обеми от данни може да бъде център, но тези данни изискват бърз достъп до периферията (географското разпределение на производството, които работят по същата схема). В допълнение, данните могат да бъдат отменяни и в центъра, и отдалечените потребители в отдалечени места. Има голямо количество данни, които се използват в спешни искания, често местен характер (за въздух и железопътни билети).

В много отрасли, например интегрирани в нуждите от компютър печат индустрията е разпределена база данни, свързваща в едно цяло сложен процес на управление на различни процеси. Тук работата се извършва не само с едно приложение, както и със системата за кандидатстване.

Централизирана база данни, по-специално изградена въз основа на класическия подход, не може да се отговори на новите изисквания.

Бързото развитие на мрежи за данни, рязко покачване на външната памет на компютъра по време на поевтиняването през 80-те са допринесли за широкото приемане на разпределени бази данни.

Предимствата на разпределени бази данни включват:

1) съвпадение структура разпределена структура на базата данни на организациите;

2) взаимодействие гъвкав местни бази данни;

3) възможности централизация възли;

4) незабавен достъп до информацията, намаляване на разходите предаване (поради компресия на данни и концентриране);

5) характеристики високо система (кратко време за реакция поради процес паралелизация, висока надеждност);

6) взаимодействие модулно изпълнение, хардуер разширяване използването на обектно ориентиран програмен;

7) способността да се разпространява файлове в съответствие с тяхната дейност;

8) за развитието на независими локални бази данни чрез стандартен интерфейс.

Въпреки това, разпределени бази данни, да имат по-сложна структура, която причинява допълнителни проблеми (несъответствия данни съкращения в привеждането в съответствие време на актуализацията на процеси и изисква използването на телекомуникационни ресурси, което представлява операция е свързан още с локални бази данни, стандартизация общи интерфейс) елементи съвпадение на работа.

Сериозни проблеми възникват, когато интегриране в целия разпределени бази данни, еднородни (хомогенни) със същата локалната база данни, често модели релационни данни.

Проблемът е много по-сложно, ако локалната база данни изграден с помощта на различни модели на данни (не са единни, разнородни разпределени бази данни).

Целта на тази курсова работа е да се изследва разпределена база данни и разпределените бази данни. За постигането на тази цел са изпълнени следните задачи:

Концепцията на разпределени бази данни;

Свойствата на разпределени бази данни;

Концепцията на целостта на данните;

Принципът на разпределени бази данни за пример SYSTEM R на *

Разработено заявление в Делфи.

1 разпръснати информационни системи и бази данни

Концепцията на разпределени бази данни

Под разпределени (разпределена база данни - DDB) обикновено означава, база данни, включително фрагменти от различни бази данни, разположени на различни възли на мрежа от компютри, а вероятно и управлявани от различни СУБД. Разпределени бази данни изглежда като от гледна точка на потребители и приложения на като нормална локална база данни. В този смисъл, думата "разпределя" отразява начина на организиране на базата данни, но не и неговата външна характеристика. ( "Разпространение" база данни е невидим отвън).

Основната задача на системи за управление на разпределени бази данни, е да осигури средства за интегриране на локални бази данни, които са разположени в някои от възлите на компютърната мрежа, така че потребителят да работи във всеки мрежов възел, има достъп до всички тези бази данни, като единна база данни, [1] ,

В този случай, трябва да се осигури:

лекота на използване на системата;

безжична операция в нарушение на мрежова свързаност или административни нужди;

висока степен на ефективност.

Има единни и неравномерно разпределени бази данни. В хомогенна случай всеки локална база данни, управлявана от един и същи данни. В хетерогенна система от локални бази данни могат да се отнасят и до различни модели на данните. Мрежа интеграция на хетерогенни бази данни - това е от значение, но много труден проблем. Много решения са известни на теоретично ниво, но все още не може да се справи с основния проблем - липсата на ефективност на интегрирани системи. Имайте предвид, че колкото по-успешно на практика решен временно задача - интеграция на хетерогенни SQL ориентирани системи. Ясно е, че това до голяма степен допринася за стандартизация на езика SQL и общо придържане към производителите на СУБД принципи на отворени системи [2].

1.2 Свойства на разпределени бази данни

Определяне на разпределена база данни (DDB) предложи ДЕЙТА (С. Дж Дата). Той откри 12 свойства или качества на идеалната [4] DDB:

Местна автономия (местна автономия)

Независимостта на възлите (не се разчита на централно място)

Непрекъсната работа (непрекъсната работа)

местоположение прозрачност (независимост населено място)

Прозрачен разпокъсаност (фрагментация независимост)

Прозрачен репликация (репликация независимост)

Разпределена обработка на заявките (разпределена обработка на заявката)

Разпределена обработка на транзакции (разпределена обработка на транзакции)

Независимостта на оборудване (хардуер независимостта) на

Независим на операционни системи (operationg система независимост)

Прозрачност мрежа (независимост на мрежата)

Независимост от база данни (независимостта на база данни) на

Местна автономия. Това означава, че качеството на управлението на данни за всеки един от възлите на разпределена система работи на местно ниво. Като фрагмент споделено пространство данни, ПБ. при същите функции време като пълноправен локална база данни; управлението се извършва локално и независимо от други възлови точки в системата [4].

Независимост от централния възел. В един идеален система, всички възли са равни и независими, и разположени в основата са равни доставчици на данни в едно общо пространство на данни. Базата данни на всеки възел е самодостатъчна - тя включва пълната собственост на речник на данните и е напълно защитен срещу неоторизиран достъп.

Непрекъсната работа. Това качество може да се тълкува като възможност за непрекъснат достъп до данни (известна "24 часа на ден, седем дни в седмицата") в рамките на DDB, независимо от тяхното местоположение и независимо от операциите, извършвани в местните сайтове. Това качество може да се изрази с лозунга "данни са винаги на разположение, както и операциите върху тях се извършват непрекъснато" [4].

прозрачност място. Този имот е пълна прозрачност на данните за местоположението. Потребители с достъп до DDB, нищо не е нужно да се знае за действителното, физическото местоположение на данните в информационната система възли. Всички операции на данните се извършват без да се отчита на знанията на тяхното местонахождение. Транспортни заявки към бази данни, изпълнявани интегрирана система означава.

Прозрачен фрагментация. Този имот се третира като способността да се разпространява (т.е., на различни места) поставянето на данни, логично представляват едно цяло. Има два вида на фрагментация: хоризонтални и вертикални. Хоризонталните линии означава съхраняване на една таблица на различни възли (всъщност, съхраняване на логика редове от таблицата в няколко идентични физически маси на различни възли). Вертикално разпределение означава на колони от таблицата на логика в множество възли.

Да разгледаме пример, илюстриращ двата вида фрагментация. Налице е служител на маса (emp_id, emp_name, телефон), дефинирано в база данни на възел във Финикс. Налице е една и съща маса, която е дефинирана в база данни на възел в Денвър. И двете маси се съхранява информация за служители. В допълнение, в базата данни на възела, взе в Далас маса emp_salary (emp_id, заплата). След това искане ", за да получи информация за служителите" може да се формулира по следния начин:

SELECT * FROM служител @ феникс, служител @ Денвър ORDER BY emp_id

В същото време искане "за информация относно заплатите на работниците и служителите" ще бъде както следва:

SELECT employee.emp_id, emp_name, заплата от служител @ Денвър, служител @ феникс, emp_salary @ Далас ORDER BY emp_id

прозрачност репликация. Дублирането на данни - това е един асинхронен процес на преместване промени обект в базата данни източник към базата данни, разположен на другите възли в разпределена система. В този контекст това означава прозрачност промени преносимост на репликация между база данни означава, невидим за потребителя на разпределена система. Този имот означава, че копието е възможно и се постига с помощта на рамките на системата.

Разпределени заявки за обработка. DDB Този имот се третира като е способен да извършва операции по разпределени примерна база данни, посочени в редовна заявка език SQL. Това означава, че от операция DDB вземане на проби може да се формулира като се използва един и същ език означава, че една операция на локалната база данни. Например,

SELECT customer.name, customer.address, order.number, order.date ОТ клиент @ Лондон, за @ Париж, където customer.cust_number = order.cust_number

Разпределена обработка на транзакции. DDB Това качество може да се тълкува като способността да се извърши актуализиране на операции на разпределена база данни (INSERT, UPDATE, DELETE), това не се нарушава целостта и съгласуваността на данните на. Тази цел се постига чрез използване на двуфазна извърши протокол (двуфазов протокол протокол), която се превърна в де факто стандарт за разпределена обработка на транзакциите. Използването му гарантира последователна промяна на данни в множество възли в рамките на разпределени транзакции.

Хардуер независимост. Този имот означава, че в разпределена система възли може да действа компютри всички модели и производители - от компютърни системи, за да "настолни компютри".

Независимост от операционната система. Това качество произтича от предишния и означава разнообразието на операционни системи, разпределени блокове за управление на системата.

прозрачност Network. Достъп до всички бази данни по мрежата. Обхват на поддържаните мрежови протоколи специфични СУБД не трябва да бъде ограничение на системата с разпределени бази данни. Това качество е формулиран възможно най-широко - всякакви възможни мрежови протоколи в разпределена система.

Независимост от базата данни. Това означава, че качеството в разпределена система могат да съществуват мирно заедно бази данни от различни доставчици, както и възможността за търсене и актуализиране на операции в базите данни на различни модели и размери.

Въз основа на определянето ДЕЙТА, DDB може да се разглежда като свободно свързани мрежова структура, чиито възли са локални бази данни. Локалните бази данни са самостоятелни, независими и самостоятелно определя; достъп до базата данни, предвидена по принцип от различни доставчици. Комуникацията между възли - тя се влива точни копия от данни. DDB топология варира в широки граници - възможни варианта на йерархията структурите на "звезда", и т.н. Като цяло DDB топология определя от географското информационна система и ориентиран потоци данни репликация [4].