Databázové a informačné systémy - Databázová terminológia - relačný dátový model
(informatika pre študentov štvrtého-piateho ročníka Leteckej fakulty, TU KE - 2005 - RNDr. Peter Szabó)

Databázová terminológia - relačný dátový model

Údaje a informácie

Číslo "26112004" je číselný údaj.  Nevieme čo tento údaj znamená, lebo údaj nemá informačný obsah. Môže to byť dátum narodenia, číslo účtu alebo môže to mať iný význam. Keď priradíme k tomuto číselnému údaju nejaký atribút napr. "číslo účtu", tak z číselného údaju spolu s atribútom vznikne informácia.  V terminológii relačného dátového modelu "26112004" je hodnota atribútu, a  "číslo účtu" je atribút , čísla všetkých účtov tvoria doménu všetkých účtov.

Relačný dátový model

Väčšina dnešných, komerčne rozšírených SRBD je založená na relačnom modeli ( logické vyjadrenie väzieb medzi dátami ). Manipulácia s dátami je založená na operáciach relačnej algebry. Tieto operácie zahrňujú množinové operácie ( zjednotenie, prienik, rozdiel, kartézsky súčin ) a tzv. špeciálne relačné operácie ako sú selekcia, spojenie, delenie a projekcia. Relácie (alebo tabuľky) sú základnými prvkami relačného dátového modelu. Relácia sa skladá z atribútov (stĺpec tabuľky) a z usporiadaných n-tíc. (údaje - riadok tabuľky, čiže relácie obsahujú informácie ).  Relačné operácie vytvárajú ďalšie relácie - tieto opreácie znamenajú manipuláciu medzi dátami. V báze dát existujú relácie, tieto relácie majú atribúty, atribúty tvoria schému relácie. Na základe schémy relácie a na základe spoločných atribútov možno vytvárať ďalšie relácie. Relačný dátový model (Relation Data Model -RDM) vznikol v roku 1970, kedy ho prvý krát publikoval Dr. E.F. Codd.

Relačná algebra predstavuje procedurálny jazyk založený na algebraickom princípe. Pozostáva z množiny operácií, ktoré sú definované nad reláciami, a ktorých výsledkom sú opäť relácie. Základné operácie relačnej algebry sú:

1.
výber ( príklad : SELECT * FROM Ucet WHERE Majitel = "Malý";')
2.
projekcia ( príklad : SELECT Meno, Priezvisko FROM Os_udaj;)
3. kartézsky súčin ( príklad : SELECT Meno, Priezvisko,ID_Predmet FROM Os_udaj, Predmet;)
4.
zjednotenie ( príklad :SELECT meno, priezvisko FROM Student WHERE Pohlavie='M' SELECT meno, priezvisko FROM Student WHERE Pohlavie='Z';)
5.rozdiel ( príklad : SELECT Meno,Priezvisko FROM Os_udaj WHERE Datum_nar >1980; túto operáciu realizujeme aj s reláciou NOT IN)
6.
prienik
7.
delenie
8.
spojenie
V zátvorke sú uvedené príklady v jazyku SQL.

Relácie relačnej algebry s líšia od matematickej relácie. ( Príklad matematickej relácie x < y )  Reláciu relačnej algebry možno vytvárať len na základe schémy relácie. ( bez znalosti schémy - množiny atribútov nie je  možné vytvoriť reláciu, niekedy potrebujeme vedieť aj hodnotu atribútu viď. príklad výberu - hodnota atribútu Majitel je "Malý"   )

Základné pojmy relačného dátového modelu

relácia - zodpovedá tabuľke
n-tica - zodpovedá riadku tabuľky
atribút - zodpovedá stĺpcu tabuľky
hodnota atribútu - konkrétna hodnota bunky tabuľky
primárny kľúč - jednoznačný identifikátor v tabuľke, ktorý reprezentovaný stĺpcom alebo skupinu stĺpcov
doména - množina všetkých hodnôt pre daný atribút

Analógia pojmov : relačný dátový model - systémy súborov

Relačný pojem
Reprezentácia
Súborová analógia
relácia
tabuľka
súbor
n-tica
riadok
záznam
atribút
stĺpec
položka
hodnota atribútu
hodnota bunky
hodnota položky


Definície základných pojmov relačného dátového modelu.


Atribút
Atribút relácie reprezentuje stĺpec relácie určený v rámci relácie svojim unikátnym názvom a množinou prípustných hodnôt.

Doména
Doména je pomenovaná množina skalárnych hodnôt rovnakého typu.
Skalár
Skalár je hodnota, ktorá reprezentuje najmenšiu sémantickú jednotku dát. (Možná hodnota atribútu napríklad: v prípade atribútu "meno",  "Katka" je skalár )

(Samotný skalár nemá vnútornú štruktúru, je nedekomponovateľný. Napríklad hodnota priradená názvu predmetu nie je ďalej dekomoponovateľná bez straty významu. Je síce zložená z množiny znakov (písmen), ale samotné nemajú žiadnu informačnú hodnotu. )
Použitie domény :
Príklad - Definícia domény pre atribút OKRES
create domain DOMENA_OKRES AS char(4);

Príklad - Definícia relácie s použitím domény
create table os_udaje
(
rod_cislo char(11) not null,
meno char(15),
priezvisko char(15),
ulica char(20),
obec char(20),
psc char(5),
st_prisl char(2),
okres DOMENA_OKRES(4)
);

Domény hrajú veľmi dôležitú úlohu v relačnom dátovom modeli, sú základnými nositeľmi informácie. Z matematického hľadiska každá relácia je podmnožinou kartézskeho súčinu domén. Domény  je užitočné definovať v rámci bázy dát,  lebo systémy riadenia bázy dát umožňujú dotazovať na domény, to umožňuje užívateľovi systému zistiť okamžite informačný obsah bázy dát, bez prezerania všetkých relácií (tabuliek).

Relačná schéma

Relačná schéma relácie R je Omega ={ A1 :D1, A2:D2, ..., An:Dn}, a to konečná množina dvojíc atribút – doména .

Relácia ([Codd70])


Nech existuje množina domén D={ D1,D2, ...,Dn} nad množinou Omega , potom reláciou je podmnožina karteziánskeho súčinu domén D1xD2x ...xDn.

Kardinalita relácie
Kardinalita relácia vyjadruje počet n-tíc relácie.

Stupeň relácie
Ak existuje relačná schéma relácie R={ A1 , A2, ..., An:}, tak počet atribútov n udáva stupe

Iná definícia relácie :

Relácia ([Date96])
Relácia R nad množinou domén D1, D2, ..., Dn (nie nevyhnutne odlišnými) sa skladá z hlavičky a tela :
Hlavička – stála (nemenná) množina atribútov A1, A2, ..., An, takých, že každému atribútu Ai zodpovedá práve jedna z domén Di kde i=1, 2, ..., n ( Ai:Di )
Telo – v čase sa meniaca množina n-tíc, kde každú n-ticu tvorí množina dvojíc (Ai: vij), kde i=1, 2, ..., n a j=1, 2, ..., m
tzn. existuje jedna dvojica atribút – hodnota (Ai: vij) pre každý atribút Ai z hlavičky.
Pre ktorúkoľvek danú dvojicu atribút – hodnota (Ai: vij) platí, že vij je jednou z hodnôt danej domény Di prislúchajúcej atribútu Ai.


Základné vlastnosti relácie

Relácia má štyri základné vlastnosti :
1. Neobsahuje duplicitné n-tice - táto vlastnosť vychádza s faktu, že telo relácie je matematická množina (množina n-tíc), a podľa definície neobsahuje duplicitné prvky. Základným predpokladom pre splnenie tohto bodu je nutná existencia primárneho kľúča v každej relácii (pozri definíciu primárneho kľúča). Primárny kľúč môže byť tvorený jedným atribútom alebo zložením niekoľkých atribútov relácie.
2. n-tice sú neusporiadané (zhora dolu) – n-tice tvoria matematickú množinu (nie je usporiadaná) hoci z praktického hľadiska je často vhodné udržiavať reláciu ako usporiadanú množinu. Z druhej strany neusporiadanosť umožňuje zjednodušiť a zjednodušiť algoritmy pre prácu nad reláciou.
3. m-tice atribútov sú neusporiadané (zľava doprava) – m-tice tvoria matematickú množinu (nie je usporiadaná). Táto vlastnosť hovorí o tom, že k jednotlivým stĺpcom alebo k hodnotám atribútu pristupuje prostredníctvom identifikátoru (meno atribútu) a nie podľa pozície v riadku. To umožní tvorbu programov nezávislých na dátach.
4. hodnoty atribútov sú atomické – túto vlastnosť môžeme vyjadriť aj inak (menej formálne): každému atribútu je priradená vždy len jedna hodnota a nie množina hodnôt. Je potrebné, aby všetky atribúty boli atomické, čím dosiahneme to, že v relácii sa nemôžu vyskytovať tzv. opakujúce sa skupiny atribútov, ktoré sa vyskytujú v nenormalizovaných záznamoch. Hodnota atribútu je vždy skalár a nie množina. "Relácia neobsahuje opakujúce sa skupiny". Relácií bez opakujúcich sa skupín hovoríme, že je normalizovaná.


naspäť
17.11.2004