Databázové
a informačné systémy - Databázová terminológia - relačný
dátový
model
(informatika pre študentov štvrtého-piateho ročníka Leteckej fakulty,
TU KE
- 2005 - RNDr. Peter Szabó)
Databázová terminológia - relačný dátový model
Údaje a informácie
Číslo "26112004" je číselný údaj.
Nevieme čo
tento údaj znamená, lebo údaj nemá informačný obsah. Môže to byť dátum
narodenia, číslo účtu alebo môže to
mať iný význam. Keď priradíme k tomuto číselnému údaju nejaký atribút
napr.
"číslo účtu", tak z číselného údaju spolu s atribútom vznikne informácia.
V terminológii relačného dátového modelu "26112004" je hodnota
atribútu, a "číslo účtu" je atribút , čísla všetkých účtov
tvoria doménu všetkých účtov.
Relačný dátový model
Väčšina dnešných, komerčne rozšírených SRBD je
založená na relačnom modeli ( logické vyjadrenie väzieb medzi dátami ).
Manipulácia s dátami je založená na operáciach relačnej algebry. Tieto
operácie zahrňujú množinové operácie ( zjednotenie,
prienik, rozdiel, kartézsky súčin
) a tzv. špeciálne relačné operácie ako sú selekcia,
spojenie, delenie
a projekcia. Relácie (alebo tabuľky) sú základnými prvkami
relačného dátového modelu. Relácia sa skladá z atribútov (stĺpec
tabuľky) a z usporiadaných n-tíc.
(údaje - riadok tabuľky, čiže relácie obsahujú informácie ).
Relačné operácie
vytvárajú ďalšie relácie - tieto opreácie znamenajú manipuláciu medzi
dátami.
V báze dát existujú relácie, tieto relácie majú atribúty, atribúty
tvoria
schému relácie. Na základe schémy relácie a na základe
spoločných atribútov možno vytvárať ďalšie relácie. Relačný dátový
model (Relation Data Model -RDM) vznikol v roku 1970, kedy ho prvý krát
publikoval Dr. E.F. Codd.
Relačná algebra predstavuje procedurálny jazyk založený na
algebraickom
princípe. Pozostáva z množiny operácií, ktoré sú definované nad
reláciami, a ktorých výsledkom sú opäť relácie. Základné operácie
relačnej algebry sú:
1.
výber ( príklad : SELECT * FROM Ucet WHERE Majitel =
"Malý";')
2.
projekcia ( príklad : SELECT Meno, Priezvisko FROM Os_udaj;)
3.
kartézsky súčin
( príklad : SELECT Meno, Priezvisko,ID_Predmet FROM Os_udaj, Predmet;)
4.
zjednotenie
( príklad :SELECT meno, priezvisko FROM Student WHERE Pohlavie='M'
SELECT meno, priezvisko FROM Student
WHERE Pohlavie='Z';)
5.rozdiel ( príklad : SELECT
Meno,Priezvisko FROM Os_udaj WHERE Datum_nar >1980; túto operáciu
realizujeme
aj s reláciou NOT IN)
6.
prienik
7.
delenie
8.
spojenie
V zátvorke sú uvedené príklady v jazyku SQL.
Relácie relačnej algebry s líšia od matematickej relácie. ( Príklad
matematickej
relácie x < y ) Reláciu relačnej algebry možno vytvárať len na
základe
schémy relácie. ( bez znalosti schémy - množiny atribútov nie je
možné vytvoriť
reláciu, niekedy potrebujeme vedieť aj hodnotu atribútu viď. príklad
výberu
- hodnota atribútu Majitel je "Malý" )
Základné pojmy relačného dátového modelu
relácia - zodpovedá tabuľke
n-tica - zodpovedá riadku tabuľky
atribút - zodpovedá stĺpcu tabuľky
hodnota atribútu - konkrétna hodnota bunky tabuľky
primárny kľúč - jednoznačný identifikátor v tabuľke, ktorý
reprezentovaný
stĺpcom alebo skupinu stĺpcov
doména - množina všetkých hodnôt pre daný atribút
Analógia pojmov : relačný dátový model - systémy súborov
Relačný pojem
|
Reprezentácia
|
Súborová analógia
|
relácia
|
tabuľka
|
súbor
|
n-tica
|
riadok
|
záznam
|
atribút
|
stĺpec
|
položka
|
hodnota atribútu
|
hodnota bunky
|
hodnota položky
|
Definície základných pojmov relačného dátového modelu.
Atribút
Atribút relácie reprezentuje stĺpec relácie určený v rámci relácie
svojim
unikátnym názvom a množinou prípustných hodnôt.
Doména
Doména je pomenovaná množina skalárnych hodnôt rovnakého typu.
Skalár
Skalár je hodnota, ktorá reprezentuje najmenšiu
sémantickú jednotku dát. (Možná hodnota atribútu napríklad: v prípade
atribútu
"meno", "Katka" je skalár )
(Samotný skalár nemá vnútornú štruktúru, je nedekomponovateľný.
Napríklad
hodnota priradená názvu predmetu nie je ďalej dekomoponovateľná bez
straty
významu. Je síce zložená z množiny znakov (písmen), ale samotné nemajú
žiadnu
informačnú hodnotu. )
Použitie domény :
Príklad - Definícia domény pre atribút OKRES
create domain DOMENA_OKRES AS char(4);
Príklad - Definícia relácie s použitím domény
create table os_udaje
(
rod_cislo char(11) not null,
meno char(15),
priezvisko char(15),
ulica char(20),
obec char(20),
psc char(5),
st_prisl char(2),
okres DOMENA_OKRES(4)
);
Domény hrajú veľmi dôležitú úlohu v
relačnom dátovom modeli, sú základnými nositeľmi informácie.
Z matematického hľadiska každá relácia je podmnožinou kartézskeho
súčinu
domén. Domény je užitočné definovať v rámci bázy dát, lebo
systémy riadenia
bázy dát umožňujú dotazovať na domény, to umožňuje užívateľovi systému
zistiť
okamžite informačný obsah bázy dát, bez prezerania všetkých relácií
(tabuliek).
Relačná schéma
Relačná schéma relácie R je Omega ={ A1 :D1, A2:D2, ...,
An:Dn},
a to konečná množina dvojíc atribút – doména .
Relácia ([Codd70])
Nech existuje množina domén D={ D1,D2, ...,Dn} nad množinou Omega
, potom reláciou je podmnožina karteziánskeho súčinu domén D1xD2x
...xDn.
Kardinalita relácie
Kardinalita relácia vyjadruje počet n-tíc relácie.
Stupeň relácie
Ak existuje relačná schéma relácie R={ A1 , A2, ..., An:}, tak počet
atribútov
n udáva stupe
Iná definícia relácie :
Relácia ([Date96])
Relácia R nad množinou domén D1, D2, ..., Dn (nie nevyhnutne
odlišnými)
sa skladá z hlavičky a tela :
Hlavička – stála (nemenná) množina atribútov A1, A2, ..., An,
takých, že každému atribútu Ai zodpovedá práve jedna z domén Di kde
i=1,
2, ..., n ( Ai:Di )
Telo – v čase sa meniaca množina n-tíc, kde každú n-ticu tvorí
množina dvojíc (Ai: vij), kde i=1, 2, ..., n a j=1, 2, ..., m
tzn. existuje jedna dvojica atribút – hodnota (Ai: vij) pre každý
atribút Ai z hlavičky.
Pre ktorúkoľvek danú dvojicu atribút – hodnota (Ai: vij) platí,
že vij je jednou z hodnôt danej domény Di prislúchajúcej atribútu Ai.
Základné vlastnosti relácie
Relácia má štyri základné vlastnosti :
1. Neobsahuje duplicitné n-tice - táto vlastnosť vychádza s
faktu,
že telo relácie je matematická množina (množina n-tíc), a podľa
definície
neobsahuje duplicitné prvky. Základným predpokladom pre splnenie tohto
bodu
je nutná existencia primárneho kľúča v každej relácii (pozri definíciu
primárneho kľúča). Primárny kľúč môže byť tvorený jedným atribútom
alebo zložením niekoľkých
atribútov relácie.
2. n-tice sú neusporiadané (zhora dolu) – n-tice tvoria
matematickú
množinu (nie je usporiadaná) hoci z praktického hľadiska je často
vhodné
udržiavať reláciu ako usporiadanú množinu. Z druhej strany
neusporiadanosť
umožňuje zjednodušiť a zjednodušiť algoritmy pre prácu nad reláciou.
3. m-tice atribútov sú neusporiadané (zľava doprava) – m-tice
tvoria
matematickú množinu (nie je usporiadaná). Táto vlastnosť hovorí o tom,
že
k jednotlivým stĺpcom alebo k hodnotám atribútu pristupuje
prostredníctvom
identifikátoru (meno atribútu) a nie podľa pozície v riadku. To umožní
tvorbu
programov nezávislých na dátach.
4. hodnoty atribútov sú atomické – túto vlastnosť môžeme
vyjadriť
aj inak (menej formálne): každému atribútu je priradená vždy len jedna
hodnota
a nie množina hodnôt. Je potrebné, aby všetky atribúty boli atomické,
čím
dosiahneme to, že v relácii sa nemôžu vyskytovať tzv. opakujúce sa
skupiny
atribútov, ktoré sa vyskytujú v nenormalizovaných záznamoch. Hodnota
atribútu
je vždy skalár a nie množina. "Relácia neobsahuje opakujúce sa
skupiny".
Relácií bez opakujúcich sa skupín hovoríme, že je normalizovaná.
naspäť