Tietokanta: Järjestetty kokoelma toisiinsa liittyviä tietoja

Tietokanta on tietokoneen tallentama tietojen ja informaation järjestetty kooste.

Tietokannat ovat tiettyä tarkoitusta varten koottuja tiedostokokoelmia, joista hakumenetelmillä saadaan yksittäinen tieto tai tietoyhdistelmiä ja joita voidaan korjailla tai täydentää (päivitys). Laajimmin käytetyt tietokantaohjelmistot ( relaatiotietokannat) perustuvat relaatiomalliin. Relaatiomallin vaihtoehtona tietokannat voivat perustua muun muassa oliomalliin tai graafimalliin.

Tietokantojen historiaa

Vuonna 1959 perustettu CODASYL-komitea määritteli tietokannan hallintajärjestelmiä, joiden ensimmäinen määrittely julkaistiin vuonna 1969.

Modernien tietokantojen edeltäjiä kehitettiin 1960-luvulla. Hierarkkinen malli toteutettiin ensimmäisenä, sen jälkeen verkkomalli ja sen jälkeen relaatiomalli.

Alan uranuurtaja oli Charles Bachman. Bachmanin artikkeli "The Programmer as Navigator" julkaistiin vuonna 1973 Communications of the ACM -lehdessä. Artikkeli johti navigaatiomallin kehittämiseen. Navigaatiomalli liitetään usein hierarkkisiin ja verkkomallin tietokantoihin.lähde?

Tietokantojen relaatiomallin ja käsittelyteorian kehitti Edgar F. Codd, jonka artikkeli "A Relational Model of Data for Large Shared Data Banks" julkaistiin vuonna 1970 Communications of the ACM -lehdessä. Codd työskenteli IBM:n tutkimuslaboratoriossa, ja hän johti ensimmäisten relaatiotietokantojen testiversioiden kehitystyötä. Vuosina 1973–1976 IBM-laboratoriossa kehitettiin relaatiotietokannan prototyyppiä nimeltä System R. IBM:n kaupallinen tietokantatuote DB2 julkaistiin 1983.

Bachmanin ja Coddin näkemyserot aikanaan olivat merkittäviä tietokantojen kehitykselle vaikka varsinaista päätöstä debatille ei syntynyt.

Olio-ohjelmoinnin yleistyttyä myös tietokantoja on kehitetty vastaamaan oliomallin asettamiin tarpeisiin. On kehitetty puhtaita oliotietokantoja, minkä lisäksi perinteisiin relaatiokantoihin on lisätty olio-ohjelmointia tukevia ominaisuuksia. Jälkimmäisistä käytetään nimeä olio-relaatiotietokannat.lähde?

NoSQL-tietokannaksi kutsuttiin aluksi Carlo Strozzin vuonna 1998 esittämää järjestelmää, jossa ei käytetty SQL-kyselykieltä. Termi yleistyi vuonna 2009 Johan Oskarssonin järjestämässä tapaamisessa, jossa keskustelun aiheena olivat ei-relaatiomallin mukaiset ohjelmistot, kuten Cassandra ja Voldemort.

NoSQL-tietokantoja ovat avain-arvotietokannat, sarakkeiset tietokannat, dokumentti-orientoituneet tietokannat ja graafitietokannat. XML-tietokanta on dokumenttiorientoituneen tietokannan tyyppi.lähde?

NewSQL on tietokantaluokka, joka pyrkii yhdistämään ACID-ominaisuudet NoSQL-tietokantojen skaalautuvuuteen.

Hajautettu tietokanta on tietokanta, joka ei ole kokonaisuudessaan tallennettuna yhdessä paikassa vaan tietokoneverkon kautta toisiinsa yhdistetyillä tietokoneilla.

Hierarkkinen tietokanta

Tietokanta: Tietokantojen historiaa, Hierarkkinen tietokanta, Verkkomallin tietokanta 
Hierarkkinen malli

Varhaisin tietokantamalli on hierarkkinen malli. Hierarkkinen malli johti verkkomallin kehitykseen.

Hierarkkisessa tietokannassa tieto järjestetään ylösalaisin käännettyyn puurakenteeseen. Rakenteessa tiedoilla on isäntä–lapsi-suhde, kuten hierarkkisessa tiedostojärjestelmässä: isännällä voi olla useita lapsia mutta lapsella voi olla vain yksi isäntä. Tämä eroaa relaatiotietokannasta, jossa rakenne voidaan vapaasti määrittää.

Hierarkkinen malli oli parannusta toisiinsa liittymättömien tiedostojen käsittelystä. Hierarkkinen malli esittää hyvin yksi–moneen-suhteita, mutta sillä on ongelmia monta–moneen-suhteiden esittämisessä. Uusien riippuvaisuussuhteiden lisääminen vaatii laajaa rakenteen muokkaamista, ja seurauksena on myös sovelluksien muuttaminen.

IBM:n Information Management System (IMS) perustuu hierarkkiseen malliin: järjestelmää on edelleen käytetty vuonna 2013 IBM System Z -alustalla. IMS perustuu Yhdysvaltain avaruusohjelman materiaalihankintojen hallintaan kehitettyyn järjestelmään.

Hierarkkiseen malliin perustuviin järjestelmiin kuuluvat DNS-nimipalvelu ja LDAP-hakemistopalvelut.

Verkkomallin tietokanta

Tietokanta: Tietokantojen historiaa, Hierarkkinen tietokanta, Verkkomallin tietokanta 
Verkkomalli

Verkkomallin tietokanta suunniteltiin korjaamaan hierarkkisen mallin ongelmia, etenkin sen joustamattomuutta. Mallin ongelmia ovat esimerkiksi vaikeampi toteutus ja ylläpito. Verkkomalli johti relaatiomallin kehittämiseen. Relaatiomallia pidettiin aluksi epäkäytännöllisenä.

Verkkomallissa tiedot esitetään tietuiden puurakenteena. Riippuvuudet tietuiden välillä esitetään joukkoina, joilla on isäntä (omistaja verkkomallissa) ja lapsia (jäseniä verkkomallissa). Tietueiden liitokset esitetään osoittimina eikä toistettuina sarakkeina kuten relaatiomallissa.

Verkkomalli lisäsi mahdollisuuden useammalle omistajalle ja siten monta–moneen-suhteiden esityksen.

Charles Bachmanin General Electricille kehittämä Integrated Data Store (IDS) perustui verkkomalliin ja vaikutti myös CODASYLin toimintaan.

Relaatiotietokannat

Tietokanta: Tietokantojen historiaa, Hierarkkinen tietokanta, Verkkomallin tietokanta 
Relaatiomalli

Relaatiotietokannat perustuvat predikaattilogiikkaan pohjautuvaan relaatiomalliin, jonka käsitteitä käyttäen tietokannan peruskäsitteet, kuten taulut, määritellään. Relaatiotietokannoissa (engl. relation, suom. suhde) taulujen välille luodaan yhteyksiä. Taulujen tiedot yhdistetään toisiinsa toisen taulun avaimella. Yleisimmin ID:llä. Toisessa taulussa yhteyden luovaa saraketta kutsutaan viiteavaimeksi tai vierasavaimeksi (engl. Foreign Key).

Taulujen välisiä suhteita kuvataan usein Äiti-lapsi -termillä. Termin mukaisesti äidillä voi olla useita lapsia, mutta lapsilla ei useita äitejä (suhde 1:n). Esimerkiksi viestillä voi olla vain yksi kirjoittaja (käyttäjä), mutta käyttäjällä useita kirjoituksia. Tällaisessa tapauksessa kirjoittaja/käyttäjä on tietokannallisesti viestin äiti ja kirjoitukset ovat kirjoittajan lapsia.

Yhdistettyjen taulujen tietojen käsittelyä hallitaan viite-eheyksillä, jotka määrittävät, mitä yhdistetyille tiedoille tapahtuu, jos taulujen tiedot vaihtuvat tai ne poistetaan. Viite-eheyksillä voidaan siis määrittää esimerkiksi poistuvatko lapsitiedot, jos äititieto poistetaan (Poistuvatko viestit, jos niiden kirjoittaja poistetaan tietokannasta.).

Esimerkki yksinkertaisesta taulukkorakenteisesta tietokannasta.

ID Nimi Sukunimi Ikä
1 Pekka Pekkanen 45
2 Tieto Kantanen 23
3 Mauri Makkonen 68

Oliotietokannat

Tietokanta: Tietokantojen historiaa, Hierarkkinen tietokanta, Verkkomallin tietokanta 
Esimerkki oliomallista.

Oliomalliin perustuvat tietokannat ilmeistyivät ensi kertaa 1980-luvulla CAD-sovelluksien tarpeisiin. Toisin kuin relaatiomallissa, oliomalli ei linkitä rivejä ja sarakkeita. Oliomallin mukaisessa tietokannassa ei myöskään käytetä kiinteää skeemaa. Monimutkaisen tiedon hakeminen voi olla myös nopeampaa seuraamalla suoraan osoittimia.lähde?

Oliotietokantojen tuki kyselykielille kuten SQL on vähäisempää ja käyttö painottuu enemmän olio-ohjelmointikieliin.

Tietokannan rakentaminen

Tietokannan rakentaminen perustuu siihen tallennettavan tiedon mallintamiseen. Tiedon mallintaminen perustuu sen ja sen kuvaaman todellisuuden analyysiin, jonka tuloksena saadaan joukko entiteettejä, niiden välisiä yhteyksiä ja niiden ominaisuuksia. Nämä esitetään yleensä jonkin kuvauskielen tai tekniikan avulla. Yksi yleinen kuvauskieli on UML. Seuraavassa vaiheessa malli kuvataan jonkin reaalisen tietokantatekniikan edellyttämässä muodossa. Yksi yleinen tietokantatekniikka on relaatiotietokanta, joka perustuu relaatiotietomalliin.

Tietomalli on siis malli tiedosta, ei todellisuudesta, jota se mallintaa vain epäsuorasti. BIM (Building Information Modelling, Rakennuksen tietomalli) on vastaavasti rakentamisen käytännön toteutus tietomallista, joka perustuu aina tietokantaan.

Tietokantojen rakentamisen lisäksi tietokoneohjelmien rakentamisen yhteydessä tehdään tietomalli niistä tiedoista, joita ohjelmalla käsitellään. Tietomallia voidaan tarvita myös esimerkiksi kommunikaatioprotokollien rakentamisessa. Tietokannat voivat nykyisin tallentaa myös binääridataa. Tällöin tietomallia suunniteltaessa arvioidaan, onko tietueisiin liittyviä dataobjekteja kuten kuvia järkevintä käsitellä erillisinä tiedostojärjestelmään tallennettuina tiedostoina vai tietokantaan tallennettuina binääritietueina (tietotyypit BLOB ja CLOB).

Jos rakennetaan relaatiotietokantaa, jota hallitaan SQL-kielen avulla, viime vaiheessa tietomallissa kuvatut entiteetit luodaan tietokantaan tauluina SQL-kielen määrittelylauseilla (käytännössä CREATE-lause). Yksinkertaisimmissa tietomalleissa entiteetin sisältämät tietueet ja tietotyypit voivat sellaisinaan vastata tietokannan taulurakennetta. Tietokantajärjestelmät mahdollistavat myös monimutkaisemman toimintalogiikan toteuttamisen jopa niin, että tietokantamoottori voi SQL-kielisten kyselyiden lisäksi ajaa yleisemmillä ohjelmointikielillä toteutettuja tallennettuja proseduureja. Tämä lähestymistapa on hyödyllinen erityisesti tilanteissa, joissa asiakaspäässä on käytössä rajalliset resurssit SQL-kyselyn palauttaman datan tulkitsemiseen, jolloin tulkintaa ja muuta käyttötapaukseen liittyvää logiikkaa voidaan toteuttaa palvelinpäässä.

Tietokannan hallintajärjestelmä

Tietokannan hallintajärjestelmä on ohjelmisto (yksi tai useampia ohjelmia), jonka tehtävänä on hakea, tallentaa ja järjestää tietokoneella olevia tietoja.

Hallintajärjestelmä on toteutettu varusohjelmistonalähde?, jonka tehtävänä on tukea varsinaista tietokantamoottoria (engl. database engine) mm. optimoimalla kyselyjä käyttäen hyväksi tallennettua hakutilastoa (engl. statistics) ja indeksejä. Tietokannan hallintajärjestelmät sisältävät myös ylläpitoa helpottavia apuohjelmia joiden avulla tietokantamoottorin säilyttämä tieto voidaan varmuuskopioida ja palauttaa sekä viedä ja tuoda muihin järjestelmiin. Varusohjelmat mahdollistavat tietokantojen klusteroinnin sekä toisintamisen kun haetaan korkeampaa käytettävyyttä ja saatavuutta. Hallintajärjestelmät sisältävät nykyisin myös rakenteisten dokumenttimuotojen tuen sekä teksti-indeksoinnin laajojen tietomäärien käsittelemiseksi. Hallintajärjestelmä helpottaa ylläpitäjän työtä myös tarjoamalla yhden käyttöliittymän jonka kautta tietokantamoottorien tilaa, ominaisuuksia ja parametrejä voidaan helposti hallita. Käytännössä kuitenkin tietokantojen ylläpitäjät yhä työskentelevät mieluummin komentorivipohjaisen konsolin kautta.lähde?

Relaatiotietokantojen hallintajärjestelmistä käytetään lyhennettä RDBMS ja oliotietokantojen hallintajärjestelmistä lyhennettä ODBMS tai OODBMS.

Tietokannat käytännössä

Tietokantoja käytetään monissa sovelluksissa liki jokaisella sovellusalueella. Tietokantaa suositellaan suurien monen käyttäjän järjestelmien tiedon tallennusmekanismiksi silloin, kun tarvitaan usean käyttäjän välistä koordinaatiota. Jopa yksittäiselle käyttäjälle tietokanta voi olla sopiva ratkaisu, ja monet sähköpostiohjelmat ja kalenterisovellukset perustuvat standardin mukaiseen tietokantateknologiaan.lähde?

Transaktiot ja samanaikaisuus

    Pääartikkeli: ACID

Lisänä useimmat käytännön tietokannat pyrkivät toteuttamaan transaktiomallin, jolla on halutut tiedon oikeellisuuden säilytysominaisuudet. Ihannetapauksessa tietokantaohjelmisto noudattaa ACID-sääntöjä:

  • Atomisuus (Atomicity) – kaikki tai ei mitään. Jokainen operaatio pitää suorittaa tai sitten mitään niistä ei suoriteta. (Transaktiot, joita ei pystytä viemään loppuun, on peruttava kokonaisuudessaan.)
  • Johdonmukaisuus (Consistency) – jokaisen transaktion jäljiltä tietokannan tulee olla johdonmukaisessa tilassa.
  • Eristys (Isolation) – transaktiot eivät saa vaikuttaa toisiinsa, ja keskeneräinen suoritus ei saa näkyä muille transaktioille.
  • Pysyvyys (kestävyys, Durability) – onnistuneiden transaktioiden pitää säilyä mahdollisen kaatumisenkin jälkeen.

Käytännön toteutuksissa useimmat tietokantajärjestelmät joustavat joidenkin näiden sääntöjen noudattamisessa, jotta suorituskyky olisi parempi.

Samanaikaisuuden hallinta on menetelmä, jolla varmistetaan, että transaktiot ajetaan turvallisella tavalla ACID-sääntöjä noudattaen. Tietokantajärjestelmän pitää pystyä varmistamaan, että vain sarjallistettavat, palautettavat operaatiot ovat sallittuja ja että mitään toimintoja toteutetuista transaktioista ei menetetä silloin kun palautetaan kanta tilaan ennen peruutettua transaktiota.

Transaktioille tyypillisesti toteutetaan transaktioloki (transaktiohistoria), jolla voidaan palauttaa tietokanta aiempaan tilaan (engl. rollback) ja myös seuraavaan tilaan (engl. rollforward), esimerkiksi palautuksen jälkeen. Tästä syystä lokissa on toteutuksesta riippuen oltava varsinainen muutos ja muutosta edeltävä tieto, jotta palautus on mahdollista tehdä.

Kyselykielet

Tietokantojen hallintajärjestelmät tukevat erilaisia kyselykieliä, joita ovat:

Tietokannan oikeudellinen suoja

Tekijänoikeuslaissa erilaisille tietokannoille on myönnetty määräaikainen oikeussuoja. Lain tietokanta-käsite on toinen kuin tekniikan: lain suoja tietokannalle kattaa lähinnä tietokannan sisältämän informaation eikä niinkään esimerkiksi taulurakennetta. Suojatun tietokannan ei tarvitse olla edes sähköinen vaan se voi olla esimerkiksi kortisto. Oikeudellisen suojan edellytyksenä on merkittävä panostus tietokannan luomiseen tai järjestämiseen.lähde?

Tietokantaan liittyviä käsitteitä

Lähteet

Aiheesta muualla

 

Tags:

Tietokanta Tietokantojen historiaaTietokanta Hierarkkinen tietokantaTietokanta Verkkomallin tietokantaTietokanta RelaatiotietokannatTietokanta OliotietokannatTietokanta Tietokannan rakentaminenTietokanta Tietokannan hallintajärjestelmäTietokanta Tietokannat käytännössäTietokanta Transaktiot ja samanaikaisuusTietokanta KyselykieletTietokanta Tietokannan oikeudellinen suojaTietokanta LähteetTietokanta Aiheesta muuallaTietokantaGraafitietokantaInformaatioOliomalliRelaatiomalliTietokone

🔥 Trending searches on Wiki Suomi:

Robert OppenheimerMestisÄitienpäiväIbeJonas HemmingRögle BKMika MyllyläMaria I (Englanti)Noora LouhimoSusanna LaineHelsingin alueellinen jakoHelsingin metroSuomen alle 20-vuotiaiden jääkiekkomaajoukkueDyyni (kirjasarja)KyprosNeilikkavallankumousSalatut elämätAbbaSagrada FamíliaViikingitMV-mediaBalduin IVMaalaiskomediaAfrikkaRobert EnckellQuentin TarantinoMari Rantanen (poliitikko)Tero RoininenTanskaRomanitTekoälySuomalainen Markku-liittoOmenainenWikipediaThe Voice of FinlandNormandian maihinnousuBrasiliaIisalmiKarkurit (televisiosarja)Antti TuiskuPahanhautojaYlilautaValeri PopovitšMurha paratiisissaSimaSyyskuun 11. päivän terroriteotSamoaSuomen Sosialidemokraattinen PuolueThaimaaRMS TitanicPaaviTapparaSMC LähiörotatJuutalaisuusSaturnusLeonardo da VinciVesa VihriäläLuettelo kansalliseläimistäVille LeinoRyhmä HauRaaseporiJääkiekon SM-liigaNetflixPompejiLuettelo Yhdysvaltain presidenteistäSuurten lukujen nimetEstoniaLuterilaisuusEutanasiaKuubaSuomen kaupungitMarkkuLuettelo Euroopan joistaAnni IikkanenLapualaisoopperaPamela TolaEnglannin kieliYhdistyneet arabiemiraatitFinnkino🡆 More