Tehtävä:
Isot O, Ω ja Θ

Lyhyt MathCheck-ohje (uuteen välilehteen)

Algoritmien nopeus, muistin kulutus tai muu resurssien kulutus saattaa riippua syötteen koosta monella eri tavalla. On tavallista ilmaista tämä riippuvuus isolla O-, Ω- tai Θ-merkinnällä. Tässä tehtävässä tutustutaan niihin. Konkretian vuoksi puhumme ajan kulutuksesta, mutta käsiteltävät asiat pätevät myös muistin jne. kulutukseen.

Esimerkki

Aloitamme esimerkillä, joka havainnollistaa valintatilannetta, jonka kaltaisia tulee ohjelmoinnissa usein vastaan. Tehtävään on tarjolla kaksi vaihtoehtoista algoritmia. Algoritmi A on yksinkertainen ja helppo ohjelmoida. Sen millisekunteina mitattu ajan kulutus syötteen koon `n` funktiona noudattaa lauseketta `n^2/50+1`. (Yksi sekunti on 1000 millisekuntia.) Algoritmi B on monimutkainen ja vaikea ohjelmoida. Sen millisekunteina mitattu ajan kulutus syötteen koon `n` funktiona noudattaa lauseketta `n log n+10`.

Kumpi algoritmi kannattaa valita seuraavissa tilanteissa? Vastaa A tai B.

Algoritmia tullaan käyttämään samassa ohjelmassa sata kertaa. Yhdellä kertaa syötekoko on 1000 ja muilla kerroilla 10. only_no_yes_on ok_text Oikein! /*A häviää syötekoolla 1000 niin paljon, että syötekoolla 10 saavutetut 99 voittoa eivät riitä ottamaan B:n etumatkaa kiinni.*/ hide_expr f_nodes 1 B =
tai
Algoritmia ajetaan hyvin monta kertaa, ja suurin koskaan esiintyvä syöte on kooltaan enintään 100. only_no_yes_on ok_text Oikein! /*A:n parempi nopeus pienillä syötteillä on tässä tilanteessa ratkaiseva etu.*/ hide_expr f_nodes 1 A =
tai
Kännykän käyttäjä malttaa odottaa vastausta korkeintaan 0,5 sekuntia. Laskentaan menee tämän algoritmin käyttämän ajan lisäksi 0,4 sekuntia muuhun. only_no_yes_on ok_text Oikein! /*A:lla saadaan käsiteltyä isompia syötteitä algoritmille jäävässä 0,1 sekunnissa.*/ hide_expr f_nodes 1 A =
tai
Seuraavassa käyttöjärjestelmäversiossa muun laskennan aika saatiin nopeutettua 0,2 sekuntiin. Muuten tilanne on sama kuin edellä. only_no_yes_on ok_text Oikein! /*B:llä saadaan käsiteltyä isompia syötteitä algoritmille jäävässä 0,3 sekunnissa.*/ hide_expr f_nodes 1 B =
tai
Algoritmi sijoitetaan yleiskäyttöiseen kirjastoon. Sen käytössä esiintyvistä syötekoista ei tiedetä mitään. only_no_yes_on ok_text Oikein! /*Pienillä syötteillä A olisi parempi, mutta myös B on niillä varsin nopea. Suurilla syötteillä A on ratkaisevasti huonompi.*/ hide_expr f_nodes 1 B =
tai

Toivottavasti nämä esimerkit riittivät vakuuttamaan, että vaikka B on vaikea toteuttaa ja pienillä syötteillä hitaampi kuin A, se on silti yleensä paras valinta. A on selvästi paras vain jos on varmaa, että suurin koskaan esiintyvä syöte on pieni. Yleensä syötekokoja koskeva tieto on puutteellista. Yksikin iso syöte saattaa viedä A:lla niin paljon aikaa, että se ratkaisee kokonaisajankulutuksen B:n eduksi.

B häviää kun kaikki syötteet ovat pieniä, mutta pienillä syötteillä kumpikin algoritmi kuluttaa aikaa niin vähän, että sillä ei yleensä ole merkitystä. Poikkeus tästä on, että jos algoritmia kutsutaan monta kertaa ja aina pienellä syötteellä, niin B on merkittävästi hitaampi.

Toisin kuin voisi luulla, tietokoneiden nopeuden kasvu yleensä lisää eikä vähennä niiden tilanteiden määrää, joissa kannattaa valita B, koska se kasvattaa sitä syötekokoa jonka kumpikin algoritmi ehtii käsitellä ennen kuin ajan kulutus käy liian suureksi.

Motivaatio

Jos yhden ohjelman ajan kulutus on `20 n log n + 5` ja toisen `15 n log n + 5`, niin on selvää, että jälkimmäinen on nopeampi. Valitettavasti tilanne on erittäin harvoin näin selvä.

Ensiksi, ajan kulutus riippuu usein syötteen koon lisäksi syötteen laadusta. Esimerkiksi insertion-sort on melkein järjestyksessä olevalle isolle taulukolle paljon nopeampi kuin samankokoiselle täysin sekaisessa järjestyksessä olevalle taulukolle. Silloin tämän kaltainen lauseke pystyy esittämään ajan kulutuksen vain tietynlaisille syötteille. Usein ajan kulutus esitetään samankokoisista syötteistä sille, jolla aikaa kuluu eniten. Toisinaan esitetään samankokoisten syötteiden ajan kulutuksien keskiarvo.

Toiseksi, ajan kulutusta tarkasti kuvaava funktio on usein monimutkainen. Se voi olla esimerkiksi `8n^2 - 2 n |__log n__| + 12 n + 7`. Melkein aina on kuitenkin olemassa yksinkertainen funktio, joka tuottaa suurilla `n`:n arvoilla likimain samat tulokset. Tässä esimerkissä `8n^2` on sellainen funktio. Tällainen yksinkertainen funktio tuottaa yleensä riittävän tarkan tuloksen, koska ajan kulutusta suurilla syötteillä ei yleensä tarvitse tietää aivan tarkkaan, ja pienillä syötteillä riittää yleensä tieto että se on pieni.

Kolmanneksi, usein tiedämme esimerkiksi, että ajan kulutus suurilla syötteillä on likimain `c n log n`, missä `c` on jokin vakio, mutta emme yleensä tiedä `c`:n arvosta juuri mitään silloin kun tietoa tarvittaisiin. Se riippuu käytössä olevasta tietokoneesta, ohjelmointikielestä, kääntäjästä tai tulkista, käyttöjärjestelmän versiosta, algoritmin toteutuksen yksityiskohtien valinnasta, muista tietokoneessa samanaikaisesti suoritettavista ohjelmista ja mahdollisesti jopa akun varaustilasta.

Kun ohjelma on toteutettu, `c`:lle voidaan usein (mutta ei aina) saada hyvä likiarvo mittauksilla. Tämä on liian myöhään, jos olisimme halunneet tiedon sen päättämiseksi, mikä vaihtoehto kannattaa toteuttaa.

Käytännössä algoritmi pyritään toteuttamaan niin hyvin kuin kohtuullisella vaivalla onnistuu. Yleensä sillä tavalla tulee riittävän hyvä tulos, jos algoritmi on hyvin valittu. Jollei tule, aletaan etsiä keinoja nopeuttaa toteutusta tai muulla tavalla ratkaista ongelma.

Tilanne on toisenlainen silloin, kun verrattavana on kaksi algoritmia, joiden ajan kulutusten yksinkertaiset likimääräiset funktiot ovat eri muotoa. Olkoot ne esimerkiksi `c n^2` ja `d n log n`. Koska suoritusajat eivät voi olla nolla eivätkä negatiivisia, pätee `c > 0` ja `d > 0`. Ovatpa `c` ja `d` mitä tahansa positiivisia reaalilukuja, on vääjäämättä olemassa jokin luku, jota suuremmilla `n`:n arvoilla `d n log n``<``c n^2`. Mitä suurempi `d` on ja mitä pienempi `c` on, sitä suurempi pienin tällainen luku on. Käytännön tilanteissa pienin tällainen luku on melkein aina niin pieni, että sitä suuremmat syötteet ovat tavallisia. Tästä nyrkkisäännöstä on poikkeuksia, mutta ne ovat harvinaisia.

Tästä ei seuraa, että aina kannattaa valita algoritmi, jonka ajan kulutuksen muoto on paras. On esimerkiksi tavallista, että vaikka `c n` onkin muodoltaan parempi kuin `d n log n`, ero on isoillakin syötteillä niin pieni, että sillä ei ole merkitystä. Sen sijaan `c n^2` on yleensä isoilla syötteillä niin hidas, että paremman vaihtoehdon etsimiseen ja toteuttamiseen kannattaa panostaa. Oikea johtopäätös on, että ajan kulutuksen muotoon kannattaa kiinnittää paljon huomiota.

Oletetaan, että ohjelmaa ajetaan aina samalla tietokoneella samassa käyttöjärjestelmässä siten, että koneessa ei ole samanaikaisesti muuta kuormitusta ja kaikki fyysiset tekijät on vakioitu (akku on aina täydessä latauksessa, lämpötila on aina sama jne.). Ajan kulutus mitataan monenkokoisilla syötteillä ja havaitaan, että se on varsin tarkasti `38 n^3` kun `n >= 100`. Voidaanko pitää melko varmana, että `38 n^3` on hyvä likiarvo ajan kulutukselle aina kun `n >= 100`?

	ei
	kyllä

tai

Merkinnät

Edellä kerrotuista syistä algoritmien analyysissä riittää yleensä tunnistaa eniten merkitsevä termi, esimerkiksi `cn^2` tai `cn log n`, ja ilmoittaa se ilman vakiokerrointa `c`. Tähän käytetään O-, Ω- ja Θ-merkintöjä. Ne luetaan ”iso oo”, ”iso omega” ja ”iso theta”, koska myös ”pikku oo” ja "pikku omega” ovat käytössä samantapaisissa rooleissa. Tässä tehtävässä opiskelemme kolme ensin mainittua. Niiden merkitys on seuraava:

`O(n^2)` ajan kulutus on enintään muotoa `n^2`.
`Omega(n^2)` ajan kulutus on vähintään muotoa `n^2`.
`Theta(n^2)` ajan kulutus on tarkalleen muotoa `n^2`.

Muut merkinnät kuin Θ tarvitaan, koska ajan kulutuksen muotoa ei aina pystytä selvittämään tarkasti eikä välttämättä edes ole olemassa muotoa, joka pätisi kaikenlaisille syötteille. Esimerkiksi insertion-sortin ajan kulutus on melkein järjestyksessä oleville taulukoille muotoa `c n` ja tyypillisille taulukoille muotoa `c n^2`. Millekään taulukoille se ei ole parempi kuin `c n` eikä huonompi kuin `c n^2`. Siksi voidaan sanoa, että insertion-sortin ajan kulutus on `Omega(n)` ja `O(n^2)`, mutta ei voida sanoa, että se on `Theta(...)`, olipa kolmen pisteen paikalla mitä tahansa. Kuitenkin voidaan sanoa, että se on hitaimmillaan `Theta(n^2)` ja nopeimmillaan `Theta(n)`.

Tarkoittaako ”algoritmi on hitaimmillaan `Theta(n^2)`” samaa kuin ”algoritmin ajan kulutus on `O(n^2)`”?

	ei
	kyllä

tai

Jos `k > h`, niin `n^k` merkitsee enemmän kuin `n^h`. Termi `n` merkitsee enemmän kuin `sqrt n`, ja `sqrt n` merkitsee enemmän kuin `log n`.

Kirjoita sulkujen sisään mahdollisimman yksinkertainen lauseke siten, että väittämä pätee.

Mitkä seuraavista pätevät insertion-sortin suoritusajalle?

Mitkä seuraavista pätevät insertion-sortin hitaimman tapauksen suoritusajalle?

Mitkä seuraavista pätevät insertion-sortin nopeimman tapauksen suoritusajalle?

Tästä tärkeästä asiasta olisi paljon enemmänkin sanottavaa, mutta eiköhän tässä ollut riittävästi yhdelle kertaa.

	Syötteen koko voi olla vain luonnollinen luku, mutta käyrät käyttävät `n`:n arvoina muitakin lukuja.
	Laatikossa valmiina olevan arvon tuottamat käyrät riittävät A:n ja B:n vertaamiseen.
	A on aina nopeampi kuin B.
	Niillä `n` joilla B on hitaampi kuin A, B kuluttaa alle 0,3 sekuntia.

`n`	1	10	100	1000	10000
A	only_no_yes_on ok_text Oikein! f_nodes 5 hide_expr (1^2)/50+1 =	end_of_answer arithmetic f_nodes 1 hide_expr (10^2)/50+1 =	end_of_answer arithmetic f_nodes 1 hide_expr (100^2)/50+1 =	end_of_answer arithmetic f_nodes 1 hide_expr (1000^2)/50+1 =	end_of_answer arithmetic f_nodes 1 hide_expr (10000^2)/50+1 =
B	end_of_answer arithmetic f_nodes 1 hide_expr 1 log 1 + 10 =	end_of_answer arithmetic f_nodes 1 hide_expr 10 log 10 + 10=	end_of_answer arithmetic f_nodes 1 hide_expr 100 log 100 + 10 =	end_of_answer arithmetic f_nodes 1 hide_expr 1000 log 1000 + 10 =	end_of_answer arithmetic f_nodes 1 hide_expr 10000 log 10000 + 10 =

`O(log n)`	`O(n)`	`O(n sqrt(n))`	`O(n^2)`	`O(n^3)`

`Omega(log n)`	`Omega(n)`	`Omega(n sqrt(n))`	`Omega(n^2)`	`Omega(n^3)`

`Theta(log n)`	`Theta(n)`	`Theta(n sqrt(n))`	`Theta(n^2)`	`Theta(n^3)`

	Eniten merkitsevä termi ilman vakiokerrointa antaa aina riittävän tarkan tiedon algoritmin nopeudesta isoilla syötteillä.
	Algoritmin nopeuden selvittäminen kannattaa aloittaa selvittämällä eniten merkitsevä termi ilman vakiokerrointa, mutta asiaa on yleensä välttämätöntä tutkia myös tarkemmilla keinoilla.
	Eniten merkitsevä termi ilman vakiokerrointa antaa hyvin usein, mutta ei aina, riittävän tarkan tiedon algoritmin nopeudesta.

Teh­tä­vä: Isot O, Ω ja Θ

Esi­merk­ki

Mo­ti­vaa­tio

Mer­kin­nät

Tehtävä:
Isot O, Ω ja Θ

Esimerkki

Motivaatio

Merkinnät