Tehtävä:
Hajautustaulun muistinkäyttö

Lyhyt MathCheck-ohje (uuteen välilehteen)

Hajautustaulu (hash table) on erittäin tehokas tietorakenne silloin, kun tietoja tarvitsee lisätä, poistaa ja etsiä avaimen perusteella, mutta ei tarvitse esimerkiksi selata suuruusjärjestyksessä. Hajautustauluun kannattaa tallettaa esimerkiksi puhelinluettelo, josta etsitään puhelinnumeroita nimien perusteella, mutta ei toisinpäin. (Toisinpäin etsimistä varten voi olla toinen hajautustaulu.) Tällöin avaimena on nimi. Hyvin suunniteltu hajautustaulu on erittäin nopea eikä tuhlaa muistia. Tässä tehtävässä tarkastellaan hajautustaulun muistinkulutusta.

Hajautustauluesimerkki Oheinen kuva esittää hajautustaulua. Siinä on taulukko, jonka alkiot ovat osoittimia. Osoittimesta alkaa linkitetty lista, jonka kukin tietue sisältää yhden hyötykuorman, siis esimerkiksi yhden nimen ja puhelinnumeron. Kuvassa hyötykuormana on lukuja. Tietueessa on myös osoitin listan seuraavaan alkioon.

Lista, johon kukin hyötykuorma sijoitetaan, valitaan hajautusfunktion avulla. Se ottaa avaimen ja tuottaa luvun väliltä 0, …, M − 1, missä M on taulukon koko ja taulukkoa indeksoidaan nollasta alkaen. Hajautusfunktio pyritään valitsemaan siten, että eri avaimet jakautuisivat mahdollisimman tasaisesti eri listoihin. Tällä tavoitellaan sitä, että pisin lista olisi mahdollisimman lyhyt. Hajautustaulu on sitä hitaampi, mitä enemmän on pitkiä listoja ja mitä pitempiä ne ovat. Hyvän hajautusfunktion suunnittelu vaatii taitoa. Emme käsittele sitä tässä yhteydessä tämän enempää, mutta mainittakoon, että usein hajautusfunktioissa hyödynnetään modulaarista aritmetiikkaa.

Mitä suurempi taulukko valitaan, sitä lyhyempiä listoista keskimäärin tulee, mutta sitä enemmän muistia taulukko itse vie.

Nykyaikaisissa tietokoneissa on tavallista, että tällaisissa tilanteissa muistia annetaan 8 tavua kerrallaan. Siksi oletamme, että osoitin vie 8 tavua ja yksi hyötykuorma (eli esimerkiksi yksi nimi ja yksi puhelinnumero) vie 8h tavua. Hajautustauluun on talletettava n hyötykuormaa.

Voidaan siis varsin huoletta antaa p:n liikkua välillä

≤ p ≤ 2. Muutkin p:n arvot voivat olla käyttökelpoisia riippuen mm. h:n arvosta, hajautusfunktion laskemiseen kuluvasta ajasta ja siitä, kuinka huolellisesti suorituskyky tarvitsee optimoida.

	On tärkeää, että p on mahdollisimman pieni.
	p ei saa olla pieni.
	Ei ole paljoa merkitystä, onko p pieni vai keskisuuri.
	On tärkeää, että p on mahdollisimman suuri.
	p ei saa olla suuri.
	Ei ole paljoa merkitystä, onko p keskisuuri vai suuri.

Teh­tä­vä: Ha­jau­tus­tau­lun muis­tin­käyt­tö

Tehtävä:
Hajautustaulun muistinkäyttö