Tiedonlouhinta (TIES445), syksy 2007

Opettaja: Sami Äyrämö, samiayr(at)mit.jyu.fi, Ag C416.2

Ajankohtaista (29.01.2008):

Tentti (25.1.2008) on tarkastettu ja tulokset pitäisi näkyä rekisterissä ja ilmoitustaululla parin päivän kuluessa. Loppusaldo on kahdeksan osallistujaa joissa neljä hyväksyttyä ja  neljä hylättyä. Tenttipaperit voi hakea huoneesta  C416.2. Seuraava tentti 22.2.2008.

Luennot päättyivät 11.12.2007. Viimeiset harjoitukset 12.12.2007.

Seminaaria ei järjestetä, mutta harjoitustyön tekemisestä kiinnostuneet, ottakaa yhteyttä viimeistään 14.12.2007.

Demot alkavat viikolla 48. Ne pidetään keskiviikkoisin 8:30-10:00 mikroluokassa Ag B213.1 (Lakes).

Huomatkaa uudet tenttipäivät (ks. Suorittaminen alla).

Yleistä:

Kurssi kuuluu ohjelmistotekniikan suuntautumisvaihtoehdon valinnaisiin syventäviin opintoihin. Kurssi sopii myös tilastotieteen opiskelijoille. Esitietoina edellytetään kursseja Ohjelmointi 2 (TIEP111) ja Algoritmit 2 (TIEA211) (tai vastaavia tietoja). Matematiikan ja tilastotieteen perusopinnot ovat suositeltavia.

Luennot ja harjoitukset:

Opintojakson luennot alkoivat maanantaina 29.10.2007 klo 12:15 salissa AgBeeta. Luentoja pidetään yhteensä 12 kertaa viikoilla 44-46 ja 48-50. (Viikolla 47 ei luentoja!). Luennot pidetään salissa AgBeeta. Luentojen lisäksi kurssiin sisältyy 3x2h demoja viikoilla 48-50. Osa demotehtävistä on kotona tehtäviä harjoituksia jotka palauttamalla voi saada hyvityspisteitä tenttiin. Demot pidetään keskiviikkoisin klo 8:30-10:00 mikroluokassa Ag B213.1 (Lakes).


Kurssin sisältö

  1. Kurssin yleisiä asioita ja johdatusta tiedonlouhintaan (miksi, mitä, kenelle,...)
  2. Data ja sen esikäsittely. Etäisyysmitat.
  3. KDD prosessivaiheet
  4. Tiedonlouhinta-algoritmin elementit
  5. Eksploratiivinen tiedonlouhinta
  6. Assosiaatiosääntöjen louhinta
  7. Klusterointi
  8. Luokittelu

Demot

  1. Demo1 (koodit/datat)
  2. Demo2 (koodit/datat)
  3. Demo3 (koodit/datat)

Luentoja yhteensä 24h, demoja 6h. Loppukoe.


Suorittaminen:

Kurssin voi suorittaa 3 opintopisteen (2ov) laajuisena osallistumalla lopputenttiin tai laajempana 5 opintopisteen (3ov) kokonaisuutena tekemällä harjoitustyön lopputentin lisäksi. Seminaaria ei siis järjestetä, mutta halukkaat voivat tehdä harjoitustyön, josta palkitaan 2 lisäopintopisteellä (tai 1ov). Harjoitustyöstä kiinnostuneet, ottakaa yhteyttä viimeistään 14.12.2007. HUOM. UUDET TENTTIPÄIVÄT KORPISSA (25.1.2008, 22.2.2008 ja 28.3.2008)!

Kurssi korpissa

Linkkejä:

Data mining englanti-suomi sanasto (Pirjo Moen, HY)
Matlab-opas
Mathworks
Octave köyhän miehen Matlab
Weka Data mining tool
Data Mining and Knowledge Discovery
ACM Transactions on Knowledge Discovery from Data
SIGKDD Explorations
Data & Knowledge Engineering