$\newcommand{\bra}[1]{\langle#1|} \newcommand{\ket}[1]{|#1\rangle} \newcommand{\braket}[2]{\langle#1|#2\rangle} \newcommand{\vev}[1]{\langle#1\rangle} \newcommand{\C}{\mathbb{C}} \newcommand{\R}{\mathbb{R}} \newcommand{\N}{\mathbb{N}} \newcommand{\H}{\mathcal{H}} \newcommand{\eps}{\varepsilon}$

Selvyyttä epäselvyyksiin

Takaisin kurssin Kvanttimekaniikka 1 kotisivulle. Päivitetty 21.12.2011.

Alla selvitetään laskuharjoituksissa ilmenneitä epäselvyyksiä. Jos alla esitetyt vastauksen eivät valaise asioita tarpeeksi, niistä kannattaa kysyä uudemman kerran demoissa tai sähköpostilla (Joonas Ilmavirta). Selvitykset on jaoteltu viikoittain ja aihepiireittäin. Laskuharjoituksissa (viimeisessä tehtävässä) esitetyt kysymykset on lihavoitu. Lopussa on myös muutama sana kandidaatin tutkielman tekemisestä – tämän kurssin jälkeen se alkaa olla ajankohtaista.

Vastauksia viikoittain: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10.

Laskuharjoitus 1

Kompleksiluvut

Kun puhutaan kompleksiluvuissa reaali- ja imaginääriosasta, otetaanko imaginääriosssa $i$-yksikkö mukaan? Voiko reaaliosassa olla $i$ missään muodossa, edes eksponentissa? Kompleksiluvun $z$ reaali- ja imaginääriosa ovat reaalilukuja. On siis olemassa (yksikäistteiset) reaaliluvut $a$ ja $b$ siten, että $z=a+bi$. Jos kompleksiluku on kirjoitettu muodossa $z=a+bi$, ovat $a$ ja $b$ sen reaali- ja imaginääriosat vain jos sekä $a$ että $b$ ovat reaalilukuja. Joskus sanotaan laiskasti, että kompleksiluvun $z=a+bi$ ($a,b\in\R$) imaginääriosa on $bi$, vaikka pitäisi sanoa sen olevan $b$. Reaaliosan täytyy olla reaaliluku, ja helpoin tapa varmistua siitä on, ettei lausekkeessa esiinny imaginääriyksikköä missään.

Mikä on aaltofunktion suhteellinen vaihe? Oletetaan seuraavassa, että $a,b,\alpha,\beta\in\R$ ja $a,b>0$. Kompleksilukujen $\psi=ae^{i\alpha}$ ja $\phi=be^{i\beta}$ vaiheet ovat $\alpha$ ja $\beta$. Kvanttimekaniikssa laskemme lopulta aina kompleksiluvuistamme neliöt $|\psi|^2=a^2$ ja $|\phi|^2=b^2$, joissa vaihe ei näy. Jos kuitenkin laskemme kaksi kompleksilukua yhteen muodostaaksemme luvun $\psi+\phi$, jonka neliön tarvitsemme, päädymme harjoitustehtävän 1 tulokseen $|\psi+\phi|^2=a^2+b^2+2ab\cos(\alpha-\beta)$. Nyt vaiheiden erotuksella $\alpha-\beta$ onkin selvästi väliä! Jos kerromme summaa jollakin vaihtekijällä $e^{i\gamma}$, missä $\gamma\in\R$, lisätään vaiheisiin $\alpha$ ja $\beta$ molempiin $\gamma$, joten niiden erotus ei muutu. Siispä kokonaisvaiheella ($\gamma$, jos koko kiinnostavaa summaa kerrotaan vaihetekijällä $e^{i\gamma}$) ei ole väliä, mutta suhteellisella vaiheella (yksittäisten vaiheiden $\alpha$ ja $\beta$ erotuksella; useamman summattavan tapauksessa kaikilla vaiheiden erotuksilla) on väliä.

Matriisit, operaattorit, bra- ja ket-vektorit

Yksinkertaisuuden vuoksi on hyvä ajatella alkuun, että tutkittava Hilbertin avaruus on $\C^n$ (kompleksiluvut toimivat oleellisesti samoin kuin reaaliluvut). Myös tämä on Hilbertin avaruus, mutta usein tarvitaan kuitenkin ääretönulotteista avaruutta. Äärettömyyden huolelliseen käsittelyyn liittyy kuitenkin sotkuja, joita ei ehkä kannata yrittää selvittää ennen kuin äärellisulotteinen tapaus on hallinnassa. Fyysikot usein sivuuttavat monet hankaluudet, ja niin teemme mekin; jos yrittäisimme tehdä kaiken hyvin huolellisesti, emme ikinä pääsisi fysiikkaan asti. Ääretönulotteisten avaruuksien teoriaa selvitetään matematiikan kurssilla Funktionaalianalyysi, jonka eräs luentomoniste löytyy Lauri Kahanpään kotisivulta.

Voi ajatella, että ket-vektori on pystyvektori ($n \times 1$-matriisi), bra-vektori vaakavektori ($1 \times n$-matriisi) ja operaattori neliömatriisi. (Matematiikan kurssi Lineaarinen algebra ja geometria 1 on näiden asioiden kannalta hyödyllinen. Ellet ole käynyt kurssia, voi silmäillä sen luentomonistetta FYS4:ssä.) Kompleksisessa tilanteessa on luontevaa korvata matriisin transpoosi Hermiten konjugoinnilla, eli kompleksikonjugoida transponoinnin lisäksi: siispä matriisin $A$ hermiittisen konjugaatin $A^\dagger$ elementit ovat $(A^\dagger)_{ij}=A_{ji}^*$. Tämä on luonnollista siksi, että kun sisätulon vektorien $u$ ja $v$ määritellään olevan $u\cdot v=u^\dagger v = \sum_i u_i^*v_i$, tulee vektorin sisätulosta itsensä kanssa aina positiivinen reaaliluku. Monesti sisätuloa merkitään myös näin: $u\cdot v=\braket{u}{v}$.

Operaattorin $\hat{A}$ adjungoitu operaattori $\hat{A}^\dagger$ ja sen käyttö on hakusessa. $\R^n$:ssä voidaan matriisin $A$ transpoosi $A^T$ määritellä siten, että sisätulolle pätee $u\cdot(Av)=(A^Tu)\cdot v$ kaikille vektoreille $u,v\in\R^n$ (jos et usko heti, todista itsellesi, että tämä määritelmä on yhtäpitävä tavallisesti esitetyn kanssa). Kompleksikertoimisessa avaruudessa voidaan samoin määritellä hermiittinen konjugointi joko yllä esitetyllä tavalla alkioittain tai vaatimalla $u\cdot(Av)=(A^\dagger u)\cdot v$ kaikilla $u,v\in\C^n$.

Tikari näyttää toimivan suunnilleen samoin kuin transpoosi. Onko kyse samasta asiasta? Kyse on hyvinkin samasta asiasta. Pieniä ongelmia voi tulla ääretönulotteisissa avaruuksissa, mutta ne sivuutamme.

Miksi operaattorin $\hat{A}$ adjungoitu operaattori $\hat{A}^\dagger$ on määritelty $\braket{\psi}{\hat{A}^\dagger \phi} = \braket{\hat{A} \psi}{\phi}$? Tämä on luonteva yleistys traspoosille, kuten yllä on esitetty. Jos olet käynyt lineaarialgebran kursseja matematiikan laitoksella, olet huomannut, että sisätulolla on keskeinen asema, ja matriisin transpoosi (adjungaatti) on hyödyllinen käsite niiden manipuloinnissa. Tästä on kyse myös kvanttimekaniikassa.

Miksi observaabelia vastaavan operaattorin täytyy olla hermiittinen, jos sillä kuitenkin on reaaliset ominaisarvot? Ovatko kaikki reaaliset ominaisarvot omaavat operaattorit hermiittisiä? Kvanttimekaniikan postulaattien taustaa ei täysin ymmärretä; on vain osoittautunut, että niiden varaan rakennettu teoria näyttää kuvaavan luontoa – kumma kyllä. Jos ominaisarvot vastaavat mittaustuloksia, on luonnollista vaatia, että ne ovat reaaliset, mutta hermiittisyys vaikuttaa kieltämättä ylimääräiseltä vaatimukselta. Tämän matriisin ominaisarvot ovat reaaliset 1 ja 2, vaikkei se ole hermiittinen: $\begin{pmatrix}1&i\\0&2\end{pmatrix}$. (Lisähuomautus: Ellei Hamiltonin operaattori $\hat{H}$ olisi hermiittinen, ei aikakehitysoperaattori $\hat{U}(t)=e^{i\hat{H}t/\hbar}$ olisi unitaarinen. Tällöin todennäköisyys ei säilyisi!)

Mikä on operaattori? Onko operaattori matriisi? Sanaa operaattori käytetään sekä matematiikassa että fysiikassa monessa merkityksessä. Useimmiten se tarkoittaa lineaarikuvausta kahden vektoriavaruuden välillä. $\C^n$:n tapauksessa voimme siis samaistaa operaattorin matriisiin – kursseilla Lineaarinen algebra ja geometria 1 ja 2 selvitellään lineaarikuvauksen ja matriisin yhteyttä toisiinsa, ja tämä yhteys on oleelisesti samanlainen kaikissa Hilbertin avaruuksissa. Jos tarkastellaan Hilbertin avaruutta $\H$ ja lineaarikuvausta $A:\H\to\H$, voidaan sitä vastaavan matriisin elementeiksi sanoa lukuja $A_{ij}=\braket{\psi_i}{A \psi_j}$, kun vektorit $\psi_i$ ($i$ kuuluu johonkin indeksijoukkoon, vaikkapa $\N$) muodostava avaruuden kannan. Tällainen matriisi sattuu vain olemaan iso: se on "$\N\times\N$-matriisi" tai "$\infty\times\infty$-matriisi". Lineaarialgebran kurssin matematiikan puolella käyneille: operaattori on lineaarikuvaus, ja sitä vastaa matriisi (kunhan on valittu jokin kanta) kuten kyseisellä kurssilla on opittu.

Mitä hermiittinen konjugointi tekee kvanttimekaniikassa operaattorille $\hat{A}$? Mitä se kertoo meille? Kovin hyvää fysikaalista tulkintaa en osaa antaa. Se on lähinnä matemaattinen apuväline. Pieni yritys kuitenkin: Sisätulo $\braket{\psi}{\hat{A}\phi}$ kertoo, kuinka paljon tilat $\ket{\hat{A}\phi}$ ja $\ket{\psi}$ ovat päällekkäin (samoin kuin sisätulo $\R^n$:ssä kertoo, kuinka samansuuntaisia vektorit ovat), ja $\hat{A}^\dagger$ on se operaattori, joka siirrettynä päällekkäisyystarkastelun (sisätulon) toiselle puolelle säilyttää aina päällekkäisyyden täsmälleen.

Mitä kommutointi tarkoittaa? Kaikille matriiseille $A$ ja $B$ ei päde $AB=BA$. Jos se kuitenkin pätee, ne kommutoivat. Toisaalta kommutointi tarkoittaa matriisien järjestyksen vaihtamista, jolloin saattaa jäädä jäljelle "ylimääräisiä osia": $BA=AB+(BA-AB)$ (tämä on joskus hyödyllistä, niin pöljältä kuin se näyttääkin).

Voiko näissä adjoint-operaattoreissa käytettyä merkintää $\braket{\hat{A}^\dagger\psi}{\phi}$ nimittää bracketiksi? Näyttää jotenkin hassulta, kun operaattori on bra- tai ket-vektorin sisällä. Sen sijaan, että muodostaisimme vektoreiden $\ket{\psi}$ ja $\ket{\phi}$ sisätulon $\braket{\psi}{\phi}$, voimme myös kertoa jälkimmäistä $\hat{A}$:lla ja muodostaa sisätulon $\braket{\psi}{\hat{A}\phi}$. Tätä on joskus kätevä merkitä myös $\braket{\psi}{\hat{A}|\phi}$. Sama asia se silti on. Merkintä $\braket{\hat{A}^\dagger\psi}{\phi}$ on siis aivan hyvä bracket-merkintä – sekä $\hat{A}^\dagger\ket{\psi}$ että $\ket{\phi}$ ovat järkeviä vektoreita, joten niiden sisätulo on järkiperäinen kapistus.

Miten operaattorin voi laittaa bra-vektorin oikealle puolelle? Onko $\bra{\psi}\hat{A}^\dagger=\hat{A}\bra{\psi}$? Palataksemme yllä esitettyyn analogiaan, bra-vektori on vaakavektori (sarakevektori), joten sen kertominen vasemmalta ei ole edes määritelty! Sen sijaan sitä voi kertoa oikealta. Siis: $\hat{A}\bra{\psi}$ ei ole määritelty, mutta adjungoidun operaattorin määritelmän perusteella $\bra{\psi}\hat{A}^\dagger=\bra{\hat{A}\psi}$ (jos näitä kerrotaan oikealta millä tahansa ket-vektorilla $\ket{\phi}$, saadaan sama tulos, joten ne ovat samat).

Onko $\hat{A}(\phi\psi)=(\hat{A}\phi)(\hat{A}\psi)$? Ei ole mitään takeita, että kahden aaltofunktion (pisteittäinen) tulo olisi järjellinen aaltofunktio, joten operaattorin käyttäminen tällaiseen tuloon ei ole oikein mielekästä. Tämä vastaa ajatusta, ettei kahta pystyvektoria voi kertoa keskeneen mielekkäästi.

Mitä ovar observaabeli, operaattori ja Hilbertin avaruus? Observaabeli on havaittava suure. Hilbertin avaruus on tällä kurssilla sama asia kuin "kaikkien järjestelmän kvanttimekaanisten tilojen joukko" (jossa on määritelty sisätulo) – matemaattiselta kannalta tämän tilajoukon vaaditaan olevan ns. Hilbertin avaruus, ja tällöin teoria näyttää toimivan hyvin. Hilbertin avaruus on määritelmänsä mukaan täydellinen (reaali- tai kompleksikertoiminen) sisätuloavaruus, muttei ole hyvä idea uppoutua tällä kurssilla liikaa yksityiskohtiin tässä. Funktionaalianalyysin kurssi on sitä varten. Operaattori on tässä Hilbertin avaruudessa toimiva lineaarikuvaus, ja jokaista observaabelia vastaa jokin tällainen operaattori.

Mitä ovat $c_n$-termit? Lyhyesti: Ne ovat koordinaatteja. Avaruudella $\C^n$ on jotkin kantavektorit $\psi_1,\dots,\psi_n$. Jokainen vektori $\phi\in\C^n$ voidaan esittää näiden kantavektorien avulla: $\phi=\sum_{i=1}^n c_n\psi_n$ joillekin kertoimille (koordinaateille) $c_n\in\C$. Ääretönulotteisessa avaruudessa kannassa on äärettömän monta alkiota, joten tämä summakin on ääretön. Jos kanta on ortonormaali, voidaan kertoimet $c_n$ laskea kätevästi muodossa $c_n=\braket{\psi_n}{\phi}$.

Jos kaikilla $\psi,\phi$ pätee $\int dx \psi^*\hat{A}\phi=0$, miksi $\hat{A}=0$? Tämä pitää paikkansa Hilbertin avaruudessa. En yritä todistaa tätä tarkemmin, mutta kehotan vertaamaan sitä lineaarialgebrasta helposti saatavaan tulokseen: Jos $u^TAv=0$ kaikille vektoreille $u,v\in\R^n$, niin $n \times n$-matriisi $A$ on nollamatriisi.

Aaltofunktiot

Jos liikemääräoperaattorilla ja gradientilla on yhteys $-i\hbar\nabla_x \leftrightarrow \hat{\vec{p}}$, niin onko paikkaoperaattorilla $\hat{\vec{x}}$ jokin vastaava yhteys jollekin? Paikkaoperaattori vastaa paikkakoordinaatilla kertomista prujun määritelmän mukaan. (Tähän mennessä aaltofunktiot ovat olleet paikan funktioita. Kun niistä tehdäänkin myöhemmin kurssilla liikemäärän funktioita, vastaa liikemääräoperaattori liikemäärällä kertomista ja paikkaoperaattorille on $+i\hbar\nabla_p \leftrightarrow \hat{\vec{x}}$. Tästä lisää kurssilla myöhemmin.)

Operaattorin $\hat{A}$ määrittelyssä $\hat{A}\psi=\phi\in\C$. Kuitenkin paikkaoperaattorille pätee $\hat{\vec{x}}\psi=\vec{x}\psi\in\C^3$. Miksi niin? Jos halutaan olla tarkkoja, pitäisi määritellä, että $\hat{\vec{x}}$ on vektori, jonka koordinaatit ovat operaattoreita. Kolmessa ulottuvuudessa meillä on siis oikeastaan kolme paikkaoperaattoria niputettuna vektoriksi: $\hat{\vec{x}}=(\hat{x}_1,\hat{x}_2,\hat{x}_3)$. Nämä vaikuttavat aaltofunktioon $\psi$ pisteessä $y$ seuraavasti: $\hat{x}_i \psi(\vec{y})=y_i \psi(\vec{y})$ kullekin $i$.

Mitä tarkoittaa neliöintegroituvuus? Funktion sanotaan olevaan neliöintegroituva, jos sen neliö (oikeastaan itseisarvon neliö) on integroituva. Siispä funktio $f:\R\to\C$ on neliöintegroituva, jos integraali $\int_{-\infty}^{\infty} dx |f(x)|^2$ on olemassa ja äärellinen.

Jos aaltofunktion raja-arvo on $\pm$ äärettömässä nolla, päteekö sama välttämättä sen derivaatalle? Tarvittavan Hilbertin avaruuden tarkka määrittely on hyvin vaikeaa. Emme puutu siihen tarkemmin nyt, vaan annamme itselle luvan olettaa joitain intuitiivisia "siisteysominaisuuksia". Näihin kuuluu se, että aaltofunktio, samoin kuin sen kaikki derivaatat, lähestyy nollaa kun mennään mihin hyvänsä suuntaan äärettömän kauas. On kuitenkin olemassa funktioita, jotka ovat neliöintegroituvia ja menevät äärettömyyksissä nollaan, mutta niiden derivaatat eivät tee samoin, esimerkiksi $f(x)=e^{-x^2}\sin(x^4)$.

Luennolla pääteltiin funktion $\psi$ neliöintegroituvuudesta $\psi$:lle rajaehtoja. Millaisia ovat Hilbertin avaruudet ja mitä niiden perusteella voidaan päätellä aaltofunktioista? Edellisen kysymyksen vastaus vastaa myös tähän – tai on vastaamatta, jos se on parempi kuvaus tilanteesta.

Kuinka Diracin merkintöjä oikein tehdään, eli millä perusteella $\int d^3x\phi^*\psi=\braket{\phi}{\psi}$? Avaruuden $\C^n$ vektori $a$ on lukujono $(a_1,\dots,a_n)$, joka on indeksoitu joukolla $\{0,\dots,n\}$. Kurssilla tutkimamme Hilbertin avaruus koostuu (riittävän siisteistä) funktioista $\psi:\R^n\to\C$. Tämäkin on "jono" kompleksilukuja: indeksijoukko vain on koko $\R^n$. Olemme siis korvanneet $i$:nnen koordinaatin $a_i$ tässä "$\vec{x}$:nellä koordinaatilla" $\psi(\vec{x})$. Tätä ajatusta vasten on luontevaa korvata äärellisulotteinen sisätulo $\braket{u}{v}=\sum_{i=1}^n u_i^*v_i$ sisätulolla $\braket{\phi}{\psi}=\int_{\R^n} d^nx \phi(\vec{x})^*\psi(\vec{x})$.

Mitä eroa on $\psi(t,x)$:llä, $\psi_n$:llä ja $\psi$:llä? Fyysikot (ja matemaatikot) ovat monesti laiskoja, ja merkitsevät funktion $f$ arvoa pisteessä $x$ oikean merkinnän $f(x)$ sijaan vain $f$, kun on "helppo" päätellä, että $(x)$ kuuluu paikalleen. Kun alalla on pitkään, tulee sokeaksi sille, mikä on helppoa. Jos siis mietityttää, onko jossain kyseessä funktio vai sen arvo, kysy! Esimerkiksi funktioiden $f$ ja $g$ sisätulo on $\braket{f}{g}=\int_{\R^3} d^3x f(\vec{x})^*g(\vec{x})$, missä kaikki argumentit on merkitty näkyviin. Vertaa tätä edellisen vastauksen lopussa olevaan vertailuun sisätuloista $\braket{u}{v}$ ja $\braket{\phi}{\psi}$ ja tarkkaile indeksien ja argumenttien esiintymistä. Funktiot $\psi_n$ ovat tutkimamme Hilbertin avaruuden kantavektorit (kuten euklidisen avaruuden $e_1,e_2,\dots,e_n$) ja mikä hyvänsä vektori $\psi$ voidaan lausua näiden summana sopivin kertoimin. On hieman harmillista, että on tullut tavaksi käyttää samaa kirjainta $\psi$ molemmissa.

Muuta

Monikin asia epäselvä. Esimerkkejä tulee toivottavasti lisää. Luennoilla on esitetään jotain esimerkkejä, ja myös laskuharjoituksiin on valittu joitain hyviä esimerkkilaskuja. Runsaammin esimerkkejä löytyy oppikirjoista, joita löytyy parikin erilaista FYS4:stä. Jos kirjojen esimerkitkään eivät tunnu riittäviltä, kysy uudestaan.

Toivoisin lisää perusteisiin meneviä esimerkkejä tai kotisivulle linkkejä sivuille, joissa asioista on kerrottu eri kantilta tai esitelty monipuolisia esimerkkejä. Laitan tänne linkkejä, jos löydän hyviä sivuja. Niiden löytäminen ei tosin ole välttämättä helppoa, joten en uskalla luvata mitään. Kerro, jos löydät jotain kiinnostavaa netistä! (Kurssiin liittyvää siis...)

Mitä tarkoittaa todennäköisyysvirta? Luennoissa on tarkasteltu todennäköisyystiheyttä $\rho(x)=|\psi(x)|^2$. Saadaksesi hyvän mielikuvan todennäköisyysvirrasta, ajattele $\rho(x)$ vaikkapa veden massatiheydeksi. Tällöin todennäköisyysvirrasta tuleekin veden "massavirta", eli vektori, jonka suunta ilmoittaa virtauksen suunnan ja suuruus sen, kuinka paljon massaa menee pinta-alayksikön läpi aikayksikössä. Todennäköisyysvirta siis kuvailee todennäköisyyden liikettä eli hiukkasen liikettä jossain keskimääräisessä mielessä. Huomaa, että vesi voi virrata tasaisesti yhteen suuntaan vaikka sen tiheys olisi kaikkialla sama – tämä vastaa tasoaaltoa, jota vastaava tiheys on vakio ja todennäköisyysvirta on vakiovektori.

Postulaatti 3: Observaabelia vastaavan operaattorin $\hat{A}$ ja todellisen mittauksen suhde? Esimerkki? Tähän tulee lisäselvyyttä kurssilla myöhemmin, kun korvaamme operaattorit $n \times n$-matriisella (yleensä $n$ on 2 tai 3).

Voisiko SY:n merkintöjä selventää: $i\hbar\frac{\partial}{\partial t}\psi(t,x)=\hat{H}\psi(t,x)$? Mikä on SY:n merkitys? SY:lle voi erottaa ainakin nämä merkitykset: se on hyvin yhteensopiva Hilbert-avaruuden rakenteen kanssa (se on lineaarinen ja voidaan lausua kätevästi operaattoreiden ja tilojen avulla), se johtaa todennäköisyyden säilymiseen, ja se johtaa klassisen mekaniikan liikeyhtälöihin. SY:ä käsitellään koko kurssin ajan, joten sen merkitys selvenee kurssin mittaan. SY kuvailee kvanttimekaanisen systeemin aikakehitystä, joten se sikäli vastaa Newtonin toista lakia.

Laskuharjoitus 2

Integroinnista

Ilmeiesesti osittaisintegrointia monessa ulottuvuudessa ei ole harrastettu aiemmilla kursseilla riittävästi. Sillä on kuitenkin kvanttimekaniikassa (ja kyllä muuallakin fysiikassa ja matematiikassa) käyttöä, joten esitän sen lyhyesti. Olkoon $V\subset\R^n$ jokin riittävän siisti joukko (rajoitettu $C^1$-alue) sekä $f$ ja $g$ jatkuvasti differentioituvia funktioita $V\to\C$. Tällöin pätee $$\int_V f \vec{\nabla}g d^nx = \int_{\partial V}fg\vec{n}d^{n-1}S-\int_V g \vec{\nabla}f d^nx,$$ missä $\partial V$ on joukon $V$ reuna ja $\vec{n}$ on yksikkövektori, joka osoittaa joukosta $V$ ulos. Esimerkiksi tapauksessa $n=3$ ja $V=B(0,r)$ (origokeskinen $r$-säteinen pallo) oikean puolen ensimmäinen integraali suoritetaan pallon pinnan yli (pinta-alaelementti on $d^2S=r^2d\Omega=r^2 d\phi d\cos(\theta)$) ja yksikkövektorimme pisteessä $\vec{x}\in\partial V$ on $\vec{n}(\vec{x})=\vec{x}/r$. Oikean puolen ensimmäinen integraali lasketaan siis aina pykälää alemmassa ulottuvuudessa. Kun $n=1$, tämä "0-ulotteinen integraali" on vain tuttu päätearvoerotus: tilanteessa $V=(a,b)\subset\R$ siis $$\int_a^b f g' dx = f(b)g(b)-f(a)g(a)-\int_a^b g f' dx.$$

Yllä annettu osittaisintegrointiyhtälö on vektorimuotoinen. Voimme tehdä niin, että tutkimme siitä vain $i$:nnettä komponenttia ja käytämme $f$:n paikalla funktiota $f_i=\partial h/\partial x_i$ (missä $h$ on jokin funktio). Kun summataan näin saadut $n$ yhtälöä, saadaan $$\int_V \vec{\nabla}h\cdot\vec{\nabla}g d^nx = \int_{\partial V}g\vec{\nabla}h\cdot\vec{n}d^{n-1}S-\int_V g \nabla^2 h d^nx,$$ jota olisi voinut käyttää tämän viikon demotehtävissä.

Osittaisintegrointi yhdessä ulottuvuudessa seuraa tulon derivointisäännöstä ja analyysin peruslauseesta. Samoin useammassa ulottuvuudessa. Analyysin peruslause vain on nyt muotoa $$\int_V \vec{\nabla}F(\vec{x}) d^nx = \int_{\partial V}F(\vec{x})\vec{n}d^{n-1}S.$$ Kun tähän sijoitetaan $F=fg$ ja huomataan $\vec{\nabla}(fg)=f\vec{\nabla}g+g\vec{\nabla}f$, saadaan edellä esitetty tulos.

Onko väliä, onko differentiaalinen alkio $dx$ integraalin alussa vai lopussa? Onko $\int d^3xf(x)=\iiint f(x)dxdxdx$? Fysikot kirjoittavat "differentiaalinsa" monesti heti integroimismerkin perään, mutta sen sijainnilla ei ole mitään väliä. Merkintä $d^nx$ tarkoittaa integrointia $n$-ulotteisen muuttujan $x$ yli. Siispä $d^3x=dx_1dx_2dx_3=dV$. Eri integraaleissa kannattaa pitää eri integrointimuuttujaa samoin kuin eri summissa eri summausindeksiä.

Kolmiulotteisen systeemin voi kuulemma yksinkertaistuksen vuoksi korvata yksiulotteisella. Miten niin asia ei muutu tässä mihinkään? Muutos on vain siinä, millaisen joukon yli integroidaan. Kyse on siis aaltofunktioiden $\psi:\R^3\to\C$ korvaamisesta hieman helpommin käsiteltävällä aaltofunktiolla $\psi:\R\to\C$. Matemaattisempi reunahuomautus: Yksiulotteisten aaltofunktioiden avaruus muistuttaa Hilbertin avaruutta $L^2(\R,\C)$. Funktioavaruus $L^2(\R^3,\C)$ on (tietääkseni; korjatkaa jos olen väärässä) edellisen avaruuden tensorikuutio ($L^2(\R^3,\C) \approx L^2(\R,\C) \otimes L^2(\R,\C) \otimes L^2(\R,\C)$), ja näin myös sillä on numeroituva Hilbert-kanta. Siispä nämä avaruudet ovat isomorfiset eli käytännössä samat, joten ulottuvuuden muuttaminen ei muuta funktioavaruuden rakennetta lainkaan! Näin siis ajatellaan myös aaltofunktioavaruutemme $\H$ kanssa, vaikkemme sitä täysin tarkasti osaakaan määritellä.

Miten määritellään integraali jostain vektorista $\int d^3x\vec{x}\rho(\vec{x})$? Komponenteittain. Vektorin $\vec{a}=\int d^3x\vec{x}\rho(\vec{x})$ komponentit ovat $a_i=\int d^3x x_i\rho(\vec{x})$. (Integraalin voi myös suoraan määritellä vektoriarvoisena, mutta tällä tavoin päästäisiin samaan tulokseen. Tarkempia tietoja voi katsoa Wikipediasta.)

Operaattorit ja odotusarvot

Yleinen huomautus: Kun puhutaan ominaisfunktioista, on aina valittu jokin operaattori (yleensä $\hat{H}$) ja tarkoitetaan juuri sen ominaisfunktioita. Yhden operaattorin ominaisfunktiot eivät yleensä ole toisen operaattorin ominaisfunktioita; vastaavasti eri matriiseilla on yleensä eri ominaisvektorit.

Toinen huomautus: Hajonta $\Delta A$ on positiivinen reaaliluku, joka ilmaisee, kuinka laajalle alueelle observaabelin $A$ mittastulokset asettuvat. Se ei siis ole vektori, vaikka $A$ olisikin.

Mitä tarkoittaa $\vec{x}$, jos kerran voidaan ottaa $\vec{x}^2$? Vektorin neliö on sen itseiarvon neliö. Siispä $\vec{x}^2=\sum_i x_i^2$. Operaattorille $\hat{\vec{x}}$ (vektori, eli yhteensä kolme operaattoria) on siis $\hat{\vec{x}}^2=\sum_i \hat{x}_i^2$ (yksi operaattori). Operaattorin $\hat{x}_i^2$ tulkinta seuraa suoraan $\hat{x}_i$:n määritelmästä: $\hat{x}_i^2\psi(\vec{x})=x_i^2\psi(\vec{x})$.

Kuinka paljon kvanttimekaniikassa on "standardeja" operaattoreita kuten liikemääräoperaattori $-i\hbar\nabla_x$? Monia klassisen mekaniikan keskeisiä suureita vastaa kvanttimekaniikassa operaattori. Tavallisia vastaan tulevia operaattoreita ovat mm. paikka, liikemäärä, energia, pyörimismäärä, spin, sähkövaraus, muut Standardimallin varaukset, helisiteetti, kiraliteetti ja pariteetti. Kaikkia näitä ei tutkita tällä kurssilla, vaan tarkempi tutkiminen jää kursseille kvanttimekaniikka 2, hiukkasfysiikka ja kvanttikenttäteoria.

Mikä fysikaalinen tulkinta on odotusarvoilla $\vev{\hat{\vec{x}}}$ ja $\vev{\hat{\vec{x}}^2}$? Kun mitataan observaabelia $A$ useita kertoja, mittausten keskiarvoksi tulee ennen pitkää $\vev{A}$.

Mikä on odotusarvon ja todennäköisimmän arvon ero? Piirrä itsellesi todennäköisyystiheysfunktio $\rho(x)=Nx^2e^{-ax^2}$ (harmonisen värähtelijän toinen viritystila näyttää suunnilleen tältä). Odotusarvo on edellisessä kohdassa todetun mukaan monien mittausten keskiarvo, ja tässä tilanteessa se on nolla. Sen sijaan aivan nollan lähelle ei osu juuri yhtään datapistettä, vaan nollan molemmin puolin löytyy yhtä suuri tihentymä. Todennäköisin paikan arvo on siis se kohta, jossa todennäköisyystiheys on suurimmillaan; tässä tilanteessa niitä kohtia on kaksi, nollan molemmin puolin symmetrisesti.

Miksi liikemääräoperaattoriksi on määritelty $-i\hbar\nabla_x$? On osoittautunut, että näin määritelty operaattori todella vastaa klassista liikemäärää. Harjoitustehtävä 2.3 osoittaa tämä järkevyyden hyvin.

Hermiittiselle $\hat{A}=\hat{A}^\dagger$ pätee $\braket{\hat{A}\psi}{\phi}=\braket{\psi}{\hat{A}\phi}$. Päteekö antihermiittiselle $\hat{B}=-\hat{B}^\dagger$ pätee $\braket{\hat{B}\psi}{\phi}=-\braket{\psi}{\hat{B}\phi}$ (esim. $\hat{B}=\nabla$)? Kyllä. Tämän toteaminen on lyhyt, suora lasku.

Tehtävässä 3 tarvittiin operaattorin $\hat{x}$ riippumattomuutta ajasta. Esimerkki fysikaalisesta tilanteesta, jossa on aikariippuva operaattori? Hyvin tavallinen esimerkki on ajasta riippuva potentiaali $V(x,t)$, jonka aiheuttaa vaikkapa muuttuva sähkökenttä, jossa tutkittava elektroni liikkuu.

Luvussa 4.1.1 määritelty pariteettioperaattori saa aikaan heijastuksen $\vec{x}\to-\vec{x}$. Voidaanko tuo heijastus ajatella esim. 3-ulotteisessa tapauksessa $3\times 3$-matriisina? Pariteettioperaattori muuttaa funktion toiseksi funktioksi ja tutkimamme funktiavaruus $\H$ on ääretönulotteinen, joten pariteettioperaattoria vastaava matriisi $\infty\times\infty$-matriisi. Ole kuitenkin tarkkana sen kanssa, mitä tällä tarkoitetaan! Voimmehan määritellä $3\times 3$-matriisin $M=-I$, missä $I$ on yksikkömatriisi, jolloin $\vec{x}\to M\vec{x}$ on koordinaatin heijastus. Tämä $3\times 3$-matriisi vaihtaa siis koordinaatteja toisikseen, mutta ei aaltofunktioita toisikseen. Minkä hyvänsä $3\times 3$-matriisin $M$ avulla voidaan määritellä pariteettia muistuttava operaattori $\hat{P}_M$, joka toimii näin: $\hat{P}_M\psi(\vec{x})=\psi(M\vec{x})$. Kaikkia funktioavaruuden operaattoreita ei kuitenkaan voida rakentaa $3\times 3$-matriisien avulla tähän tapaan. Esimerkiksi derivaatalle moinen ei onnistu.

Jos halutaan mitata observaabelia $A$, vaaditaanko aaltofunktion olevan tietynlainen, nimittäin operaattorin $\hat{A}$ ominaisfunktio? Vaikka $\psi$:t ovat ominaisfunktioita, ovatko ne myös Hilbertin avaruuden alkioita ja/eli sen kantavektoreita? Oli aaltofunktio mikä tahansa, observaabelia voi aina mitata. Erityisen kiinnostavia tämän mittauksen kannalta ovat kyseistä observaabelia vastaavan operaattorin ominaisfunktiot; aaltofunktion ei tarvitse olla mikään niistä, mutta se voidaan esittää superpositiona (lineaarikombinaationa) niistä. Hermiittisen operaattorin ominaisfunktiot muodostavat kannan (kunhan funktiota ja sen monikertoja ei lasketa erikseen), mutta mikä tahansa funktiojoukko ei ole kanta. Tilanne on sama kuin $\R^3$:ssa: vektorit $(1,0,0)$, $(1,1,0)$ ja $(0,1,0)$ eivät muodosta kantaa, vaikka ovatkin kolme avaruuden $\R^3$ alkiota.

Onko pariteettioperaattori vain tapa testata funktion symmetriaa? Kyllä.

Sivulla 12 sanotaan: milloin saadaan yksi tulos $a_k$ 100 % varmuudella? Kun tilaa kuvaa jokin observaabelin $A$ ominaisfunktio $\psi_n(x)$. Onko siis täysin varmaa vain, että saadaan jokin mittaustulos eikä itse tuloksesta voida arvioida todennäköisyyttä? Tarkastellaan observaabelia $A$ ja sitä vastaavaa operaattoria $\hat{A}$. Jos $\hat{A}$:n ominaisfunktiot ovat $\psi_n(x)$ ominaisarvoilla $a_n$, voidaan mittauksessa saada tulokseksi mikä tahansa $a_n$. Eri tulosten $a_n$ todennäköisyyden tiedetään kuitenkin täsmälleen: Todennäköisyys mitata tulos $a_n$ on $|c_n|^2$, kun tutkittavaa hiukkasta kuvaa aaltofunktio $\psi(x)=\sum_n c_n\psi_n(x)$. Huomaa, että tässä summaesityksessä kertoimet $c_n$ ovat yksikäsitteiset, kunhan tiedetään aaltofunktio $\psi$!

Aaltofunktiot ja niiden ratkaiseminen

Ilmeisesti hiukkasen paikka ei ole kvantittunut, koska sillä ei ole diskreettejä ominaisarvoja. Tarkoittaako tämä sitä, että $x$:llä on ylinumeroituva määrä ominaisarvoja ja -funktioita? Entä $x$:n mittaus; eikö aaltofunktio romahda mihinkään erityiseen $x$:n ominaistilaan paitsi siihen, missä paikassa hiukkanen sattuu olemaan? Tämä on hieman hankala kysymys, sillä sen tutkiminen osoittaa, että teoriamme rakoilee hieman – matemaattisen rakenteensa osalta siis. Kaikkia hankaluuksia en käy tässä läpi, vaan yritän selvittää oleellisimpia asioita yhdessä ulottuvuudessa. Operaattorilla $\hat{x}$ ei ole ominaisfunktioita kurssilla määritellyssä funktioavaruudessa $\H$: Jos nimittäin olisi ominaisarvo $a\in\R$ ja ominaisfunktio $\psi(x)$, niin olisi $a\psi(x)=\hat{x}\psi(x)=x\psi(x)$. Tämä voi päteä vain jos $\psi(x)=0$ tai $x=a$, joten $\psi(x)=0$ kaikilla $x\in\R\setminus\{a\}$. Jos $\psi$ on jatkuva (kuten olemme olettaneet), on siis myös $\psi(a)=0$. Tällöin $\psi(x)=0$ kaikilla $x$, eikä $\psi$ voikaan olla minkään operaattorin ominaisfunktio! Voimme "korjata" tämän tilanteen huomaamalla, että operaattorilla $\hat{x}$ on kuitenkin "melkein ominaisfunktio" $\psi_\lambda$ vastaten ominaisarvoa $\lambda$; tällainen löytyy kaikilla $\lambda\in\R$. Valitkaamme $\psi_\lambda(x)=\eps^{-1/2}\pi^{-1/4}e^{-((x-\lambda)/\eps)^2/2}$, missä $\eps>0$ on jokin pieni vakio. "Ominaisarvoyhtälö" $x\psi_\lambda(x)\approx\lambda\psi_\lambda(x)$ on sikäli järkevä, että funktioiden $x\psi_\lambda(x)$ ja $\lambda\psi_\lambda(x)$ etäisyden neliö on $\int_{-\infty}^{\infty}|x\psi_\lambda(x)-\lambda\psi_\lambda(x)|^2dx=\eps^2/2$ (näinhän olemme määritelleet funktioiden etäisyyden). Jos siis $\eps$ on pieni, on tämä virhe pieni. Siis vastauksena: $x$:llä on ylinumeroituva määrä ominaisarvoja ja -funktioita. Kun paikka mitataan, aaltofunktio romahtaa johonkin edellä kuvatun kaltaiseen "lähes ominaistilaan". Tällaista funktiota $\psi_\lambda$ vastaava todennäköisyystiheys sisältää hyvin korkean piikin kohdassa $x=\lambda$ (ja siitä noin etäisyydelle $\eps$ asti) ja on muualla käytännössä nolla.

Jatkoa edelliseen: Jos $\hat{\vec{x}}\psi(\vec{x})=\vec{x}\psi(\vec{x})$ mielivaltaiselle $\psi$, eikö mielivaltainen tila ole $x$:n ominaistila (samoin $p$:n)? Huomaa, että ominaisarvon $a$ (tai millä sitä sitten ikinä merkitäänkään), täytyy olla vakio. Ominaisarvoksi emme kelpuuta funktiota. (Jos on $\hat{A}f(x)=g(x)f(x)$, emme sano, että $f$ on $\hat{A}$:n ominaisfunktio ja $g$ sitä vastaava ominaisarvo, sillä $g$ ei ole vakio eli "vain luku".) Tässä tilanteessa siis olisimme ottamassa ominaisarvoksi funktiota $g(x)=x$, mutta se ei siis käy. Edellisen vastauksen tarkastelu osoittaa, ettei ainakaan mikä tahansa funktio kelpaa $x$:n ominaisfunktioksi; mikään jatkuva funktio ei kelpaa, mutta jotain vähän eksoottisempaa voitaisiin ehkä kuitenkin kelpuuttaa. (Tarkoitan delta-funktiota, joka ei tosin ole neliöintegroituva. Kaikista ongelmista ei pääse eroon...) Täsmälleen sama päättely koskee liikemäärää. Se, että liikemäärää ja paikkaa voidaan tarkastella täysin samoin välinein, selviää kurssilla pian.

Voidaanko matemaattisesti perustella miksi aaltofunktio ja sen derivaatat menevät $\pm\infty$:ssä nollaan nopeammin kuin mikään polynomi? Ei. Meidän täytyy aaltomekaniikkaa muotoillessamme vaatia, että aaltofunktiot ovat riittävän siistejä. (Emme tosin osaa asettaa tätä vaatimusta tarkasti.) Tämä takaa sen, että voimme turvallisesti laskea tarvittavat laskut. Matemaattista perustetta näille vaateille ei ole sen enempää kuin Newtonin laielle: kun ne otetaan lähtökohdaksi, teoria näyttää olevan sopusoinnussa luonnon kanssa.

Lyhyt kertaus Hermiten polynomeista? Hermiten polynomit ovat polynomeja, joilla on hyödyllisiä ominaisuuksia. Ne tupsahtavat aina välillä ylättäen esiin, kuten harmonisen värähtelijän kohdalla huomasimme. Tarkemmin niistä kertoo Wikipedia.

Miten siitä, että potentiaalifunktio on symmetrinen, välttämättä seuraa, että ominaisfunktiot ovat parillisten ja parittomien funktioiden lineaarikombinaatioita? Jokainen funktio $f:\R\to\C$ on lineaarikombinaatio parittomasta ja parillisesta funktiosta. Jos määritellään $f_\pm(x)=\frac{1}{2}(f(x) \pm f(-x))$, niin $f_+$ on parillinen, $f_-$ pariton ja $f=f_++f_-$. Jos potentiaalifunktio on symmetrinen ja $\psi$ toteuttaa stationäärisen SY:n, niin tällöin myös $\psi_+$ ja $\psi_-$ toteuttavat sen. Täten ominaistiloiksi voidaan valita parillisia ja parittomia funktioita. (Yleensä funktio ei ole parillinen eikä pariton.)

Harmonisen värähtelijän yhtälöissä esiintyvä $M$ siis ei saa mennä äärettömyyksiin, koska silloin ei saataisi normittuvia ratkaisuja. Onko ominaisfunktioita ja -energioita siis vain äärellinen määrä? Luentomonisteessa esitetyssä tarkastelussa vaaditaan, että $M$ on luonnollinen luku. Muutoin aaltofunktio ei normitu. Jokainen luonnollinen luku on toki äärellinen, mutta niitä on kuitenkin äärettömän monta. Siispä ominaisenergioita ja -funktioita on ääretön määrä.

Miten Frobenius-menetelmä toimii? Siinä yritetään ratkaista differnetiaaliyhtälö kirjoittamalla ratkaisu Taylorin polynomina ja etsimällä tapa päätellä polynomin kertoimia toisistaan.

Kuinka vahvasti aaltofunktion voi olettaa katoavan äärettömyydessä? Niin vahvasti kuin laskujen kannalta on tarpeen. Emme voi ikävä kyllä paneutua yksityiskohtiin tällä kurssilla.

Mitä tarkoitetaan vaihtetekijällä ja onko $e^{i\alpha}$ ainoa mahdollinen vaihetekijä? Mikä on suhteellinen vaihe? Kun aaltofunktio on yksi luku (kuten tähän mennessä kurssilla on), on ainoa mahdollinen vaihetekijä $e^{i\alpha}$. Suhteellinen vaihe on selitetty 1. viikon kohdalla.

Onko normitusvakiolla todella yksikkö? Todennäköisyydellä $|\psi|^2$ ei ole. Todennäköisyys, että hiukkanen löytyy joukosta $V\subset\R^3$ on $\int_V d^3x |\psi|^2$. Yhdessä ulottuvuudessa todennäköisyys löytää hiukkanen väliltä $[a,b]$ on $\int_a^b dx |\psi|^2$. Tämä todennäköisyys on yksikötön, mutta integraalissa esiintyvä differentiaalinen alkio on dimensiollinen: $d^3x$:n yksikkö on kuutiometri. Siksi normitusvakio $n$-ulotteisessa tilanteessa on tavallisesti yksikössä m$^{-n/2}$.

Kuinka on mahdollista, että $\psi$ muuttuu, mutta tila pysyy samana (luentopruju s. 35)? Kysymys koskee tilannetta, jossa systeemin energia on mitattu ja saatu tulos $E_k$ jollain $k$. Tällöin aaltofunktio on $\psi(x,t)=c_ke^{-iE_k(t-t_0)/\hbar}\psi_k(x)$, missä on oltava $|c_k|^2=1$ (sillä muut $c_n$:t ovat nollia). Siispä on $\psi(x,t)=e^{i\alpha(t)}\psi_k(x)$, missä $\alpha(t)$ on jokin ajasta riippuva vaihe. Fysikaalisia suureita laskettaessa vaihetekijät kumoutuvat (eikä $\alpha$ tule vaihetekijästä alas, kunhan tutkittavat operaattorit eivät sisällä aikaderivaattaa), joten mikään fysikaalinen suure ei riipu ajasta. (Jos operaattorissa näyttäisi olevan aikaderivaatta $\partial/\partial t$, sen voi aina korvata SY:n perusteella $-\frac{i}{\hbar}\hat{H}$:lla – näin aikaderivaatta voidaan aina poistaa.)

Jos $H_n$ on Hermiten polynomi ja $\psi=H_n\phi\in\H$, voidaanko tästä päätellä $H_n\in\H$ tai onko se muuten voimassa? Ei. Polynomit eivät ole neliöintegroituvia (paitsi nollapolynomi, joka ei ole kovin kiinnostava), joten ne eivät ole Hilbertin avaruudessamme.

Muuta

Mitä tarkoittavat deterministinen ja ei-deterministinen aikakehitys? Deterministisyys tarkoittaa sitä, että jos järjestelmän alkutila tunnetaan, tiedetään täsmälleen millainen sen tila on myöhempinä aikoina. Aaltofunktio (ilman mittausta) kehittyy deterministisesti, eli tiedämme täsmälleen, mitä eri mittauksia koskevat todennäköisyysjakaumat ovat eri ajanhetkinä. Ei-deterministisessä aikakehityksessä taas emme voikaan päätellä tulevaisuutta $ndash; edes täydellisistä alkutiedoista. Tiedämme siis tarkasti todennäköisyysjakauman (vaikkapa liikemäärän) mittaustuloksille, muttemme mitenkään (edes periaatteessa) voi ennalta tietää, mikä liikemääräksi seuraavassa mittauksessa tulee.

Mitä mittaaminen tai mittaus tarkalleen ottaen tarkoittaa? Todellisen mittaustapahtuman ja kvanttimekaniikan mittauskäsitteen yhteys ei tietääkseni ole vielä täysin selvä asia. Mittaukseksi voisi käsittää sen, että tutkittavaa hiukkasta pommitetaan vaikkapa fotonilla ja päätellään ulos tulevan fotonin ominaisuuksista haluttu suure. Monisanaisemmin asiaa pohtii mm. Wikipedia.

Ovatko stationäärinen ja ajasta riippumaton synonyymejä? Kyllä.

CERN:n tutkimusryhmä väittää havainneensa valoa nopeampia neutriinoja. Voidaanko luennolla kertoa pintapuolisesti onko tällä löydöllä (mikäli ei paljastu mittausvirheeksi) merkittävää vaikutusta epärelativistiseen kvanttimekaniikkaan? Löydöllä (jos se tosiaankin osoittautuu oikeaksi) ei pitäisi olla merkittäviä seurauksia epärelativistiseen kvanttimekaniikkaan. Kvanttimekaniikka on moneen kertaan testattu ja hyväksi todettu teoria. Vaikka löytö vahvistuisikin, ei se tee nykyään toimivasta kvanttifysiikasta turhaa. Tiedämme joka tapauksessa, että Standardimalli (luontoa erinomaisesti kuvaava nykyinen kvanttiteoria) on vain likimääräinen teoria – siitä huolimatta se on (paikoin) hämmästyttävän tarkka. Alkuperäinen julkaisu liian nopeista neutriinoista löytyy täältä. Huomautan lopuksi, että valonnopeus tarkoittaa fysiikassa oikeastaan kahda eri asiaa: toisaalta suhteellisuusteorian (sekä suppean että yleisen) ennustamaa rajanopeutta, jota ei voi ylittää, ja toisaalta fotonin nopeutta. Nämä ovat eri asiat, vaikka aiempien mittaustulosten valossa ollaan sitä mieltä, ne ovat yhtä suuret. Tämä johtuu fotonin massattomuudesta. Jos fotonilla onkin massa, voi neutriino hyvinkin kulkea fotonia nopeammin (vaikka fotonin massa olisi pienempikin, kunhan hiukkasten energiat ovat sopivat). Lisäksi massiivinen fotoni aiheuttaisi QED:ssä joitain huolia, joihin tutustumiseen tulee eväitä hiukkasfysiikan kurssilla. (Kiinnostuneille: Fotonin massatermi Lagrangen tiheydessä rikkoo QED:n mittasymmetriaa.) Jos taas neutriino ylittääkin suhteellisuusteorian rajanopeuden, seuraukset järkyttävät hiukkasfysiikkaa enemmän.

Laskuharjoitus 3

Todennäköisyyslaskenta

Todennäköisyyslaskenta on jäänyt vähän epäselväksi tilanteessa, jossa nopanheiton sijaan tutkitaan todennäköisyystiheyksiä ja -virtoja. Tämä on liian laaja asia tässä käsiteltäväksi. Kannattaa etsiä käsiinsä jostain todennäköisyyslaskentaan liittyvää materiaalia. Todennäköisyyslaskennassa emme tee kvanttimekaniikassa mitään outoa. Sen sijaan se, että annamme kvanttimekaanisille olioille (usein niiden normien neliöille) todennäköisyystulkinnan, on alkuun yllättävää eikä liity varsinaisesti itse todennäköisyyslaskentaan.

Systeemin energian todennäköisyyksien laskeminen kaipaa selvennystä. Jos harmoninen värähtelijä on perustilassa, tila on stationäärinen ja sitä vastaa yksi mahdollinen energia. Miten tehtävän 4 tilanteessa tilaa kuvaava aaltofunktio ei muutu, mutta taajuus ja energia ilmeisesti muuttuvat silti? Tehtävässä nimenomaisesti oletetaan, että aaltofunktio pysyy samana. Aaltofunktio kuvaa hiukkasen sijainnin ja liikemäärän jaukaumaa, mutta hiukkasen energia riippuu niiden lisäksi myös potentiaalista. Oleellista ei ole se, että aaltofunktio on vanhaa potentiaalia vastaava perustila; oli se mikä aaltofunktio tahansa, tehtävä on järkevä. Laskut ovat inhimillsempiä annetulla funktiolla kuin monilla muilla. Potentiaalin muuttaminen vastaa (karkeasti – älä ota tätä liian vakavasti) työn tekemistä systeemiin: hiukkasen energia muuttuu (suuntaan tai toiseen joillain todennäköisyyksillä) kun potentiaalia muutetaan.

Miten pääsen kiinni systeemin energian todennäköisyyksiin? Tutkitaan tilannetta, jossa hiukkasta kuvaa aaltofunktio $\psi(x)$ ja halutaan mitata observaabelia $A$, jota vastaavan operaattorin $\hat{A}$ ortonormitetut ominaisfunktiot ovat $\psi^A_k(x)$ (diskreeteillä) ominaisarvoilla $a^A_k$ (näin käy esimerkiksi kun $A$ on energia). Tällöin aaltofunktio voidaan kirjoittaa muodossa $\psi(x)=\sum_k c_k\psi^A_k(x)$ joillakin (yksikäsitteisillä) kertoimilla $c_k$. Kerroin $c_k$ voidaan ratkaista kuten euklidisessa vektoriavaruudessa ratkaistaan vektorin koordinaatteja: sisätulon avulla. Siis $c_k=\braket{\psi^A_k}{\psi}=\int_{-\infty}^\infty (\psi^A_k(x))^*\psi(x)dx$. Todennäköisyys saada juuri arvo $a^A_k$ on $|c_k|^2$. Yleensä yläindeksiä $A$ ei pidetä mukana, mutta haluan tässä korostaa, että täytyy käyttää juuri oikean operaattorin ominaisfunktioita ja -arvoja.

Miten on mahdollista, että todennäköisyyksien summa tehtävässä 4 on yli yksi? Tämä on mahdotonta myös kvanttimekaniikassa. Todennäköisyyden käsitteessä ei ole erityistä mystiikkaa kvanttimekaniikan yhteydessä; samat perusajatukset toimivat yhä. Todennäköisyydet ovar reaalilukuja väliltä $[0,1]$ ja kaikkien (toisensa poissulkevien tapahtumien) todennäköisyyksien summa on 1. Jos todennäköisyys on $i$ tai $\pi$ tai jotain muuta outoa, on kyseessä laskuvirhe.

Epämääräisyysperiaate

Luennoilla johdettiin epämääräisyysperiaate $\Delta A \Delta B \geq \frac{1}{2}|\vev{C}|$ lähtien tiedosta $[\hat{A},\hat{B}]=i\hat{C}\neq 0$. Mistä kyseinen kommutaatiosääntö on peräisin? Tämä on oletus. Jos määrittelemme operaattorin $\hat{C}$ tuon kaavan mukaan, siitä tulee hermiittinen jos $\hat{A}$ ja $\hat{B}$ ovat hermiittisiä. Jos $\hat{C}$ on nollaoperaattori ($\hat{A}$ ja $\hat{B}$ kommutoivat), ei $\hat{A}$:n ja $\hat{B}$:n epätarkkuuksilla ole mitään rajoitetta.

Kuvaako Heisenbergin epätarkkuusperiaate enemmän hiukkasen vai mittauksen luonnetta? Periaate sanoo, että paikkaa ja liikemäärää ei voida samanaikaisesti mitata tarkasti, mutta se ei tarkoita, etteikö hiukkasella olisi olemassa "hyvin määritellyt" paikka ja liikemäärä; niitä ei voi vain tietää. Vai eikö hitu itsekään oikein tiedä missä on tai minne menossa? Se kuvaa itse hiukkasen luonnetta. Hiukkasella siis ei ole sellaisia ominaisuuksia kuin paikka tai liikemäärä. Perustavanlaatuisin ominaisuus on aaltofunktio, josta fysikaalisten suureiden havaintoarvoja voidaan laskea. Aaltofunktio ei tyypillisesti vastaa mitään tiettyä paikkaa, liikemäärää, energiaa tai muutakaan observaabelia, vaan on jollain tavalla sekoitus eri suureiden eri arvoja. Koska epätarkkuusperiaate kuvaa itse hiukkasen luonnetta, kuvaa se välillisesti myös mittausta; paikkaa ja liikemäärää ei voi myöskään mitata yhtä aikaa tarkasti.

Matemaattisia huolia

Miten SY ratkaistaan mekaanisesti? Tähän ei ole mitään reseptiä; tämän kaltainen yhtälö on yksinkertaisesti vaikea ratkaistava. Joissain erikoistapauksissa ratkaisu löytyy suljetussa muodossa ja ehkä jopa helposti, mutta yleistä ratkaisumetodia ei voi antaa. Jopa se tilanne, että tutkitaan ääretöntä potentiaalikuoppaa, jonka muoto $\R^3$:ssa on annettu, on yleisen ratkaisun ulottumattomissa.

Frobeniuksen sarjayritteessä oli luentoprujussa $r$. Ilmeisesti ratkaisu onnistuu ilmankin, mutta jossain vaiheessa pitää tehdä mystisiä juttuja. Lähinnä se, että milloin $a_0=0$ tai $a_0 \neq 0$, ihmetyttää. Katso seuraava kysymys.

Miksi luennolla johdettaessa rekursiokaavaa (pruju s. 51) ei tarvitse (ei tutkita) myös tapausta $r=1$? Tapaus $r=0$ tarkoittaa, että $F(y)=a_0+a_1y+a_2^2+\dots$, ja tapaus $r=1$ puolestaan $F(y)=a_0y+a_1y^2+a_2y^3+\dots$. Näistä sarjoista jälkimmäinen on hieman ikävästi indeksoitu, joten kirjoitamme sen mieluummin muotoon $F(y)=0+a_1y+a_2y^2+a_3y^3+\dots$, eli siirrämme indeksointia ja sanomme $a_0=0$. Nyt, jos sallitaan $a_0=0$, saadaan samalla sarjayritteellä $F(y)=a_0+a_1y+a_2^2+\dots$ molemmat tapaukset.

Ratkaisujen normittuvuudesta lisähuomautus: Huomasimme (luentomonisteessa ainakin) että normittuva ratkaisu edellyttää, että on jokin $M\in\N$ siten, että $a_M$ on viimeinen nollasta eroava kerroin, eli $F(y)=a_0+a_1y+\dots+a_My^M$ on polynomi. Ehdoista $a_M\neq 0$ ja $a_{M+2}=0$ pääteltiin $\eps=2M+1$. Lisäksi täytyy toki olla $a_{M+1}=0$, ja rekursiokaavastamme voimme päätellä, että tällöin on oltava $a_{M-1}=0$, ja siksi $a_{M-3}=0$ ja niin edelleen. Jos siis $M$ on parillinen, päättyy tämä päättelyketju siihen, että $a_1=0$. Jos se on pariton, on $a_0=0$. (Huomaa, että rekursiokaavan perusteella sekä $a_0$ että $a_1$ ovat vapaita, ja muut kertoimet määräytyvät niistä.) Siispä $F(y)$ on joko parillinen tai pariton polynomi (joko $F(-y)=F(y)$ tai $F(-y)=-F(y)$) – sekamuodot eivät kelpaa. Ja juuri tällaisiahan löytämämme Hermiten polynomit ovat. Hermiten polynomien differentiaaliyhtälö on toista kertalukua, joten sillä pitäisi olla kaksi lineaarisesti riippumatonta ratkaisua – näin onkin, mutta vain toinen niistä on polynomi ja johtaa normittuvaan aaltofunktioon.

Luennolla Schwarzin epäyhtälöä johdettaessa jäätiin mielestäni yhtälöön $\braket{\psi}{\phi} \neq 0$. Näinhän ei voi olla, vai onko tämä sittenkin vain merkintätavasta kiinni ja $\braket{\psi}{\phi}=\braket{\psi_n}{\psi_m}=\delta_{nm}$? En tiedä, miten tulos on luennolla todistettu, mutta se on perustulos, jonka todistus löytyy monestakin paikasta. Esitän sen myös tässä lyhyesti yksiulotteisessa tapauksessa: Olkoot $\psi$ ja $\phi$ normitettuja aaltofunktioita. Epäyhtälöstä $(a-b)^2 \geq 0$ saadaan $ab \leq \frac{1}{2}a^2+\frac{1}{2}b^2$ kaikille reaaliluvuille $a$ ja $b$. Niinpä $$ |\braket{\psi}{\phi}| = \left|\int_{-\infty}^\infty \psi^*(x)\phi(x)dx\right| \leq \int_{-\infty}^\infty |\psi^*(x)\phi(x)|dx = \int_{-\infty}^\infty |\psi(x)|\cdot|\phi(x)|dx \leq \int_{-\infty}^\infty \left(\frac{1}{2}|\psi(x)|^2+\frac{1}{2}|\phi(x)|^2\right)dx = \frac{1}{2}\int_{-\infty}^\infty|\psi(x)|^2dx + \frac{1}{2}\int_{-\infty}^\infty|\phi(x)|^2dx = \frac{1}{2}+\frac{1}{2} = 1, $$ mikä on juuri Schwarzin epäyhtälö.

Jos meillä on vapaa hiukkanen eil potentiaali on vakio, Schrödingerin yhtälön toteuttavat ainoastaan sini- ja kosini-funktiot, mutta nämähän eivät normitu. Kuinka tämä tilanne ratkeaa? Voidaanko tällaisesta tilanteesta sanoa mitään fysikaalisesti? Jos hiukkanen on "liian vapaa", eivät kaikki Schrödingerin yhtälön ratkaisut normitu. Vakiopotentiaalissa ei normitu mikään ratkaisu, ja esimerkiksi äärellisessä potentiaalikuopassa on muutamia (äärellinen määrä) normittuvia ratkaisuja, mutta äärettömän monta normittumatonta ratkaisua. Jos aaltofunktio normittuu, keskittyy todennäköisyystiheys $\rho(x)=|\psi(x)|^2$ jollekin rajoitetulle alueelle, ja tällöin aaltofunktio kuvaa ns. sidottua tilaa (sidottu johonkin paikkaan). Normittumattomia ratkaisuja taas kutsutaan sirontatiloiksi; nämä eivät keskity mihinkään paikkaan, vaan kuvaavat laajalle levinnyttä (usein koko avaruuden täyttävää) aaltoa. Tällaisia tulee vastaan sirontateoriassa, jota tehdään tällä kurssilla jonkin verran ja enemmän myöhemmin. (Hiukkasfysiikan kokeet ovat usein sirontakokeita, joten sirontojen tutkiminen on hiukkasfysiikassa keskeistä.) Sirontatilat ovat fysikaalisia tiloja, jotka vastaavat pikemminkin stationääristä hiukkasvirtaa kuin yhtä yksittäistä hiukkasta. Olemme rakentaneet teoriamme tähän asti normittuville tiloille, mutta tasoaalto on kuitenkin fysikaalisesti mielekäs kuvaus (ja mittaustenkin kannalta hyvä approksimaatio) koko avaruuden täyttävälle hiukkasvirralle. Tarkastelun voi tehdä myös huolellisemmin käyttämällä tasoaallon sijaan aaltopaketteja; tällöin laskut muuttuvat hankalammiksi, mutta paremmin määritellyiksi. Tällaista on harrastettu mm. eräässä LuK-tutkielmassa.

Kvanttimekaniikan yleisrakenteesta

Milloin käytetään mitäkin $\psi$:tä? Luentomonisteesta löytyy vaikka millaisia "versioita". Merkinnöistä tulee helposti hieman sekavia, sillä kvanttimekaniikan yhtälöt näyttäisivät melkoisilta joulukuusilta, jos kaikki olisi merkitty huolellisesti paikalleen. Yleensä kuitenkin käy niin, että jos $\psi$:llä (tai muullakin aaltofunktiolla) on alaindeksi ($\psi_k$), se on jonkin operaattorin ominaistila. (Varmistu aina, että tiedät, minkä operaattorin ominaistilasta on kyse. Kysy jos asia ei ole selvä.) Ominaistilat ovat siis jonkinlaisia "ideaalitiloja", jotka vastaavat observaabelien mitattavia arvoja. Yleensä aaltofunktiot (ja tilat muutenkin) eivät ole näin ideaalisia, vaan ne ovat sekoitus ominaistiloja. Tällaisessa "rajoittamattomassa tapauksessa" merkitään aaltofunktiota yleensä ilman indeksejä: $\psi$. Vertailemalla aaltofunktiota ominaisfunktioihin saadaan selville todennäköisyyksiä: Todennäköisyys, että tilasta $\ket{\psi}$ mitataan tilaa $\ket{\psi_k}$ vastaava obsrvaabelin arvo, on $|\braket{\psi_k}{\psi}|$. Yksi lisäongelma on se, että joskus tutkimme ajasta riippuvaa, joskus ajasta riippumatonta aaltofunktiota. Tämän erottaa yleensä vain siitä, että toinen kirjoitetaan $\psi(t,x)$ ja toinen $\psi(x)$. Jos merkitään laiskasti vain $\psi$ tai epäilyttää ettei aikariippuvuus ole näkyvissä merkinnässä $\psi(x)$ vaikka pitäisi, kysy. Joskus (kuten luentomonisteessa) on tapana merkitä ajasta riippuvaa aaltofunktiota isolla psiillä ($\Psi$) ja ajasta riippumatonta pienellä ($\psi$), mutta niiden erottaminen voi olla turhan vaikeaa.

Mitä yleisessä sisätulossa $\braket{\psi}{\phi}$ "tehdään", kun sitä ei ole määritelty? Onko $\braket{\psi}{\phi}=\int_{\R^3}\psi^*(x)\phi(x)d^3x$ erikoistapaus? Sisätulon laskusääntöjä kuitenkin käytettiin. Kuten sisätulossa aina, sisätulo mittaa myös kvanttimekaniikassa sitä, kuinka samansuuntaisia kaksi tilaa (vektoria) ovat. (Sisätuloksi sanotaan vain sellaista otusta, joka toteuttaa sisätulon laskusäännöt.) Ajatellaan vaikkapa hiukkasta, joka on tilassa $\ket{\psi}$ ja mietitään, paljon se vastaa tilaa $\ket{\phi}$. Jos oletamme normituksen $\braket{\psi}{\psi}=\braket{\phi}{\phi}=1$, kuvaa tätä samansuuntaisuutta sisätulo $\braket{\phi}{\psi}$. Jos meitä kiinnostaa vaikkapa mitata energiaa ja laskea todennäköisyys, jolla tilassa $\ket{\psi}$ oleva hiukkasemme saa energian $E_k$ (joka vastaa jotain tilaa $\ket{\phi_k}$ siten että $\hat{H}\ket{\phi_k}=E_k\ket{\phi_k}$), laskemme, kuinka "samansuuntaisia" tilat $\ket{\psi}$ (kuvaa tutkittavaa hiukkasta) ja $\ket{\phi_k}$ (kuvaa energiaa, joka nyt kiinnostaa) ovat. Tämän samansuuntaisuuden antaa sisätulo $\braket{\phi_k}{\psi}$, ja sen itseiarvon neliö on haluttu mittaustodennäköisyys. Integraalin avulla määritelty sisätulo on siis vain erikoistapaus.

Voidaanko bra- ja ket-tiloja kertoa? Päteekö niille normaalit kertolaskusäännöt: $\ket{\psi}\ket{\phi}=\ket{\psi\phi}$ tai $\ket{\psi}\braket{\phi}{\psi'}\bra{\phi'}=\braket{\phi\phi'}{\psi\psi'}$? Tuleeko tällaisia edes vastaan? Kuten ensimmäisten demojen kohdalla on selostettu, kannattaa bra-vektoreita ajatella vaakavektoreina, ket-vektoreita pystyvektoreina ja tilojen tuloa matriisien tulona. Kahden pystyvektorin tuloa ei voi muodostaa, joten tulo $\ket{\psi}\ket{\phi}$ ei ole järkevä kapistus. (Siinä on tosin järkeä tensoritulona, mutta emme puutu nyt siihen.) Tulo $\ket{\psi}\braket{\phi}{\psi'}\bra{\phi'}$ sen sijaan voidaan muodostaa, muttei sieventää ehdotetulla tavalla; tämähän ei onnistu matriiseillakaan. Koska $\ket{\psi}\braket{\phi}{\psi'}\bra{\phi'}$ on operaattori (matriisi, jos ajatellaan yhä $\C^n$:n vektoreita) ja $\braket{\phi\phi'}{\psi\psi'}$ skalaari, joten ne eivät varmasti ole samat. Tulo $\ket{\psi}\braket{\phi}{\psi'}\bra{\phi'}$ voi hyvinkin tulla vastaan; kirjoitapa vaikka ykkösoperaattorit $x$:n ja $p$:n ominaiskannassa peräkkäin (tämä on tietysti edelleen ykkösoperaattori), niin näet tuollaisen tulon syntyvän.

Mitä kvanttimekaaniset liikevakiot käytännössä ovat ja voidaanko ne kaikki mitata samaan aikaan? Liikevakio on observaabeli, jonka mittaukseen liittyvä todennäköisyysjakauma ei riipu ajasta. Ajasta eksplisiittisesti riippumattoman operaattorin tilanteessa (kaikki operaattorit tähän asti ovat olleet sellaisia) tämä tarkoittaa sitä, että observaabelia vastaava operaattori kommutoi Hamiltonin operaattorin kanssa. Samaan aikaan mitattavia suureita vastaavien operaattoreiden täytyy kaikkien kommutoida keskenään; siispä kaikkia liikevakioita ei voida aina mitata yhtä aikaa. Tästä tulevat esimerkkinä myöhemmin spinin eri komponentit, jotka kommutoivat kaikki Hamiltonin operaattorin kanssa mutteivät keskenään. Ne ovat kaikki liikevakioita, mutta niistä vain yksi voidaan mitata yhtä aikaa (samalla voi kyllä mitata energian).

Luennoilla puhuttiin Heisenbergin epätarkkuusperiaatteesta, ja tätä kautta tuli löydettyä EPR-paradoksi. Mikä nyt sitten on tämän hetkinen tilanne tässä? Kvanttimekaniikan outouksia on yritetty poistaa käyttämällä ns. piilomuuttujia, jolloin teoriasta voidaan saada deterministinen (myös mittauksesta siis) olettamalla, että hiukkasilla on ominaisuuksia (piilomuuttujia), jotka voidaan havaita. Tällainen teoria kuitenkin rajoittaa mittauksissa havaittavaa korrelaatiota (Bellin epäyhtälöt kuvaavat tätä tarkemmin) eri tavoin kuin kvanttimekaniikka. On kuitenkin havaittu, että luonto rikkoo Bellin epäyhtälöitä, eli kvanttimekaniikka todella on niin outo kuin miltä se näyttää. Eräs kokeellinen tulos on esitetty tässä julkaisussa, johon ainakin yliopiston koneilta on lukuoikeus. (Viimeisen sivun kuva 4 tiivistää tuloksen.)

Mikä merkitys matriisin jäljellä on kvanttimekaniikassa? En osaa antaa sille erityistä merkitystä. Jälki on joskus kätevä työkalu lineaarialgebrassa, ja sellaisena se tulee vastaan kvanttimekaniikassakin.

Luennolla sanottiin, että kvanttimekaniikassa ei tunneta "voimaa" samoin klassisesti, vain potentiaaleja. Mitä muita klassisia käsitteitä tai suureita kvanttimekaniikka ei tunne? Liike-energia? Työ? Newtonin mekaniikka ja kvanttimekaniikka ovat käsitteistöltään melko erilaiset. Sen sijaan Hamiltonin ja myös Lagrangen mekaniikka (jotka ovat klassisen mekaniikan muotoiluja siinä kuin Newtoninkin), ovat käsitteistöltään lähempänä, ja ne tarjoavat paremman pohjan kvanttimekaniikalla ja myöhemmin myös kvanttikenttäteorialle. Esimerkiksi voima ja työ puuttuvat kvanttimekaniikasta samoin kuin vaikkapa Lagrangen mekaniikasta – sellaiset voi toki määritellä, mutta kovin käyttökelpoisia niistä tuskin tulee. Liike-energiaoperaattori meillä on jo ollutkin: $\hat{p}^2/2m$, joka on osa tavallista Hamiltonin operaattoria.

Muuta

Miksei tehtävän kolme todennäköisyys riipu hiukkasen massasta? Paras vastaus lienee, että näin vain sattuu käymään. Huomaa, että makroskooppinen kappale (vaikkapa punnus jousen päässä) ei ole perustilassaan (se on kvanttimekaniikan kannalta hyvin monimutkainen kappale, jota emme oiekin voi tällä kurssilla käsitellä), eikä siihen muutenkaan voi soveltaa kvanttimekaniikan ajattelua. Toisaalta vaikuttaa selvältä, että todennäköisyys voi riippua vain suureista $m$, $\omega$ ja $\hbar$. Pieni dimensioanalyysi osoittaa, että ainoa dimensioton yhdistelmä näitä ei voi sisältää näistä suureista yhtäkään.

Onko tehtävän 4 tilanne reaalimaailmassa mahdollinen? Tuntuu ainakin mielikuvitukselliselta. Jos vaikka tutkimme hiukkasta sähkökentässä, kuvailee potentiaali $V(x)$ sähkökenttää. Voi olla kiinnostavaa tutkia, miten hiukkanen käyttäytyy, jos sähkökenttää muutetaan. Tällöin muuttuu potentiaali, ja mitatut energian arvot muuttuvat. Yksinkertaisuuden vuoksi tehtävässä tutkimme äkillistä muutosta.

Miksi harmoninen värähtelijä kiinnostaa niin tavattomasti? Harmoninen värähtelijä on yksinkertainen malli, joka on kuitenkin fysikaalisesti mielekäs. Esimerkiksi statistisen fysiikan kurssilla tutkitaan värähtelyjä kiteessä, ja silloin voidaan ajatella, että jokainen kiteen atomi on kvanttimekaaninen harmoninen värähtelijä. Tämä ns. Einsteinin malli on käyttökelpoinen kuvaus kidevärähtelyistä. Monimutkaisempaakin potentiaalia voi monesti hyvin mallintaa miniminsä lähistöllä harmonisena, jolloin harmoninen värähtelijä voi antaa hyvänkin likiarvon tarkasteluun.

Tehtävien 2, 3 ja 4 aihealueessa on epäselvyyttä. Olisi hyvä, jos olisi esim. harjoitustehtävien tyylisiä esimerkkilaskuja, niin se selventäisi asioita selvästi. Sellaisia kannattaa etsiä oppikirjoista, joita löytyy FYS4:stä muutamia. Jos kiroja luettuasikin olet tyytymätön, kysy uudestaan.

Griffithsin kirjassa harmonisen värähtelijän koherentti tila mainitaan laskuoperaattorin $\hat{a}$ ominaisfunktiona. Jos laskuoperaattorilla on ominaisfunktio, miksi nosto-operaattori kuvataan ominaisfunktiottomaksi? Oletetaanpa, että $\ket{\psi}=\sum_{k=0}^\infty c_k\ket{k} \neq 0$ on nosto-operaattorin $\hat{a}^\dagger$ ominaistila. $\hat{a}^\dagger$ operoi siis niin, että $\hat{a}^\dagger\ket{k}=b_k\ket{k+1}$, missä kukin $b_k$ on jokin nollasta poikkeava kerroin (niiden tarkkaa muotoa ei nyt tarvita). Olkoon $n$ pienin luku, jolla kerroin $c_k$ eroaa nollasta. Jos ominaisarvo on $\lambda$, saadaan $$ \sum_{k=n}^\infty \lambda c_k\ket{k} = \lambda\ket{\psi} = \hat{a}^\dagger\ket{\psi} = \sum_{k=n}^\infty c_k\hat{a}^\dagger\ket{k} = \sum_{k=n}^\infty c_k b_k\ket{k+1} = \sum_{k=n+1}^\infty c_{k-1} b_{k-1}\ket{k}. $$ Kerrotaan molempia puolia vasemmalta $\bra{n}$:llä, jolloin ($\braket{k}{j}=\delta_{kj}$) $$ \lambda c_n = 0. $$ Oletuksen mukaan oli $c_n \neq 0$, joten $\lambda=0$. Siispä $$ \sum_{k=n+1}^\infty c_{k-1} b_{k-1}\ket{k}=0. $$ Kertomalla tätä vasemmalta $\bra{n+1}$:llä saadaan $c_n b_n=0$. Koska kertoimet $b_k$ eivät ole nollia, on siis $c_n=0$, mikä on vastoin oletusta. Ominaisfunktiota ei siis löydy.

Laskuharjoitus 4

Vihjeitä tehtävään 5

Ennen varsinaisen ongelman kimppuun käymistä kannattaa johtaa seuraavat tulokset ($a>0$ on vakio): $$\int_{-\infty}^{\infty}e^{-ax^2}dx=\sqrt{\pi}a^{-1/2}$$ $$\int_{-\infty}^{\infty}xe^{-ax^2}dx=0$$ $$\int_{-\infty}^{\infty}x^2e^{-ax^2}dx=\frac{1}{2}\sqrt{\pi}a^{-3/2}$$ $$\int_{-\infty}^{\infty}x^3e^{-ax^2}dx=0$$ $$\int_{-\infty}^{\infty}x^4e^{-ax^2}dx=\frac{3}{4}\sqrt{\pi}a^{-5/2}.$$ Nollat voi päätellä symmetriasta, ensimmäisen tuloksen voi ottaa annettuna (kuten laskuharjoituksessa 2) ja kaksi muuta saa osittaisintegroimalla sopivasti. Myös gammafunktiota voi käyttää, jos se tuntuu helpommalta.

Delta-funktio ja Fourier-muunnos

Diracin delta-funktio $\delta(x)$ voidaan esittää hyvin kapeana ja korkeana palkkina, jonka pinta-ala on 1. Se voidaan kuitenkin esittää monissa muissakin muodoissa (monisteen s. 101). Miksi tämä moninaisuus? Voiko vapaasti valita, mitä käyttää? Nämä esityksethän poikkeavat varsin paljon toisistaan. Näistä esityksistä voi halutessaan käyttää mitä vain, sillä ne johtavat samaan tulokseen. Yleensä ei kuitenkaan tarvitse käyttää mitään näistä hankalista esitykistä, vaan on parempi käyttää sivulla 102 lueteltuja delta-funktion ominaisuuksia. Erityisesti ominaisuudet a, b ja d sekä sivun 100 yläosassa oleva delta-funktion määrittelevä ominaisuus ovat usein käytännön laskuissa tarpeellisia.

Millä tarkkuudella Fourier-muunnos ja deltafunktion käyttö on osattava/tunnettava? Deltafunktiosta on syytä tuntea sivun 100 määritelmä sekä siitä seuraavat sivun 102 ominaisuudet a, b ja d. Fourier-muunnoksesta on syytä muistaa sen määritelmä sivulla 113 ja samalla sivulla mainittu yhteys $x$- ja $p$-esitysten välillä. (Tämä on minun mielipiteeni tarpeellisista asioista; turvallisinta on kysyä osattavaksi vaadittavia asioita Karilta.)

Deltafunktionormittuvuus on kaiketi ominaisuus, joka tekee aaltofunktiosta jollain tapaa hyväksyttävän, vaikka se ei täyttäisikään Bornin reunaehtoja. Eivätkö kaikki funktiot ole deltafunktionormittuvia? Mitä etua deltafunktionormittuvuudesta on? En ole törmännyt ilmaisuun "deltafunktinormittuvuus", mutta oletan sen tarkoittavan sitä, että funktio toteuttaa deltafunktion sivulla 100 saaman määritelmän, kun käytetään mitä hyvänsä sivun 101 esityksistä. (Jos tarkoitat sillä jotain muuta, kerro ihmeessä.) Tähän ainakin riittää, että funktio on rajoitettu ja jatkuva. (Määritelmämme aaltofunktiolle ei takaa, että se olisi rajoitettu, mutta tämäkin kuuluu joukkoon turvallisia huonosti perusteltuja oletuksia, joita annamme itsellemme luvan tehdä.) Jatkuvuudestakin voi (tietääkseni) hieman joustaa vaatimalla, että jokainen piste on Lebesgue-piste, mutta sellaisia yksityiskohtia emme voi ilmeisistä syistä tutkia tällä kurssilla.

Bra- ja ket-vektorit

Voisiko saada tehtävän 1 kaltaisia rautalankaesimerkkejä bra- ja ket-vektoreilla laskemisesta? Seuraavalla esimerkillä ei ole erityisesti tekemistä fysiikan kanssa, vaan se on vain laskutekniikkaharjoitus. Tutkitaan kaksitilasysteemiä (eli meillä on jokin ortonormaali kanta $\{\ket{1},\ket{2}\}$) ja siellä operaattoreita $\hat{A}$ ja $\hat{B}$, jotka on määritelty siten, että $$ \hat{A}\ket{1}=\ket{1}+2\ket{2},\quad \hat{A}\ket{2}=-\ket{1}+\ket{2},\quad \hat{B}\ket{1}=2\ket{1}-\ket{2},\quad \hat{B}\ket{2}=3\ket{2}. $$ Huomaa, että nämä operaattorit eivät ole hermiittisiä, joten ne eivät vastaa observaabeleita; valitsin näin korostaakseni, että seuraavissa laskuissa on kyse lineaarialgebrasta eikä fysiikasta. Määritellään lisäksi vektorit $$ \ket{x}=\ket{1}+i\ket{2},\quad \ket{y}=2i\ket{1}, $$ ja ryhdytään laskemaan lausekkeen $\bra{x}\hat{A}\hat{B}\ket{y}$ arvoa. Ensiksi huomataan, että $$ \bra{x}=\bra{1}-i\bra{2}, $$ sillä vaihdettaessa bra- ja ket-vektorien välillä tulee kerroin aina kompleksikonjugoiduksi. Siispä $$ \bra{x}\hat{A}\hat{B}\ket{y} = (\bra{1}-i\bra{2})\hat{A}\hat{B}(2i\ket{1}). $$ (Tässä kannattaa käyttää riittävää määrää sulkeita selkeyden vuoksi.) Kertoimen $2i$ voimme ottaa koko rakennelman eteen ja käyttää operaattorin $\hat{B}$ määritelmää: $$ \bra{x}\hat{A}\hat{B}\ket{y} = 2i(\bra{1}-i\bra{2})\hat{A}(2\ket{1}-\ket{2}) = 2i(\bra{1}-i\bra{2})(2\hat{A}\ket{1}-\hat{A}\ket{2}). $$ Nyt käytämme $\hat{A}$:n määritelmää: $$ 2\hat{A}\ket{1}-\hat{A}\ket{2} = 2(\ket{1}+2\ket{2})-(-\ket{1}+\ket{2}) = 3\ket{1}+3\ket{2} = 3(\ket{1}+\ket{2}). $$ Siispä $$ \bra{x}\hat{A}\hat{B}\ket{y} = 2i(\bra{1}-i\bra{2})(2\hat{A}\ket{1}-\hat{A}\ket{2}) = 2i(\bra{1}-i\bra{2})3(\ket{1}+\ket{2}). $$ Nyt voimmekin kirjoittaa sulut auki ja käyttää ortonormitusta $\braket{j}{k}=\delta_{jk}$: $$ \bra{x}\hat{A}\hat{B}\ket{y} = 2i \cdot 3 (\braket{1}{1}+\braket{1}{2}-i\braket{2}{1}-i\braket{2}{2}) = 6i(1-i) = 6+6i. $$ Voimme myös kirjoittaa bra- ja ket-vektorimme sekä operaattorit matriisimuodossa. Tällöin laskettava otuksemme saa muodon $$ \bra{x}\hat{A}\hat{B}\ket{y} = \begin{pmatrix}1&-i\end{pmatrix} \begin{pmatrix}1&-1\\2&1\end{pmatrix} \begin{pmatrix}2&0\\-1&3\end{pmatrix} \begin{pmatrix}2i\\0\end{pmatrix}. $$ (Varmista, että ymmärrät ainakin jollain tasolla, miksi tämä on sama asia.) Jos tämän laskee läpi, saa tulokseksi $$ \begin{pmatrix}1&-i\end{pmatrix} \begin{pmatrix}1&-1\\2&1\end{pmatrix} \begin{pmatrix}2&0\\-1&3\end{pmatrix} \begin{pmatrix}2i\\0\end{pmatrix} = \begin{pmatrix}1&-i\end{pmatrix} \begin{pmatrix}1&-1\\2&1\end{pmatrix} \begin{pmatrix}4i\\-2i\end{pmatrix} = \begin{pmatrix}1&-i\end{pmatrix} \begin{pmatrix}6i\\6i\end{pmatrix} = 6+6i. $$ Huomaa saman lopputuloksen lisäksi, että välitulokset vastaavat täysin toisiaan.

Mistä näkee/tietää, että $\sum_n\ket{a_n}\bra{a_n}=\hat{1}$? Jos vektorit $\ket{a_n}$ muodostavat ortonormaalin kannan (kuten on, jotta ihmetelty yhtälö olisi totta), voidaan jokainen vektori $\ket{x}$ kirjoittaa muodossa $\ket{x}=\sum_m c_m\ket{a_m}$. Tällöin $$ (\sum_n\ket{a_n}\bra{a_n})\ket{x} = (\sum_n\ket{a_n}\bra{a_n})(\sum_m c_m\ket{a_m}) = \sum_{n,m}c_m \ket{a_n}\braket{a_n}{a_m} = \sum_{n,m}c_m \delta_{nm} \ket{a_n} = \sum_{n}c_n \ket{a_n} = \ket{x} = \hat{1}\ket{x}. $$ Koska näin käy kaikille vektoreille $\ket{x}$, ovat $\sum_n\ket{a_n}\bra{a_n}$ ja $\hat{1}$ sama operaattori.

Haetaanpa lopuksi hieman tuntumaa kannanvaihtoon bra- ja ket-vektorien avulla. Tutkitaan kahta hermiittistä operaattoria $\hat{A}$ ja $\hat{B}$ sekä niiden ortonormaaleja ominaiskantoja $\{\ket{a_n}\}$ ja $\{\ket{b_n}\}$, joille pätee $\hat{A}\ket{a_n}=a_n\ket{a_n}$ ja $\hat{B}\ket{b_n}=b_n\ket{b_n}$. (Huomaa, että ortonormitus koskee sisätuloja $\braket{a_n}{a_m}$ ja $\braket{b_n}{b_m}$, kun taas sisätulosta $\braket{a_n}{b_m}$ emme voi sanoa oikein mitään.)

Edellisen kysymyksen kohdalla todettiin, että $\sum_n\ket{b_n}\bra{b_n}=\hat{1}$. Täten operaattorin $\hat{A}$ voimme kirjoittaa muodossa $$ \hat{A} = \hat{1}\hat{A}\hat{1} = (\sum_n\ket{b_n}\bra{b_n})\hat{A}(\sum_m\ket{b_m}\bra{b_m}) = \sum_{n,m} \ket{b_n}\bra{b_n}\hat{A}\ket{b_m}\bra{b_m}. $$ Operaattorin $\hat{A}$ matriisielementit kannassa $\{\ket{b_n}\}$ (sanon jatkossa lyhyesti: $b$-kannassa) ovat $$ A_{nm}^b=\bra{b_n}\hat{A}\ket{b_m}. $$ Siispä $$ \hat{A} = \sum_{n,m} \ket{b_n}A_{nm}^b\bra{b_m} = \sum_{n,m} A_{nm}^b \ket{b_n}\bra{b_m}. $$ (Tämä on hyvin luonnollista. Selvitän hieman alempana, miksi.) Operaattorin $\hat{A}$ ominaiskannassa eli $a$-kannassa on siis $A_{nm}^a=a_n\delta_{nm}$, joten $$ \hat{A} = \sum_{n,m} A_{nm}^a \ket{a_n}\bra{a_m} = \sum_{n} a_n \ket{a_n}\bra{a_n}. $$ (Vastaavasti $\hat{B}$ voidaan esittää ominaiskannassaan: $\hat{B}=\sum_{n} b_n \ket{b_n}\bra{b_n}$.) Jotta $\hat{A}$:n esitys $b$-kannassa tulisi käyttökelpoiseksi, täytyy meidän osata laskea matriisielementit. Kun työnnämme pari ykkösoperaattoria $a$-kannassa määritelmään, saamme $$ A_{nm}^b = \bra{b_n}\hat{1}\hat{A}\hat{1}\ket{b_m} = \sum_{jk} \braket{b_n}{a_j}\bra{a_j}\hat{A}\ket{a_k}\braket{a_k}{b_m} = \sum_{jk} \braket{b_n}{a_j}A_{nm}^a\braket{a_k}{b_m}. $$ Kertoimia $\braket{b_n}{a_j}$ ja $\braket{a_k}{b_m}$ käyttäen voimme siis esittää $b$-kannan matriisielementit $a$-kannan matriisielementtien avulla. Tämä summamuotohan on kolmen matriisin tulo; keskimmäinen on $A^a$ ja reunimmaisten matriisielementit ovat $\braket{b_n}{a_j}$ sekä $\braket{a_k}{b_m}$. Koska $\braket{b_n}{a_j}^*=\braket{a_j}{b_n}$, on kyseessä yksi ja sama matriisi; toisella puolen se vain on tikaroitu. Lineaarialgebran kursseilla on toivottavasti muistettu mainita, että juuri tällaiset sisätulot muodostavan kannanvaihtomatriisin alkiot, kunhan molemmat kannat ovat ortonormaalit. Olemme siis löytäneet matriisin kannanvaihdon!

Kun määritellään matriisi $U$ siten että $U_{ij}=\braket{a_i}{b_j}$, saadaan lausuttua kannanvaihto matriisimuodossa (eikä elementeittäin kuten yllä): $$ A^b=U^\dagger A^a U. $$

Matriisin $U_{ij}$ sarake $j$ sisältää vektorin $\ket{b_j}$ kertoimet $a$-kannassa: $$ \sum_{i}U_{ij}\ket{a_i} = \sum_{i}\ket{a_i}U_{ij} = \sum_{i}\ket{a_i}\braket{a_i}{b_j} = \ket{b_j}. $$ Vastaavasti rivi $i$ sisältää vektorin $\bra{a_i}$ kertoimet $b$-kannassa, eli kompleksikonjugoituina vektorin $\ket{a_i}$ kertoimet.

Lopuksi vielä pari sanaa matriisien esittämisestä tutussa $\R^n$:ssä. Esimerkiksi matriisi $\begin{pmatrix}1&2\\3&4\end{pmatrix}$ voidaan esittää (epä)kätevästi summana $$ \begin{pmatrix}1&2\\3&4\end{pmatrix} = 1\cdot\begin{pmatrix}1\\0\end{pmatrix}\begin{pmatrix}1&0\end{pmatrix} + 2\cdot\begin{pmatrix}1\\0\end{pmatrix}\begin{pmatrix}0&1\end{pmatrix} + 3\cdot\begin{pmatrix}0\\1\end{pmatrix}\begin{pmatrix}1&0\end{pmatrix} + 4\cdot\begin{pmatrix}0\\1\end{pmatrix}\begin{pmatrix}0&1\end{pmatrix}. $$ Samoin mikä tahansa $2 \times 2$-matriisi $M$ voidaan esittää kantavektorien $e_1$ ja $e_2$ sekä niiden transpoosien avulla summana $$ M = m_{11} e_1 e_1^T + m_{12} e_1 e_2^T + m_{21} e_2 e_1^T + m_{22} e_2 e_2^T, $$ missä $m_{ij}$ ovat $M$:n elementit tässä kannassa. Vastaavasti mille tahansa $n \times m$-matriisille pätee $$ M=\sum_{i=1}^{n}\sum_{j=1}^{m}m_{ij} e_i e_j^T. $$ Tämähän näyttää kovasti samalta kuin operaattoreiden esitys edellä muodossa $$ \hat{A} = \sum_{n,m} A_{nm}^b \ket{b_n}\bra{b_m}! $$

Minimiaaltopaketti

Missä minimiaaltopaketti tulee käytännössä vastaan? Vai tuleeko edes vai leviävätkö ne kaikki? Minimiaaltopaketti on usein hyvä approksimaatio muillekin aaltopaketeille. Minimiaaltopaketin suuri etu on siinä, että se tekee laskuista helppoja – ainakin verrattuna useimpiin muihin aaltopakettien muotoihin. Kyllähän ne kaikki leviävät, mutta joskus (melko useinkin) leviäminen on niin hidasta, että sen voi jättää huomiotta kokonaan.

Millaiselle hiukkaselle ja missä tilanteessa minimiaaltopaketin ehto $\delta x \Delta p = \hbar/2$ voi käytännössä toteutua? Katso edellistä kohtaa. Monesti tutkimuksessa käytetään minimiaaltopaketteja niiden helppouden vuoksi, vaikka käytännössä aaltopaketin muodon pitäisi olla jotain muuta tai muotoa ei lainkaan tunneta.

Jos aaltopaketin ryhmänopeus vastaa hiukkasen nopeutta, niin mikä fysikaalinen merkitys on paketin vaihenopeudella? Havainnollisen kuvan tästä antaa Wikipediasta löytyvä animaatio. Kvanttimekaanista aaltoa (aaltopakettia tai tasoaaltoa) voi ajatella hieman samaan tapaan kuin klassisesta fysiikasta tuttuja aaltoja. Vaihenopeus kuvaa samassa vaiheessa (esimerkiksi kaikki positiiviset reaaliluvut ovat samassa vaiheessa) olevan (kuvitteellisen) pisteen nopeutta. Koska vaihetekijä ei sinänsä ole havaittava, ei vaihenopeuskaan ole havaittava. (Se voi myös ylittää valonnopeuden.)

Mitä merkitystä aaltofunktion ryhmänopeudella on? Se on aaltofunktion kuvaavan hiukkasen (tai hiukkasjoukon) nopeus.

Minimiaaltopaketille todettiin, että se levenee ajan myötä (x:n hajonta kasvaa). Jonkin ajan kuluttua se ei siis enää ole minimiaaltopaketti, kun $x$:n hajonnan ja $p$:n hajonnan tulo on myös kasvanut suuremmaksi kuin $\hbar/2$? Kyllä. Jos aaltopaketti on minimiaaltopaketti hetkellä $t_0$, se ei ole minimiaaltopaketti enää minään hetkenä $t>t_0$! Lyhyessä ajassa tosin muutos on kovin pieni.

Aaltopaketti joka ei ole minimiaaltopaketti voi supistua minimaaltopaketiksi ajan kuluessa, jonka jälkeen se taas leviää, mutta voiko se vielä palautua minimiaaltopaketiksi on onko olemassa "syklisyyttä"? Ei ole. Huomaat levinneen minimiaaltopaketin lausekkeesta monisteesta, ettei se enää koskaan palaa minimiaaltopaketin muotoon.

Luennolla käsiteltiin aaltopaketin käyttäytymistä sen törmätessä potentiaalivalliin ja Kari mainitsi ohi mennen että aaltofunktion eksponentiaalinen vaimeneminen vallin sisällä voisi olla myös eksoponentiaalista vomistumista tilanteessa, jossa aaltopaketin energia ei ylistä vallin energiaa. Ymmärsinkö oikein ja minkälainen kyseinen tilanne mahdollisesti olisi käytännössä? Potentiaalivallin sisällä (oletus: hiukkasen energia ei ylitä vallin korkeutta) aaltofunktio on superpositio eksponentiaalisesti vaimenevasta ja voimistuvasta funktiosta. Molempia osia voi aaltofunktiossa olla, mutta vallin toisella puolella ei kuitenkaan voi aaltofunktion amplitudi kasvaa suuremmaksi kuin saapumispuolella.

Kannat ja esitykset

Mitä fysikaalista/laskennallista hyötyä meille on tehtävän 1 kaltaisesta kannanvaihtomatriisista? Systeemin aikakehitys on selkeästi helpointa ja luonnollisinta laskea energian ominaiskannassa, joten sille on käyttöä aina. Joskus kuitenkin kiinnostus kohdistuu johonkin observaabeliin, joka ei kommutoi energian kanssa ja jolla on siis oma kantansa. Näin käy vaikkapa neutriinojen kohdalla: Neutriinoja on kolmea sorttia (ehkä useampiakin), joten tarkasteltavana on kolmitilasysteemi. Yhden kannan tähän tila-avaruuteen muodostavat "massalliset neutriinot"; energia riippuu keskeisesti massasta, ja "massa-operaattorin" (sellainen löytyy kvanttikenttäteoriassa) ominaisarvoina on kolme erisuurta massaa. Sen sijaan neutriinojen vuorovaikutuksen kannalta kiinnostavia ovat "makuneutriinot": elektronin neutriino (voi syntyä elektronista joissain reaktioissa), myonin neutriino (myoni on elektronia raskaampi mutta muuten samanlainen) ja taun neutriino (tau on vielä paljon raskaampi) muodostavat "makukannan". (Makuja ovat siis $e$, $\mu$ ja $\tau$.) Tavallisesti vuorovaikutuksissa neutriino syntyy johonkin makutilaan, ja se voidaan myös havaita makutilasta. Kuten olemme kurssilla nähneet, tällaisessa tilanteessa aikakehitys saa aikaa havaittavaa aikakehitystä. Neutriinot siis vaihtavat spontaanisti makua liikkuessaan! Tätä kutsutaan neutriino-oskillaatioksi.

Onko systeemin kannalla/ominaiskannalla mitään fysikaalista vastinetta tai merkitystä, vai ovatko ne puhtaasti matemaattisia käsitteitä kvanttifysiikassakin? Ne ovat pääosin matemaattisia käsitteitä. Kantavektoreilla on myös fysikaalinen tulkinta: oservaabelia $A$ vastaavan operaattorin ominaistilassa (eli tila on jokin kantavektori) on vain yhtä $A$:n arvoa; mittauksessa $A$ voi saada vain kyseisen ominaisarvonsa.

Milloin liikemääräesitys on parempi kuin paikkaesitys? Hiukkasfysiikassa useimmiten. Liikemäärät ja energiat ovat keskeisiä havaintosuureita (ja niitä sitovat säilymislaitkin helppokäyttöisesti), joten liikemääräesitys on parempi. Hiukkasfysiikan ja kvanttikenttäteorian kursseilla paikkaesitys alkaa jäädä taka-alalle.

Muuta

Tehtävässä 5 hetkellä $t=0$ (ja myöhemminkin) käy niin, että $\delta t\to\infty$. Mitä tämä tarkoittaa fysikaalisesti? Sitä, että $\delta t$ on vähän kehnosti määritelty otus. Sehän on määritelty aina jonkin apuobservaabelin välityksellä (prujussa $Q$). Tämä muistuttaa hieman tasoaallon tilannetta, jossa paikan hajonta on ääretön.

Miksi harmonisen värähtelijän ollessa jossakin energian ominaistilassa $\frac{d}{dt}\vev{x}=0$? (Energian mittauksen jälkeen hiukkanen siis näyttäisi pysähtyvän.) Näin todella näyttää käyvän, mutten osaa antaa sille hyvää fysikaalista tulkintaa. Tämä ilmiö on yleinen: mitä hyvänsä observaabelia mitataankaan energian ominaistilassa olevasta systeemistä, ei todennäköisyysjakauma riipu ajasta lainkaan, kunhan vastaava operaattori ei riipu ajasta.

Voiko vielä selventää käsitettä lokaali operaattori (s. 104)? Mitä observaabelia esimerkiksi vastaa lokaali operaattori? Tällä kurssilla (muistaakseni) törmäämme vain lokaaleihin operaattoreihin. Sellaisia ovat vaikkapa paikka ja liikemäärä. Jos vaikkapa aaltofunktion arvo tunnetaan yhdessä pisteessä (sisältäen sekä paikka- että aikakoordinaatin) ja jossain sen pienessä ympäristössä, voidaan tästä päätellä päätellä, mitä paikka-, liikemäärä- ja energiaoperaattorit ($-i\hbar\nabla_x$, $\hat{x}$, $i\hbar\partial_t$) aaltofunktiolle tekevät.

Mitä tarkoitetaan Schrödingerin kissalla? Ajatuskoetta, joka tuo kvanttimaailman kummallisuuden selvästi havaittavalle tasolle. Tästä epäonnisesta kissaeläimestä kertoo enemmän Wikipedia.

Jos sirontatilanteessa syntyy läpäissyt aalto ja heijastunut aalto (ja ajatellaan aaltopaketti yhtenä hituna), eikö silloin yksi ja sama hiukkanen jakaudu kahtia tai "monistu"? Voiko tämä olla pysyvää? Hiukkanen on osittain heijastunut ja osittain mennyt läpi, joten se todella on kahdessa paikassa yhtä aikaa. Vasta mittaaminen pakottaa hiukkasen yhteen paikkaan: aaltofunktio koostuu kahdesta piikistä (heijastunut ja läpi mennyt aaltopaketti), joista toinen häviää aaltofunktion romahtaessa. Jos hiukkanen mitataan heijastuneena, aalktofunktio katoaa toiselta puolen, eikä siis samaa hiukkasta voida mitata myös läpäisseeksi.

Mitä tarkoittaa, että energian spektri on degeneroitumaton? Sitä, että kunkin energian ominaisarvon kertaluku on 1. Jos esimerkiksi kolmitilasystteemin Hamiltonin operaattoria vastaava matriisi on (jossain kannassa) $\begin{pmatrix}\hbar\omega&0&0\\0&2\hbar\omega&0\\0&0&2\hbar\omega\end{pmatrix}$, niin ominaisarvo $2\hbar\omega$ on kaksinkertaisesti degeneroitunut (sille on kaksi lineaarisesti riippumatonta ominaisvektoria). Jos taas olisikin $\begin{pmatrix}\hbar\omega&0&0\\0&2\hbar\omega&0\\0&0&3\hbar\omega\end{pmatrix}$, olisi energian spektri degeneroitumaton.

Mikä on aaltofunktioiden suhteellisen ja kokonaisvaiheen ero? Tähän olen ymmärtääkseni vastannut ensimmäisen demon kohdalla. Kysy ihmeessä tarkemmin, jos se ei selvittänyt asiaa riittävästi.

Laskuharjoitus 5

Kysymyksiä

Melkein kaikki on enemmän tai vähemmän epäselvää. Näin yleisluontoiseen huomautukseen on vaikea puuttua. Oletus on (yliopistolla aina), että opiskelija kysyy epäselvistä asioista. Minulta saa kysyä asioita typerän oloisia kysymyksiä ja moneen kertaan, jos se tuntuu tarpeelliselta.

Onko välttämätöntä, että $\delta$-funktiopotentiaalin kohdalla $\psi'$:lla on epäjatkuvuuskohta? Kyllä, näin käy aina, ellei aaltofunktio satu olemaan potentiaalin deltafunktiopiikin kohdalla nolla. Luennoilla ja prujussa on osoitettu, että aaltofunktion derivaatan epäjatkuvuuden määrä on suoraan verrannollinen aaltofunktion arvoon.

Kokeeseen valmistautumisesta

Kokeeseen valmistautumiseen annan kolme ohjetta:

Yleisluontoisiin kysymyksiin kokeesta löytyy vastauksia laitoksen koesivulta.

Laskuharjoitus 6

Tikapuiden syvin olemus

Ovatko lasku- ja nosto-operaattorit aaltofunktion tilojen nostamista/laskemista varten tilalta toiselle vai onko niillä jotakin tarkempaa merkitystä? Ovatko ne vain matemaattisia apuvälineitä? Ne ovat ensisijaisesti matemaattisia apuvälineitä. Niille löytyy myös analogia kvanttikenttäteoriasta, hävitys- ja luomisoperaattorit, joita merkitään samalla tavalla. "Perustilana" on tyhjiö, ja operoimalla tyhjiöön luomisoperaattorilla luodaan tila, jossa onkin yksi hiukkanen. Ajatus on siis hyvinkin sama ja fysikaalisesti helposti tulkittavissa.

Mitä systeemille käytännössä tapahtuu, kun tilaa nostetaan tai lasketaan? Lisätäänkö tai vähennetäänkö silloin systeemin energiaa? Jos sinulle annetaan perustilallaan oleva harmoninen värähtelijä (mitä se sitten käytännössä tarkoittaisikin), et voi operoida siihen nosto-operaattorilla saadaksesi sitä korkeaenergiaisempaan tilaan. (Muutenkin operaattorit ovat matemaattisia apuvälineitä, eikä operaattorilla operoimista voi oikein realisoida luonnossa.) Tikapuuoperaattorit ovat siis lähinnä ajatusapuvälineitä. Toisaalta, jos kerran tila siirtyy ylös tai alas, sen energia varmasti muuttuu vastaavalla tavalla, mutta operaattorit täytyy erottaa siitä, mitä voit käytännössä tehdä sinulle annetulle hiukkaselle.

Mistä operaattori $\hat{a}$ tulee? En tiedä, mistä se on alun perin keksitty, enkä tunne yhtään analogiaa klassiseen mekaniikkaan. Vaikka se vaikuttaa alkuun pöljältä operaattorilta, se on kuitenkin hyödyllinen ja käyttökelpoinen.

Voiko hiukkanen laatikossa -tyyppisille energiatiloille määrittää tikapuuoperaattorit? Merkitsen seuraavassa $c_n=\sqrt{n}$. Laskuoperaattori voidaan kirjoittaa muodossa $$ \hat{a}=\sum_{n=1}^\infty \ket{n-1}c_n\bra{n}. $$ Tällöin $\hat{a}\ket{m}=\sum_{n=1}^\infty \ket{n-1}c_n\braket{n}{m}=\sum_{n=1}^\infty \ket{n-1}c_n\delta_{nm}=c_m\ket{m-1}$ kuten pitääkin. Vastaavasti nosto-operaattori on $$ \hat{a}^\dagger =(\sum_{n=1}^\infty \ket{n-1}c_n\bra{n})^\dagger =\sum_{n=1}^\infty (\ket{n-1}c_n\bra{n})^\dagger =\sum_{n=1}^\infty \ket{n}c_n^*\bra{n-1}. $$ Tämä määritelmä on vähän kömmpelö, mutta yksi etu siinä on: Jos vain tunnemme tilat $\ket{n}$, voimme heti rakentaa niistä nosto- ja laskuoperaattorit. Tämä siis onnistuu myös hiukkaselle laatikossa, mutta mitään kovin siistiä ei näistä operaattoreista tietääkseni tule – ainakaan verrattuna harmonisen värähtelijän tapaukseen.

Spin

Mitä spin on fyysisesti? Millä tavalla se on pyörimismäärä? En osaa antaa tähän tyhjentävää vastausta. Muut vastaukset tämän otsikon alla toivottavasti selvittävät asiaa. Myös kirjoja voi tutkia, jos haluaa tietää enemmän. Hiukkasfysiikan kirjoissakin saattaa olla asiasta jotain kiinnostavaa – ainakin lähestymistapa lienee eri.

Spin esiteltiin hiukkasen sisäisenä ominaisuutena. Griffiths kertoo varatun hiukkasen dipolimomentin olevanverrannollinen hiukkaasen spiniin. Miten muuten spin näkyy hiukkasen ulkopuolelle? Esim. varaamattomat hiukkasetja spin-0-hiukkaset, joilla ei ole dipolimomenttia? Spin vaikuttaa keskeisesti siihen, miten hiukkaset käyttäytyvät törmätessään toisiinsa. Jos vaikkapa elektroni olisikin spin-0-hiukkanen, voidaan hiukkasfysiikan tietojen pohjalta (skalaari-QED:n Feynmanin säännöt löytyvät vaikkapa täältä) laskea, mihin suuntaan elektronin siroavat törmättyään toisiinsa. Tämä kulmajakauma on mitattu, ja vastaa täysin spin-$\frac{1}{2}$-hiukkasta. Vastaavasti törmäyskokeiden avulla voidaan päätellä myös varaamattomien hiukkasten spinit.

Selkiytyvätkö spin-asiat kurssilla myöhemmin? Meni nyt nimittäin ainakin kovasti yli hilseen. Toivottavasti selviää. Spiniä käsitellään uudemman kerran myös kursseilla Kvanttimekaniikka 2 ja Hiukkasfysiikka, joten nyt ei ole tarpeen loppuun asti ymmärtää, mikä se spin oikein on. Tälle kurssille riittävä ajatus on, että se on jonkinlainen sisäinen pyörimismäärä.

Miksi kierto-operaattoriin on haluttu laittaa väkisin $i$: $\begin{pmatrix}0&1&0\\-1&0&0\\0&0&0\end{pmatrix}=i\begin{pmatrix}0&-i&0\\i&0&0\\0&0&0\end{pmatrix}$ ja $\Sigma_z(\alpha)=-i\frac{dR_z(\alpha)}{d\alpha}|_{\alpha=0}$? Osittain tämä johtuu siitä, että näin on tapana tehdä, mutta näen myös toisen edun. Kun kirjoitamme $R_z(\alpha)=e^{i\alpha\Sigma_z}$, tulee operaattorista $\Sigma_z$ hermiittinen. Se vastaa lisäksi observaabelia, joten on tosiaankin mukavampi käsitellä operaattoria $\Sigma_z$ juuri sellaisena kuin se on määritelty. Lisäksi yleisemmin pätee, että jos $\hat{A}$ on hermiittinen, niin $e^{i\hat{A}}$ on unitaarinen (todista jos et usko – ei ole kovin vaikeaa), ja näin ollen näkyy, että kierto-operaattori on unitaarinen. Näinhän sen pitää ollakin, sillä jos kaikkia tiloja kierretään samalla tavalla, ei sisätulojen (ja sitä kautta todennäköisyyksien) pitäisi muuttua lainkaan.

Miten atomien ytimien spin lasketaan? Onko se protonien ja neutronien spinien summa vai jotain muuta? Kuinka isoja spin-lukuja on suurimmillaan käytössä hiukkasfysiikassa? Spinien tai yleisemmin pyörimismäärien yhteenlaskua ihmetellään kurssilla myöhemmin. Jos vaikkapa yhdistät kaksi spin-1-hiukkasta, saat tulokseksi jonkinlaisen superposition spin-0- ja spin-2-hiukkasesta. Spinien tai muutenkin pyörimismäärien yhteenlasku on siis hyvin epätriviaalia, ja muodostuu suurilla hiukkasmäärillä hankalaksi. Suurin spin, joka on minulle tullut hiukkasfysiikassa vastaan, on 2 (gravitonin spin on 2). Ydinfysiikassa käsitellään tyypillisesti hiukkasfysiikkaa korkeampia spinejä.

Miksi elektronilla on aaltofunktiossa vain kaksi komponenttia kun fotonilla on kolme? Elektroni on luonteeltaan erilainen hiukkanen kuin fotoni. Jos elektronin aaltofunktioon sisällytetään myös positronin (sen antihiukkanen) aaltofunktio, sillä on yhteensä neljä komponenttia. Jos elektronin ja positronin aaltofunktiot pidetään erillään, on komponenttien määrä eri, eli tilanne riippuu siitä, mitä kaikkea luetaan osaksi "samaa hiukkasta". Vaikkapa QCD:ssä kvarkilla voi olla kuusi erilaista makua, kolme väriä ja kaksi spin-tilaa, ja jos lisäksi yhdistetään kvarkit ja antikvarkit (kuten tavallista), saadaan aaltofunktio, jossa on $6 \times 3 \times 2 \times 2 = 72$ komponenttia.

Muuta

Sisäfunktion integrointi ihmetyttää. Miten lasketaan $\int f(g(x))dx$? Ei mitenkään. Yhdistetylle funktiolle ei voida antaa mitään integrointikaavaa, vaikka sekä $f$:n että $g$:n integroiminen onnistuisikin. Hyvä esimerkki tästä on funktio $e^{-x^2}$: sekä $f(x)=e^{-x}$ että $g(x)=x^2$ on helppo integroida, mutta yhdistetylle funktiolle $f(g(x))$ ei edes ole olemassa integraalifunktiota, jonka voisi kirjoittaa alkeisfunktioiden avulla (eli käyttämällä polynomi-, eksponentti-, juuri-, logaritmi- ja trigonometrisiä funktioita sekä yhteen-, vähennys-, kerto- ja jakolaskua äärellisen monta kertaa). Integraalifunktio on kyllä olemassa, mutta sitä ei vain voi kirjoittaa mitenkään yksinkertaisesti.

Mitä tarkoittaa tunneloituminen? Tunneloituminen tarkoittaa hiukkasen liikkumista sellaisen alueen läpi, jossa olemiseen sen energia ei (klassisessa mekaniikassa ainakaan) riitä. Wikipediakin tietää kertoa asiasta kaikenlaista.

On sanottu, että $x$-esitys eli aaltomekaniikka putkahtaa Diracin merkinnästä näin: $\psi(x,t)=\braket{x}{\psi(t)}$. Mitä tämä oikein tarkoittaa? Sisätulo $\braket{b}{a}$ mittaa, kuinka paljon vektorilla $\ket{a}$ on vektorin $\ket{b}$ suuntaista komponenttia. Näinhän sisätulon voi tulkita euklidisessa avaruudessa, ja kvanttimekaniikassa tilanne on sama: sisätulo mittaa, "kuinka paljon tila $\ket{a}$ on tilassa $\ket{b}$". (Koska systeemin ei tarvitse olla puhtaasti yhdessä ainoassa jonkin kannan tilassa, tämä kysymys on ensinkään mielekäs.) Todennäköisyyksiä laskettaessa tämä sisätulon ilmoittama samansuuntaisuuden määrä tulee vielä neliöidä. Siispä sisätulo $\braket{x}{\psi(t)}$ mittaa, kuinka paljon tila $\ket{\psi(t)}$ on tilassa $\ket{x}$ (tämä tila vastaa sitä, että hiukkanen on vain ja ainoastaan pisteessä $x$), eli kuinka paljon tila $\ket{\psi(t)}$ on pisteessä $x$. Tämä vastaa hyvin mielikuvaa aaltofunktion tulkinnasta (sen neliö on todennäköisyystiheys).

Mikä tämä "Kiertojen parametrisointi"-otsikosta lähtien jatkuvasti esiintyvä $O(\alpha^2)$-termi on? Virhetermikö? Tuleeko sitä kantaa johdantojen tavoin aina laskuissa mukana? Se on virhetermi. Tätä O-notaatiota on tapana käyttää väärin, eikä merkintä prujussa käytettynä tarkoita samaa kuin varsinaisen määritelmän mukaisesti. Monisanaisempi selvitys löytyy Wikipediasta, josta kannattaa katsoa myös kohta pikku-o-notaatiosta. Se, mitä merkinnällä $f(x)=g(x)+O(x^2)$ (suunnilleen) tarkoitetaan nyt, on $\lim_{x \to 0}\frac{x^2}{f(x)-g(x)}=0$, eli että pienillä $x$ on $f(x) \approx g(x)$, ja funktion $f(x)-g(x)$ Taylorin polynomin ensimmäinen nollasta eroava termi on alhaisintaan toisen asteen termi. Esimerkiksi on siis $\sin(x)=x+O(x^2)$. Käytännössä merkintä $O(x^2)$ tarkoittaa usein vain, että laskut tehdään ensimmäiseen kertalukuun $x$:ssä, eli funktiot Tayloroidaan ja pudotetaan kaikki toisen asteen ja korkeammat termit pois. Merkintää ei tarvitse kiikuttaa mukana, ja sopivalla rajaprosessilla se saadaan hävitettyä oikeastikin, kuten prujussakin on tehty, kun äärellinen kierto on kirjoitettu infinitesimaalisten kiertojen tulon raja-arvona.

Jos tulee vielä tehtävää lasku- ja nosto-operaattoreilla tai yleensä Diracin formalismilla, onko ok käyttää luonnollisia yksiköitä, eli $\text{vakiot}=1$? Luonnollisia yksiköitä voi käyttää halutessaan demoissa, mutta kokeessa vaaditaan vakioiden kirjoittamista näkyviin. Demoissakin muista aina mainita, että käytät kyseistä notaatiota. Luonnolliset yksiköt tarkoittavat tosin tällä kurssilla vain sitä, että $\hbar=1$; muut ykköseksi muutettavat luonnonvakiot ($c,k_b,G_N$) eivät tällä kurssilla esiinny. Muitakin variantteja luonnollisista yksiköistä on, muttemme halua sotkeutua niihin tällä kurssilla.

Kaksiosaiset ket-vektorit ihmetyttävät. Jos esim $\hat{A}\ket{x}=a_x\ket{x}$ ja $\hat{A}\ket{y}=a_y\ket{y}$, niin onko $\hat{A}\ket{x,y}=a_xa_y\ket{x,y}$? Ehdottamasi kaltainen merkintä ei ole oikein järkevä. Moniosaisia ket-vektoreita käytetään, kun sama tila on monen eri operaattorin ominaistila. Jos esimerkiksi $\hat{A}$ ja $\hat{B}$ ovat kommutoivia hermiittisiä operaattoreita, niillä on samat ominaistilat. $\hat{A}$:n ominaistilaa voi merkitä kurssin A-osan henkeen $\ket{a}$, jolloin $\hat{A}\ket{a}=a\ket{a}$. Mutta nyt sama tila on myös $\hat{B}$:n ominaistila, joten siihen on mukava kirjoittaa näkyviin myös $\hat{B}$:n vastaava ominaisarvo (olkoon se vaikkapa $b$). Tällöin saadaan siis tila $\ket{a,b}$, jolle $\hat{A}\ket{a,b}=a\ket{a,b}$ ja $\hat{B}\ket{a,b}=b\ket{a,b}$. Juuri tähän tapaan on pyörimismäärienkin yhteydessä B-osalla tehty.

Koska $\bra{x}\hat{x}\ket{x'}=x'\delta(x-x')=x\delta(x-x')$, niin saadaanko myös $\bra{x}\hat{p}\ket{x'}=-i\hbar\frac{d}{dx}\delta(x-x')=-i\hbar\frac{d}{dx'}\delta(x-x')$? Prujussa ei mainita asiaa. Saadaan. Koska $\delta(x-x')=\delta(x'-x)$, pitäisi tämä tulos saada melko helpolla laskulla.

Riippuuko (mittauksen) epätarkkuus tilasta? Tehtävässä neljä $\Delta x \Delta p$ jää riippumaan $n$:stä. Eli mitä virittyneempi tila, sitä suurempi epätarkkuus? Näinhän tässä käy. Yleensäkin hajonnat ja epätarkkuuksien tulot riippuvat tilasta. Epätarkkuusperiaate antaa vain alarajan. Tämä on vain alaraja myös kokeellisessa mielessä: epätarkkuusperiaatetta tarkemmin ei voi mitata, mutta epätarkempia mittauksia on hyvin helppo tehdä. Käykää vaikkapa oppilaslaboratoriossa kokeilemassa.

Laskuharjoitus 7

Laboratoriotyöt

Potentiaalikuoppa-laboratoriotyön sivulla linkki Matlab-koodiin on rikki. Millä koneilla työn tekeminen onnistuu? Ilmoitan linkin rikkinäisyydestä työn ohjaajalle. Se ei kuitenkaan estä työn tekoa: riittävät ohjeet ja neuvot saa sähköpostitse. Laitoksen tietokoneluokasta Matlab löytyy, kotikoneilta tuskin. (Lisenssi on muistaakseni kallis.)

Spin ja pyörimismäärä

Käyttäen pyörimismäärävektoria $\hat{\vec{L}}=(\hat{L}_1,\hat{L}_2,\hat{L}_3)$ voidaan muodostaa vektorin $\vec{a}\in\R^3$ suuntainen pyörimismääräoperaattori $\vec{a}\cdot\hat{\vec{L}}$. Tällaisille pätee kommutointisääntö $$ [\vec{a}\cdot\hat{\vec{L}},\vec{b}\cdot\hat{\vec{L}}]=i\hbar(\vec{a}\times\vec{b})\cdot\hat{\vec{L}}, $$ jonka saa johtamastamme tuloksesta $[\hat{L}_i,\hat{L}_j]=i\hbar\sum_k\eps_{ijk}\hat{L}_k$. Tämä ristitulomuoto on ainakin minulle helpompi muistaa kuin indeksimuoto.

Miten spinit aiheuttavat magneettisuuden? Pyörivä (sopivasti jakautunut) varaus aiheuttaa magneettikentän, ja spin on jonkinlainen pyörimismäärä. Tästä voi jotenkin heuristisesti (ja epämääräisesti) päätellä, että spin liittyy magneettisiin ominaisuuksiin. Pistemäinen varaus ei kuitenkaan aiheuta klassisen sähköopin mukaan sähkökenttää, joten tässä tulkinnassa pitäisi olettaa, että varatut hiukkaset eivät ole pistemäisiä. Tarkastellaan nyt kuitenkin sauvaa, jonka pituus on $2r$, jonka molemmissa päissä on pistemäinen varaus $q/2$ (massa $m/2$), ja joka pyörii keskipisteensä ympäri kulmanopeudella $\omega$. Tällöin sauvan kehällä kulkeva virta on $q\omega/2\pi$ (ajassa $2\pi/\omega$ kumpikin varauspiste kiertää koko kehän ympäri, jolloin kunkin pisteen läpi kulkee tässä ajassa varaus $2\cdot q/2=q$). Koska sauvan pyöriessään pyyhkimän ympyrän pinta-ala on $\pi r^2$, on sauvan magneettinen momentti $\mu=q\omega/2\pi\cdot\pi r^2=q\omega r^2/2$. Jos nyt ajatellaan kulmanopeus vektorina, saadaan $\vec{\mu}=q\vec{\omega}r^2/2$. Sauvan hitausmomentti on $I=r^2m/2+r^2m/2=r^2/m$, joten pyörimismäärä on $\vec{L}=I\vec{\omega}$. Siispä $\vec{\mu}=q\vec{L}/2m$. Jos nyt miellämmekin tämän pyörimismäärän spiniksi (eli jollain tapaa sisäiseksi), saamme $\vec{\mu}=q\vec{\Sigma}/2m$, kun hiukkasen spin on $\vec{\Sigma}$, massa $m$ ja varaus $q$. (Pidätän oikeuden laskuvirheisiin.)

Tutkitaanko loppukurssilla pyörimismääriä $\hat{\vec{J}}=\hat{\vec{L}}+\hat{\vec{S}}$, jossa molemmat osat esiintyvät? Kyllä. Kurssilla tulee pitkähkö osuus aiheesta "pyörimismäärien kytkentä", mikä tarkoittaa juuri pyörimismäärien yhteenlaskua. Ennen sitä joudumme kuitenkin tutkimaan yksittäisen pyörimismäärän käytöstä.

Onko spinori sama kuin spinin aaltofunktio? Tarvitaanko sitä muuhun kuin todennäköisyyden laskemiseen? Spinori on aaltofunktio, jossa spinin $z$-komponentin eri ominaistilat on eroteltu toisistaan. Spinorista voi siis suoraan lukea, millä todennäköisyydellä mitäkin spinin $z$-komponentin arvoja voidaan saada. Spinori voi myös riippua paikasta, jolloin kaikki sen spin-komponentit riippuvat paikasta. Spinori on aaltofunktio, ja sitä käytetään kuin mitä tahansa aaltofunktiota.

Mitä tarkoittaa, että kvanttimekaaninen $\vev{\vec{S}}$ prekessoi? Se tarkoittaa, että vektori $\vev{\vec{S}}$ pyörii jonkin akselin ympäri. Tilanne näyttää hyrrältä: vinossa olevan hyrrän symmetria-akseli pyörii hitaasti pöytää vasten kohtisuoran akselin ympäri. Tämä pyöriminen on paljon hitaampaa kuin hyrrän pyöriminen symmetria-akselinsa ympäri, ja siksi se on helpommin havaittavissa.

Luennoilla mainittiin jossain skalaarihiukkanen. Miten oikein määritellään, että hiukkanen on skalaarihiukkanen? Skalaarihiukkanen on hiukkanen, jonka spin on nolla. Tällöin sillä on vain yksi mahdollinen spinin arvo (nolla), joten aaltofunktiossa on vain yksi komponentti. Kurssin A-osalla tutkimme vain skalaarihiukkasia. Hiukkasfysiikan standardimallissa on muuten vain yksi skalaarihiukkanen, Higgsin bosoni, jota ei ole vieläkään onnistuttu löytämään.

Miksi spin-$\frac{1}{2}$-hiukkasen tarkastelussa tutkitaan juuri spinin $z$-komponenttia? Koska spinin eri komponenti eivät kommutoi, meidän täytyy valita jokin yksi suunta, jossa spiniä tutkitaan. Useimmiten erikoisasemaan valitaan $z$-suunta; kyseessä on vain koordinaatiston määritteleminen sopivasti, eikä tässä ole mitään erityistä fysikaalista syytä. Hiukkasfysiikassa on monesti hyödyllistä valita tutkittavaksi suunnaksi hiukkasen liikemäärän suunta. Liikemäärän suuntainen spin tunnetaan paremmin nimellä helisiteetti.

Laskennallista asiaa

Tehtävissä tulee vastaan valtavan paljon eri operaattoreita ja niiden kommutaattoreita. Miten niistä selviää ja mitä niistä pitää osata kokeessa? Yleensä kommutaattoreita purkaessa on hyvä idea sieventää hankalat kommutaattorit kommutaattorin tulosääntöjä $[AB,C]=A[B,C]+[A,C]B$ ja $[A,BC]=[A,B]C+B[A,C]$ käyttäen yksittäisten operaattoreiden kommutaattoreihin, jotka (toivottavasti) tunnetaan. Oleellista on tuntea vähintäänkin kanoniset kommutaatiorelaatiot $[\hat{x}_i,\hat{x}_j]=0$, $[\hat{p}_i,\hat{p}_j]=0$ ja $[\hat{x}_i,\hat{p}_j]=i\hbar\delta_{ij}$ ja tulon kommutointisäännöt. Näistä voi päätellä loput, mutta pyörimismäärien kommutointisääntö $[\hat{L}_i,\hat{L}_j]=i\hbar\sum_k\eps_{ijk}\hat{L}_k$.

Piti näyttää, että $\hat{L}_i$ on hermiittinen, mutta koska Levi-Civita-symboli on antisymmetrinen, se ei ole hermiittinen: $\eps_{ijk}^\dagger\neq\eps_{ijk}$. Miten tästä selvitään? Pyörimismääräoperaattorin määritelmässä luvut $\eps_{ijk}$ ovat vain lukukertoimia: $(\eps_{ijk}\hat{x}_j\hat{p}_k)^\dagger=\eps_{ijk}^*(\hat{x}_j\hat{p}_k)^\dagger=\eps_{ijk}\hat{p}_k\hat{x}_j$. Tällä kurssilla lienee muutenkin parasta ajatella, että Levi-Civita-symboli on vain kokoelma lukuja, eikä niinkään ajatella, että $\eps$ olisi jokin (kolmi-indeksinen!) matriisi. Symbolille voi antaa jos jonkinlaista tulkintaa, mutta niihin takertuminen on syytä jättää tämän kurssin ulkopuolelle.

Tehtävässä 3b piti saada ominaisarvoksi $j$, mutta siitä tulee $\hbar^2f(j)$. Mitä oikein tapahtuu? Ovatko ne samat? Ne eivät ole samat. Tehtävänannossa oli kirjoitusvirhe. Korjailtu versio tehtävistä on kurssin sivulla.

Palloharmoniset funktiot normittuvat mukavasti. Tuleeko usein vastaan tilanteita, joissa kulmaosia ei vain triviaalisti integroida koko avaruuden yli, vaan integraalin joutuu oikeasti laskemaan? Kulmaosat täytyy integroida huolella silloin, kun tutkittava tilanne ei ole pallosymmetrinen. Kurssilla tutkitussa vetyatomin tapauksessa Coulombin potentiaalin symmetria tekee systeemistä pallosymmetrisen, eikä kulmaintegraaleista tarvitse kantaa huolta. Jos potentiaalia muutetaan vaikkapa ulkoisella sähkökentällä, täytyy työtä tehdä laskuissa jo vähän enemmän.

$\eps_{ijk}$:n merkkejä voi vaihdella, mutta milloin merkki vaihtuu edessä? Vai vaihtuuko se aina kun kaksi vierekkäistä indeksiä vaihtuu? Ja jos tekee kaksi vaihto, tulee tuplanegaatio? Merkki vaihtuu aina, kun kaksi indeksiä vaihtaa paikkaa. Kun lisäksi asetetaan $\eps_{123}=1$, tulee koko Levi-Civita-symboli määritellyksi. Kiertovaihtelu $\eps_{ijk}=\eps_{kij}=\eps_{jki}$ on myös voimassa, mutta se ei ole määrittelevä ominaisuus. Vastaavasti voidaan määritellä kaksi-indeksinen Levi-Civita-symboli asettamalla $\eps_{12}=-\eps_{21}=1$ ja $\eps_{11}=\eps_{22}=0$. Tälle ei kiertovaihtelu enää pädekään – se pätee täsmälleen silloin, kun indeksejä on pariton määrä. (Tällä kurssilla indeksimäärä on aina kolme, joten kiertovaihteluun voi luottaa ilman huolia.)

Mitä yhteiset ominaistilat käytännössä tarkoittavat? Tarkastellaan vaikkapa kolmea hermiittistä matriisia $A=\begin{pmatrix}2&0\\0&2\end{pmatrix}$, $B=\begin{pmatrix}0&1\\1&0\end{pmatrix}$ ja $A=\begin{pmatrix}1&0\\0&-2\end{pmatrix}$. Nyt $B$:n ominaisvektorit (ominaistilat) ovat $\frac{1}{\sqrt{2}}\begin{pmatrix}1\\\pm1\end{pmatrix}$ vastaten ominaisarvoja $\pm1$, ja merkitään näitä $\ket{B=\pm1}$. Nämä ovat myös $A$:n ominaisvektoreita (ominaisarvolla $2$), joten niitä voidaankin merkitä $\ket{A=2,B=\pm1}$. Näin tilan $\ket{A=2,B=-1}$ merkinnästä voidaan kerralla lukea, että se on sekä $A$:n että $B$:n ominaisvektori ja ominaisarvotkin ovat näkyvillä. Nämä tilat eivät kuitenkaan ole $C$:n ominaistiloja. $C$:n ominaistiloja ovat $\ket{C=1}=\begin{pmatrix}1\\0\end{pmatrix}$ ja $\ket{C=-2}=\begin{pmatrix}0\\1\end{pmatrix}$. Nämä ovat jälleen myös $A$:n ominaistiloja, joten lisätään niihin merkintä tästä: kirjoitetaan $\ket{A=2,C=1}=\begin{pmatrix}1\\0\end{pmatrix}$ ja $\ket{A=2,C=-2}=\begin{pmatrix}0\\1\end{pmatrix}$. Tilanne on nyt vähän samanlainen kuin pyörimismäärien kanssa. Yksi ($A$) kommutoi kaikkien muiden kanssa, joten sillä on yhteiset ominaistilat, mutta muut eivät kommutoi keskenään. Tämä on mahdollista siksi, että $A$:n ominaiskanta ei ole yksikäsitteinen (yllä löysimme kaksi erilaista).

Laskuharjoitus 8

Pyörimismääräoperaattorit ovat Lien ryhmän $SO(3)$ alkioita, mutta vetyatomilla on $SO(4)$-symmetria. Millaiset operaattorit vastaavat tätä symmetriaa? En tunne tätä vetyatomin symmetriaa, joten en osaa vastata kunnolla. Ryhmä $SO(4)$ koostuu matriiseista, jotka on sinänsä helppo muodostaa, mutta niiden fysikaalinen merkitys ei ole selvä ilman mitään lisätietoja.

Prujun sivulla 186 on annettu $\hat{J}$:n matriisien muodostamistavat. Tämä on tehty $\hat{J}_z$:n ominaiskannassa – miksi juuri tässä? Pyörimismäärää tarkasteltaessa huomattiin, että $\hat{J}^2$ kommutoi jokaisen $\hat{J}_i$:n kanssa, mutta nämä komponentit eivät kommutoi keskenään. Niinpä voidaan valita mikä tahansa komponentti $i$ siten, että operaattoreilla $\hat{J}^2$ ja $\hat{J}_i$ on yhteiset ominaistilat. Nämä ominaistilat eivät kuitenkaan ole enää yhteiset muiden komponenttien $\hat{J}_j,j \neq i$ kanssa. Tavallisesti valitaan $z$-komponentti tähän erikoisasemaan, mutta tällä valinnalla ei ole suurempaa väliä. Voisimme toimia myös $\hat{J}_x$:n ominaiskannassa, mutta silloin olisi kaikissa tuloksissa tehtävä muutokset $z \to x, x \to y, y \to z$. Kyseessä on siis vain koordinaatiston valinta.

Tarkoitetaanko tehtävän 2 energiatilalla energian ominaisarvoa? Kyllä. Kysymyksen "mitkä ovat systeemin mahdolliset energiatilat" voi lukea muotoon "mitkä ovat energian mahdolliset ominaisarvot".

Miten Stern-Gerlach-kokeen liikemäärän (suunnan ja suuruuden) "näkee" eksponenttifunktiosta? Vertaamalla tasoaaltoon. Liikemäärällä $\vec{p}$ kulkevan tasoaallon (normittamaton) aaltofunktio on $\psi(\vec{x})=e^{i\vec{x}\cdot\vec{p}/\hbar}$, joten jos $\vec{p}=p_ze_z$, niin $\psi(\vec{x})=e^{izp_z/\hbar}$. Saamamme aaltofunktion $z$-riippuvuus oli muotoa $e^{iaz}$ jollain vakiolla $a$, joten päättelimme, että on oltava $zp_z/\hbar=az$, joten $p_z=a\hbar$. (Tarkkaan ottaen tarkastelussa spinorin jokaisen komponentin pitäisi olla $\vec{x}$:stä riippuva funktio, sillä muuten koordinaatilla $z$ Hamiltonin operaattorissa (ja sen seurauksena eksponenteissa) ole kunnollista tulkintaa.)

Tehtävässä 1 ja prujun sivulla 195 on valittu alkutilaksi $\psi(0)=\begin{pmatrix}\cos(\alpha/2)\\\sin(\alpha/2)\end{pmatrix}$. Mistä tämä tulee? Tämä on mukava tapa parametrisoida spinori. Kuten tehtävässä huomasimme, tulee vastaan sekä kosinin että sinin kaksinkertaisen kulman kaava, joten lopputulokset näyttävät mukavammilta kun alkutilaan on laitettu puolikas kulma.

Mistä tietää, ovatko tilat kytkettyjä vai kytkemättömiä? Mitä se kertoo meille? Kytketty kanta kertoo koko systeemin havaittavista fysikaalisista ominaisuuksista, ja on siksi tärkeä. Toisaalta, kun yhdistetään kaksi hiukkasta yhdeksi järjestelmäksi, tulee tilanne luonnostaan esitettyä näiden yksittäisen hiukkasten ominaisuuksien avulla – eli kytkemättömässä kannassa.

Harmoniselle oskillaattorille saimme Diracin esityksessä nosto- ja laskuoeperaattoreita käyttäen johdettua huomattavasti Schrödingerin esitystä kivuttomammin samat tulokset. Onko sama mahdollista vedyn kohdalla? Onko tuloksia edes mahdollista johtaa Diracin formalismia käyttäen? Tämä voi hyvinkin olla mahdollista, mutten tiedä asiasta tarkemmin. Meillähän on jo tikapuuoperaattorit $\hat{J}_\pm$, joilla voi nostaa ja laskea kvanttilukua $m$, mutten tiedä, kuinka helposti vastaavan voisi tehdä myös kvanttiluvuille $n$ ja $l$. Laskuharjoituksen 6 kohdalla yllä näytin, että nosto- ja laskuoperaattorit voi määritellä mille hyvänsä systeemille. Eri asia on, tuleeko näistä operaattoreista kovin helppokäyttöisiä.

Miksi haluamme kytkeä kaksi pyörimismääräoperaattoria? Mitä hyödymme ominaistilojen ja -arvojen esittämisestä kytkemättömässä ja kytketyssä kannassa? Tämä vastaa fysikaalisesti pyörimismäärien laskemista yhteen. Aiheeseen palataan seuraavissa laskuharjoituksissa.

Mistä tietää, että spin-1-esityksen spinmatriisit ovat jäljettömiä? Tämän voi todeta käyttäen sivun 186 tuloksia spinmatriisin komponenteille. $x$- ja $y$-suuntien spinmatriisien diagonaalilla on pelkkää nollaa ja $\hat{S}_z$:n matriisielementit ovat $\hbar \delta_{mm'}$. Summaamalla diagonaalialkiot $\hbar s, \hbar (s-1), \dots, -\hbar s$ saa nollan. Tämä tulos pätee kaikille pyörimismäärämatriiseille, ei vain spinille. Tulos liittyy myös siihen, että pyörimismäärä generoi avaruuden kierrot. Kierto-operaattori on muotoa $e^{i\vec{\alpha}\cdot\hat{\vec{J}}/\hbar}$, kun kierretään koordinaatteja vektorin $\vec{\alpha}$ ympäri kulman $|\vec{\alpha}|$ verran (ks s. 177). Mutta kierto-operaattorin determinantin on oltava yksi ja toisaalta jokaiselle neliömatriisille $A$ pätee $det(e^A)=e^{tr(A)}$, joten pyörimismääräoperaattorin (tai siis sitä vastaavan matriisin) $\hat{\vec{J}}$ on syytä olla jäljetön.

Tehtävän 4 tilanteessa spin-1-hiukkasella näyttäisi olevan tuplasti pyörimismäärää. Tarkoittaako tämä, että elektroni pyörii itsensä ympäri tuplasti nopeammin spin-1-hiukkasena kuin spin-$\frac{1}{2}$-hiukkasena? Elektroni on aina spin-$\frac{1}{2}$-hiukkanen. Jos tulkitsemme spinin sisäiseksi pyörimismääräksi, spin-1-hiukkanen tosiaan pyörii itsensä ympäri vinhemmin kuin spin-$\frac{1}{2}$-hiukkanen.

Laskuharjoitus 9

Laboratoriotyö

Miten laitoksen ja tietokoneluokan ovet ovat auki kurssin päättymisen jälkeen? Labratyön tekeminen ei onnistu lukittujen ovien ulkopuolelta. En löytänyt laitoksen sivuilta tietoa tästä asiasta. Työselostuksen kirjoittaminen onnistuu kotoakin käsin, mutta numeeriset laskut on syytä tehdä laitoksella. Tähän on tarjolla ohjaustakin koneen äärellä, joten asiasta kannattaa keskustella (sähköpostitse) työn vastuuhenkilön kanssa.

Pyörimismäärän kvanttiluvut ja operaattorit

Mitä vastaavat kvanttiluvut $j_1$, $j_2$, $m$, $m_l$, $m_s$ jne.? Katso seuraava kohta.

Sekaannusta on aiheuttanut se, että ominaistilassa on sisällä kirjaimia $j_1$, $j_2$, $j$, $m$, $m_s$, $m_l$, $l$, $n$, $s$, $m_1$, $m_2$, $L$ ja $M$. Siis mikä nyt on suhteessa mihin ja mikä on sama asia? Merkinnät ovat kieltämättä sekavia, ja vastaan niiden selventämiseksi vähän pidemmin.

Tarkastellaan pyörimismääräoperaattoria $\hat{\vec{J}}$. Olemme muodostaneet tämän neliön $\hat{\vec{J}}^2=\sum_i\hat{J}_i^2$ ja valinneet yhden komponentin $\hat{J}_z$ tarkemman tarkastelun kohteiksi. (Näille löytyy yhteiset ominaistilat, kahta suuremmalle operaattorijoukolle se ei enää onnistuisi.) Pyörimismäärän neliötä vastaava kvanttiluku on $j$, joka vastaa pyörimismäärää (operaattorin $\hat{\vec{J}}^2$ ominaisarvoa) $\hbar^2j(j+1)$. Kvanttiluku $j$ on käytännössä usein vain lyhennysmerkintä tälle ominaisarvolle, ja sen avulla on helpompi käsitellä pyörimismäärien kytkentää ja monia muitakin laskuja. Kvanttiluku $m_j$ (merkintöjä on monia, mutta käytän nyt tätä ja selostan kohta lisää) liittyy vastaavalla tavalla operaattoriin $\hat{J}_z$: kvanttiluku $m_j$ vastaa tämän operaattorin ominaisarvoa $\hbar m_j$. Siispä tila $\ket{j,m_j}$ on näiden molempien operaattorien ominaistila edellä mainituilla ominaisarvoilla.

Vastaavasti menetellään muidenkin pyörimismääräoperaattoreiden osalta. Esimerkiksi spin-operaattori $\hat{\vec{S}}$ on sikäli samanlainen pyörimismääräoperaattori kuin muutkin, että se toteuttaa samanlaiset kommutaatiosäännöt ja siksi sen kanssa voidaan edetä samoin kuin yllä $\hat{\vec{J}}$:n kanssa. Nyt vastaavat kvanttiluvut ovat $s$ ja $m_s$. Ratapyörimismääräoperaattorille $\hat{\vec{L}}$ vastaavia kvanttilukuja merkitään $l$ ja $m_l$. Jos tutkimme kahta pyörimismäärää $\hat{\vec{J}}_1$ ja $\hat{\vec{J}}_2$, merkitsemme näitä vastaavia kvanttilukuja $j_1$ ja $m_{j_1}$ sekä $j_2$ ja $m_{j_2}$.

Erityisen hämäännyksen lähde monisteen merkinnöissä on seuraava: pyörimismääräoperaattoria $\hat{J}_z$ vastaavaa kvanttilukua merkitäänkin lyhyesti $m$ eikä $m_j$. Samoin lyhenevät $m_{j_1}\to m_1$ ja $m_{j_2}\to m_2$. Tämän takia merkinnät ovat hieman epäyhtenäiset ja siksi hämäävät, ellei tätä lyhennystä ole oivaltanut tapahtuneeksi.

Pyörimismäärien kytkennässä kytketään usein spin $\hat{\vec{S}}$ ja ratapyörimismäärä $\hat{\vec{L}}$ kokonaispyörimismääräksi $\hat{\vec{J}}=\hat{\vec{L}}+\hat{\vec{S}}$. Tällöin pitäisi edellä esittelemäni periaatteen mukaisesti kytketyssä kannassa (joka liittyy operaattoriin $\hat{\vec{J}}$ eli sen neliöön ja $z$-komponentiiin) käyttää kvanttilukuja $j$ ja $m$. Joskus kuitenkin halutaan (jostain kumman syystä) korostaa kytketyn kannan erilaisuutta kirjoittamalla kvanttiluvut isoilla kirjaimilla $J$ ja $M$. Siis $j=J$ ja $m=M=m_j$, mutta merkintä vaihtelee jatkuvasti.

Kvanttiluku $n$ liittyy vain aaltofunktion radiaaliosaan, eli sillä ei ole mitään tekemistä eri pyörimismäärien kanssa. Se on kvanttiluku, joka (enimmäkseen) määrää energian suuruuden. Esimerkiksi hiukkaselle laatikossa tai harmoniselle värähtelijälle käytimme vain tätä yhtä kvanttilukua, kun siihen ei liittynyt mitään pyörimistä.

Näiden kanssa menee helposti sekaisin: $J^2$, $J_z$, $S^2$, $S_z$, $\Sigma_z$ jne. Mikä näistä on varsinainen spin, kun kielenkäyttö on välillä niin sekavaa? Varsinaisesti spin-operaattori on $\hat{\vec{S}}$. Sitä tutkittaessa yllä kuvattuun tapaan käytetään operaattoreita $\hat{\vec{S}}^2$ ja $\hat{S}_z$ sekä näihin liittyviä kvanttilukuja $s$ ja $m_s$. Sanalla "spin" viitataan näihin kahteen operaattoriin. Kun sanotaan, että tutkitaan spin-$n$-hiukkasta (missä $n=0,\frac{1}{2},1,\dots$), tarkoitetaan, että $s=n$, eli puhutaan operaattorista $\hat{\vec{S}}^2$. Jos taas on jo kiinnitetty, mistä operaattorista puhutaan, tarkoitetaan spinillä monesti operaattoria $\hat{S}_z$, vaikka parempi olisikin puhua spinin $z$-komponentista. Jos siis sanotaan, että elektronin spin on $-\frac{1}{2}$, niin $m=-\frac{1}{2}$ (ja oletetaan tunnetuksi, että elektronille on aina $s=\frac{1}{2}$).

Kytketty ja kytkemätön kanta

Tutkitaan aluksi esimerkin vuoksi kahden hiukkasen yhdistämistä yhdeksi (vaikkapa protoni ja elektroni vetyatomiksi), ja unohdetaan ratapyörimismäärä. Olkoot näiden hiukkasten spin-operaattorit $\hat{\vec{S}}_1$ ja $\hat{\vec{S}}_2$, jolloin tarkastellaan siis käytännössä operaattoreita $\hat{\vec{S}}_1^2$, $\hat{\vec{S}}_{1z}$, $\hat{\vec{S}}_2^2$ ja $\hat{\vec{S}}_{2z}$, kuten kuvailin ylempänä. Näiden rakennuspalikoiden kannalta on siis luonnollista esittää yhdistämällä saadun hiukkasen tila näiden operaattoreiden avulla, eli kytkemättömässä kannassa tilana $\ket{s_1,s_2,m_{s_1},m_{s_2}}$. Jos yhdistettyä systeemiä tutkitaan kokeellisesti, tulee mitattua kuitenkin käytännössä koko systeemin spin $\hat{\vec{S}}=\hat{\vec{S}}_1+\hat{\vec{S}}_2$. Koetulosten ymmärtämiseksi ja ennustamiseksi on siis syytä siirtyä kantaan, joka liittyy tähän operaattoriin (eli käytännössä operaattoreihin $\hat{\vec{S}}^2$ ja $\hat{\vec{S}}_z$). Tämä kanta on juuri kytketty kanta.

Mitä hyötyä on kytketyistä tiloista verrattuna kytkemättömiin? Onko $N(n)$-funktio aina $n^2$ kun kyse on tilojen degeneraatiosta? Degeneraatio ei käyttäydy aina samoin. Spinittömän vetyatomin kaltaiselle yksinkertaiselle systeemille on $N(n)=n^2$, muttei tämä kaikille systeemeille päde. En osaa sanoa tarkemmin, kuinka laajasti se on voimassa. Yllä oleva kappale toivoakseni selvittää kytketyn ja kytkemättömän kannan fysikaalista luonnetta.

Miksi osa CG-kertoimista on negatiivisia? Vaikkei se todennäköisyyksiin vaikutakaan, onko sillä jotain merkitystä? CG-kertoimet muodostavat kannanvaihtomatriisin kytketkyn ja kytkemättömän kannan välille, ja tässä matriisissa sattuu olemaan sekä positiivisia että negatiivisia alkioita. (Näin on tarkkaan ottaen aina, kun kannanvaihto ei ole vain kannan permutaatio ja alkiot ovat reaaliset. Todista itse jos et usko.) On onnellinen sattuma (jos se nyt on sopiva sana), että alkiot (eli CG-kertoimet) voidaan valita reaalisiksi.

Kuinka yleistä pyörimismäärien kytkentä käytännössä on? Jonkinlainen pyörimismäärien kytkentä tulee usein vastaan hiukkas- ja etenkin ydinfysiikassa. Esimerkiksi ytimessä on usein hyvin monta nukleonia (protonia ja neutronia), ja näiden kaikkien spinien kytkeminen ytimen spiniksi on melkoisen työläs toimenpide.

Muuta (ja lisää pyörimismäärästä)

Miten spin näkyy tai vaikuttaa atomin ytimessä (protonit)? Protonien ja neutronien spinillä on merkitystä ytimen rakenteelle ja energiatiloille, mutten osaa tarkemmin sanoa, millaista. Tätä asiaa on parempi kysyä joltain ydinfyysikolta.

Päteekö Bohrin kaava myös muille atomeille kuin vedylle? Likimääräisesti kyllä, mutta arvio menee huonoksi atomeilla, joissa elektroneja on paljon. (Bohrin kaavahan johdettiin juuri yksielektroniselle atomille.)

Määrittelimme pyörimismäärään liittyvän tikapuuoperaattorin $\hat{J}_\pm$, jolle $\hat{J}_\pm^\dagger=\hat{J}_\mp$, ja joka ei siis ole hermiittinen. Sitten kuitenkin $\hat{L}$ ja $\hat{S}$ ovat hermiittisiä, joten myös $\hat{J}=\hat{L}+\hat{S}$:n pitäisi olla hermiittinen, vaikka $\hat{J}$:n ei pitänyt olla hermiittinen. Mikä menee väärin? Operaattori $\hat{\vec{J}}$ (eli $\hat{J}$, jos olemme laiskoja vektorimerkin kanssa, mutta onneksi emme tässä ole) on hermiittinen, ja sen kuvailuun käytetään yllä esittelemälläni tavalla sen komponenteista muodostettuja operaattoreita $\hat{J}^2$ ja $\hat{J}_z$. Lisäksi muiden komponenttien avulla voidaan muodostaa tikapuuoperaattorit $\hat{J}_\pm=\hat{J}_x \pm i\hat{J}_y$, jotka eivät ole hermiittisiä. Kyse on siis siitä, että $\hat{\vec{J}}$ ja $\hat{J}_\pm$ ovat eri operaattorit.

Voiko Gauntin kaavalla helposti osoittaa, että $\int Y^*_{1m}Y_{10}Y_{1m'}d\Omega=0$? Näin tuntuisi ainakin olevan kun $m=-1,0,1$. En tiedä, onnistuuko moinen helposti, mutta luultavasti onnistuu. Helpompaa voi olla käyttää palloharmonisten funktioiden määritelmää Legendren liittopolynomien ja eksponenttifunktion avulla (sivun 211 alareuna prujussa). Unohtaen normitusvakiot (tämä ei vaikuta siihen, onko integraali nolla vai ei) saadaan $$ \int Y^*_{1m}Y_{10}Y_{1m'}d\Omega = C \int_0^{2\pi} e^{i(m'-m)\phi} d\phi \int_{-1}^1 P_1^{|m|}(cos\theta) P_1^0(cos\theta) P_1^{|m'|}(cos\theta) d\cos\theta, $$ missä $C$ on jokin vakio (riippuu indekseistä) ja olemme hyödyntäneet tietoa siitä, että Legendren liittopolynomit ovat reaalisia funktioita. $\phi$-integraali antaa nollan ellei $m=m'$. Muuttujanvaihto $x=\cos\theta$ ja huomio $P_1^0(x)=x$ johtavat tutkimaan integraalia $$ \int_{-1}^1 x P_1^{|m|}(x) P_1^{|m|}(x) dx. $$ Jokainen Legendren liittopolynomi on joko parillinen tai pariton funktio, joten sellaisen neliönä $(P_1^{|m|}(x))^2$ on parillinen. Siispä saamamme integraali on nolla, sillä integroimme paritonta funktiota välin $[-1,1]$ yli. Väite on siis ainakin tosi, ja vielä yleisemminkin saman laskun perusteella $\int Y^*_{lm}Y_{10}Y_{lm'}d\Omega=0$ kaikille $l$, $m$ ja $m'$.

Laskuharjoitus 10

Tehtävistä

Tehtävä 1: Kun potentiaali on $V(x)=\alpha\delta(x-a/2)$, millä perusteilla saa ottaa $\bra{x'}\hat{V}\ket{x}=\alpha\bra{x'}\delta(x-a/2)\ket{x}=\alpha\delta(x-a/2)\delta(x-x')$? Toki potentiaali antaa jotain nollasta poikkeavaa vain kun $x=a/2$, mutta jäi silti vähän epäselväksi. Kysymyksessä esitetty yhtälö on aivan oikein. Yleensäkin, jos potentiaali tunnetaan $x$-esityksen funktiona $V(x)$, niin $\bra{x'}\hat{V}\ket{x}=V(x)\delta(x-x')=V(x')\delta(x-x')$. Deltafunktio ei eroa mitenkään tämän ominaisuuden osalta. (Muutenkin tällöin on $\hat{V}\ket{x}=V(x)\ket{x}$.) Voileipää $\bra{x'}\hat{V}\ket{x}$ ei välttämättä tarvitse tehtävässä edes muodostaa, jos vain laskee suoraan $\bra{\phi}\hat{V}\ket{\psi}=\int_0^a\phi^*(x)V(x)\psi(x)dx$. (Tähän integraaliin tosin päästään varsinaisesti kysytyn voileivän avulla, mutta sitä ei tarvitse välttämättä tehdä kun kerran on hyvin tunnettua, miltä sisätulo $x$-esityksessä näyttää.)

Tehtävä 4: Häiriön vuoksi ensimmäinen viritystila jakautuu kolmeen osaan. Yksi uusista energioista voidaan identifioida tilan 112 kanssa, mutta miten muut kaksi vastaavat tiloja 211 ja 121? Yksi matriisin $\mathbb{W}$ ominaistila on suoraan tila 112. Loput kaksi eivät ole 211 ja 121, vaan lineaarikombinaatio näistä – ne eivät siis suoraan vastaa sellaista tilannetta, että aaltofunktio olisi vain $\Psi_{211}(\vec{x})$ tai $\Psi_{121}(\vec{x})$.

Häiriöteoria

Monistetta kertaillessa tuli vastaan sivulla 226 $w(\rho)$ ja vähän myöhemmin yrite $w(\rho)=\sum_{k=0}^\infty a_k \rho^{k+s}$. Onko tuolla jokin nimi tai syvällisempi merkitys? Kirjaimella 'W' on monta muutakin käyttöä (esim. häiriöteorian $\mathbb{W}_n$); onko niillä tekemistä keskenään? Sivulla 226 ja sen jälkeen vastaan tuleva $w(\rho)$ on osa aaltofunktion ratkaisuyrityksiämme pallosymmetrisen potentiaalin tapauksessa. Sille kirjoitettu sarjamuotoinen yrite on tavallinen tapa yrittää ratkaista differentiaaliyhtälö, mutten muista kuulleeni sille mitään erityistä nimeä. Häiriöteorian $\mathbb{W}$ ei liity tähän funktioon mitenkään. Tällä kurssilla kirjain 'W' eri muodoisssaan on toiminut monenlaisina apumerkintöinä, eivätkä nämä liity toisiinsa.

Mikä on 2. kertaluvun häiriöteoriassa esiintyvä matriisi $\mathbb{W}_n$? Lyhyesti sanoen se on häiriöpotentiaali esitettynä energiaa $E_n$ vastaavan ominaisavaruuden jossain kannassa (ja siis rajoitettuna siihen, sillä yleensä ko. ominaisavaruus ei ole koko tila-avaruus). Esimerkki valaissee tilannetta: Olkoon häiriötön Hamiltonin operaattori $$\mathbb{H}_0=\begin{pmatrix}E_1&0&0&0&0\\0&E_2&0&0&0\\0&0&E_2&0&0\\0&0&0&E_3&0\\0&0&0&0&E_3\end{pmatrix}$$ sekä häiriöpotentiaali $$\mathbb{V}=\begin{pmatrix}V_{11}&V_{12}&V_{13}&V_{14}&V_{15}\\V_{21}&\ddots&&&\vdots\\\vdots&&\ddots&&\vdots\\\vdots&&&\ddots&\vdots\\V_{51}&\cdots&\cdots&\cdots&V_{55}\end{pmatrix}$$. Energiat $E_2$ ja $E_3$ ovat degeneroituneet, joten niille täytyy konstruioida matriisit $\mathbb{W}_2$ ja $\mathbb{W}_3$. $E_2$:sta vastaavat ominaistilat ovat $\ket{2}$ ja $\ket{3}$, joten $$ \mathbb{W}_2 =\begin{pmatrix}\bra{2}\hat{V}\ket{2}&\bra{2}\hat{V}\ket{3}\\\bra{3}\hat{V}\ket{2}&\bra{3}\hat{V}\ket{3}\end{pmatrix} =\begin{pmatrix}V_{22}&V_{23}\\V_{32}&V_{33}\end{pmatrix}. $$ Nyt Hamiltonin matriisi on diagonaalinen (näin on syytä olla ennen kuin häiriöteorian laskuihin ryhtyy), joten tämä $\mathbb{W}_2$ on matriisin $\mathbb{V}$ alimatriisi. Juuri tämän matriisin $\mathbb{W}_2$ ominaisarvot antavat ensimmäisen kertaluvun korjaukset energiaan $E_2$. Energian $E_3$ kohdalla menetellään vastaavasti.

Voiko ominaisenergialla olla korkeamman asteen energiakorjaus, vaikka matalampaa ei olisi? Voi hyvinkin. Tällöin $E_n=\sum_{k=0}g^kE_n^{(k)}=E_n^{(0)}+g^2E_n^{(2)}+\dots$. Aivan vastaavalla tavalla funktion derivaatta voi olla nolla, vaikka sen toinen derivaatta ei nolla olisikaan.

Degeneroituneen tapauksen häiriöteoria kaipaa vielä selvennystä. Erityisesti, miksi energiakorjaukset saadaan suoraan $\mathbb{W}_n$-matriisin ominaisarvoista? En osaa esittää asiaa selvemmin kuin sivujen 270–273 tarkastelussa on tehty, mutta esitän muutamia huomautksia siinä toivossa, että ne selventävät asiaa. Sivulla 273 esitetty menetelmä ensimmäisen kertaluvun energiakorjausten saamiseksi ($\mathbb{W}_n$:n ominaisarvot) toimii myös degeneroitumattomassa tapauksessa. Tällöin $\mathbb{W}_n$ on $1\times1$-matriisi, jonka ainoa ominaisarvo on sen ainoa alkio $\bra{\phi_{n1}}\hat{V}\ket{\phi_{n1}}$ eli täsmälleen degeneroitumattoman häiriöteorian antama tulos. Tulosta ei degeneroitumattomassa tapauksessa tarvitse muotoilla ominaisarvojen avulla, kun tilanne on niin yksinkertainen.

Hieman teknisempi selitys: Jokaista häiriöttömän systeemin energian ominaisarvoa $E_n^{(0)}$ vastaa ominaisavaruus $A_n=\{\ket{\psi}\in\H:\hat{H}\ket{\psi}=E_n^{(0)}\ket{\psi}\}\subset\H$, jonka kannan muodostavat vektorit $\ket{\phi_{n1}},\dots,\ket{\phi_{nN(n)}}$. Energiakorjaukset ovat häiriön $\hat{V}$ mahdolliset (mittaus)arvot tässä avaruudessa (eli mahdolliset mittausarvot sillä ehdolla, että häiriötön energia on $E_n^{(0)}$). Tässä avaruudessa $A_n$ saadaan kantaa $\{\ket{\phi_{n1}},\dots,\ket{\phi_{nN(n)}}\}$ käyttäen operaattorille $\hat{V}$ matriisiesitys; tämä matriisi on täsmälleen $\mathbb{W}_n$. Mahdolliset mittausarvot ovat tunnetusti operaattoria vastaavan matriisin ominaisarvot, jotka eivät (onneksi) riipu kannan valinnasta.

Variaatioperiaate

Variaatioperiaatteella laskiessa etsimme energian ääriarvoja. Ovatko ne aina minimejä, vai voisiko kyseeseen tulle myös maksimi? Kyseeseen voisi tosiaankin tulla myös maksimi, joten on syytä varmistaa, että löydetty ääriarvo on todella minimi. Näin on kurssillamme aina käynyt, mutta mitenkään itsestäänselvää se ei ole. Jos energialle löytyy pelkkä maksimi, on laskuissa melko varmasti virhe.

Yleinen huomautus: Matematiikan laitoksella osittaisdifferentiaaliyhtälöiden kursseilla törmää siihen, että monesti osittaisdifferentiaaliyhtälön ratkaiseminen on yhtäpitävää jonkinlaisen funktionaalin minimoimisen kanssa. Jos sovellamme variaatiolaskentaa kvanttimekaniikan energiafunktionaaliin $$E[\psi]=\frac{\int_{-\infty}^\infty(\frac{-\hbar^2}{2m}\psi^*(x)\psi''(x)+\psi^*(x)V(x)\psi(x))dx}{\int_{-\infty}^\infty\psi^*(x)\psi(x)dx}$$ (joka sopii myös normittamattomalle aaltofunktiolle, koska energiassa on normitus), päädytään Schrödingerin yhtälöön. (Tarkemmin: Jos funktio $\psi$ minimoi funktionaalin $E[\cdot]$ ja $E[\psi]=E_0$, niin $\hat{H}\psi=E_0\psi$ ja $E_0 \leq E[\eta]$ kaikilla $\eta\in C_0^\infty(\R,\C)$. Tämän toteaminen on hyvää harjoitusta variaatiolaskennassa.)

Yleistä

Mitä itse asiassa ovat antisymmetriset hiukkaset? Yritän valaista symmetrisiä ja antisymmetrisiä hiukkasia hieman. Olkoot $\ket{\psi}$ ja $\ket{\phi}$ yksihiukkastiloja. Yhdistetään nyt kaksi identtistä hiukkasta yhdeksi systeemiksi, jolloin tila voi olla esimerkiksi $\ket{\psi,\phi}$, jolloin ensimmäinen hiukkanen on tilassa $\ket{\psi}$ ja toinen tilassa $\ket{\phi}$. Tällainen yhdistetyn systeemin tila voidaan muodostaa lähtien mistä hyvänsä yhden hiukkasen tiloista $\ket{\psi}$ ja $\ket{\phi}$. Hiukkasten identtisyydestä seuraa, että kaksihiukkastiloja $\ket{\psi,\phi}$ ja $\ket{\phi,\psi}$ ei voi erottaa toisistaan, eli ne antavat saman todennäköisyyden. Tämä onnistuu vain, jos $\ket{\psi,\phi}=\pm\ket{\phi,\psi}$, ja lisäksi tämän etumerkin valinta ei saa riippua tiloista $\ket{\psi}$ ja $\ket{\phi}$. Tästä seuraa, että yhdistetty systeemi on joko symmetrinen (aina ylempi eli plus-merkki) tai antisymmetrinen (aina miinus-merkki). Sama pätee myös useamman kuin kahden hiukkasen yhdistämiseen. Se, täytyykö valita yhdistetylle systeemille symmetrinen vai antisymmetrinen luonne (mikään sekoitus näistä ei käy), riippuu yksihiukkassysteemin spinistä: kokonaislukuspin ($s=1,2,3,\dots$) aiheuttaa symmetrisen ja puolilukuspin ($s=\frac{1}{2},\frac{3}{2},\frac{5}{2},\dots$) antisymmetrisen tilanteen. Huolellisempi perustelu olisi kovin työläs, joten en lähde sitä esittämään tässä. Antisymmetrisille hiukkasille siis kahden hiukkasen vaihto tuottaa aina tilalle merkin vaihdon, ja tästä seuraavaa ilmiömaailmaa on hieman esitelty prujussa.

Riittääkö saatu heliumin perustilan energian tarkkuus (2 %) oikeissa fysiikan sovelluksissa? Tämä riippuu varmastikin paljon sovelluksen luonteesta. Saatu tarkkuus riittää karkeana arviona joihinkin tilanteisiin, mutta on varmasti toisaalta riittämätön toisissa tilanteissa. En osaa eritellä tarkemmin, mutta kokeellisen fysiikan tarkkuus vaihtelee suuresti – kymmenistä prosenteista miljardisosiin.

Mitä tekee vetyatomin tapauksen $Z$-parametri helium-atomin laskuissa? Parametri $Z$ (oikeastaan $+Ze$) ilmoittaa ytimen efektiivisen varauksen eli likimain protonien lukumäärän, ja vedylle siis $Z\approx1$ ja heliumille $Z\approx2$. Vedylle tulos on tarkka, mutta heliumin tapauksessa toinen elektroni näkee ytimen ja toisen elektronin ikään kuin yhtenä kokonaisuutena, jolloin toinen elektroni varjostaa ytimen varausta. Siksi saamme tuloksen $Z=27/16<2$ sivulla 307.

Elämän jatkuminen kurssin jälkeen

Mitkä kurssin asiat ovat kvanttimekaniikan ja muiden fysiikan kurssien kannalta oleellisia, ulkoa muistettavia ja osattavia? Osaamisen tarve riippuu tulevien kurssien valinnasta, mutta tavallisesti kvanttimekaniikan perusymmärryksen on syytä olla paikallaan. On usein tarpeellista ymmärtää, mikä on operaattori ja sen yhteys observaabeleihin, mitä ovat tilavektorit sekä mikä on jonkin operaattorin ominaistila ja ominaiskanta. Ydin- ja hiukkasfysiikassa on tarvetta pyörimismäärille ja tavallisimpien operaattoreiden (paikka, liikemäärä, pyörimismäärä, energia, spin) rutiininomaiselle käsittelylle. Erityisen tärkeää on laskurutiini: tottuminen (kommutoimattomiin) operaattoreihin, integroimiseen, Fourier-muunnoksiin, ominaisarvojen etsintään, moniulotteisiin derivaattoihin ja muihin tälläkin kurssilla vastaan tulleisiin kapistuksiin. Hyvä laskurutiini auttaa selvittämään matemaattiset ongelmat siten, että ajatuksia on mahdollista keskittää fysiikkaan eli siihen mitä monenlaiset matemaattiset härvelit yrittävät luonnosta kuvata.

Kandidaatin tutkielmasta

Aineopintokurssien pohjalta fysiikan pääaineopiskelijoiden täytyy tehdä kandidaatin tutkielma. Ohjeita kirjoittamiseen ja alkuun pääsemiseen löytyy laitoksen ohjeesta. Jos haluat tehdä työsi hiukkas-, ydin- tai nanofysiikasta, kvanttimekaniikka on aineopintokursseista työn kannalta keskeisin. Asiasta voi mennä juttelemaan kenen hyvänsä tutkijan kanssa, ja neuvoa voi kysyä myös laitoksen opintoneuvojilta (Juha Merikoski ja Soili Leskinen).