testataan jossain kentässä olevaa tekstiä...
testataan jossain kentässä olevaa tekstiä...
kappale

loppu

kappale

pelkkää tekstiä & satunnainen ja-merkki entitynä
pelkkää tekstiä & satunnainen ja-merkki...
ongelmatapaus: a
helpompi tilanne? a < b > />
selaimen sekoittava ongelmatapaus: a loppu
selaimen sekoittava ongelmatapaus: a loppu

ei toimi...

ei toimi...

XML-dokumenttien käsittelystä Javalla

Siistiminen ja korjaus

HtmlFixer.java siistii ja korjaa syötteenä annetun HTML-fragmentin. Korjatun HTML-fragmentin ympärille lisätään <div>-elementti. Jos siistiminen ei onnistu, ohjelma ei palauta mitään.

Ohjelma käyttää siistimiseen JTidy-ohjelmaa. Ulostulo on useimmissa tilanteissa validia HTML 1.0 Strict -koodia, mutta JTidy ei takaa tuloksen validiutta. Siistimiseen menevä aika on pienillä (<100

Validointi

Validator.java demonstroi HTML-dokumentin osan tai minkä tahansa XML-dokumentin validointia. Validointi on toteutettu SAX-parserina, joka ei käsittele koodia mitenkään, mutta heittää poikkeuksen ensimmäisestä löytämästään virheestä.

Koodi perustuu pääosin Sunin sivuilla olevaan tutoriaaliin XML:n käsittelystä Javalla: Working with XML.

Yksinkertaiset virheet saa poistettua koodista esikäsittelemällä tiedotHTML Tidy -ohjelmalla. Käyttöesimerkki: (linux, julkaisupäivä 1.2.2002)

  1. Kopioi työhakemistoon config.txt.
  2. Anna komento tidy -config config.txt lähtötiedosto > tulostiedosto .

Esimerkin asetustiedostolla Tidy muuntaa lähtötiedoston striktiin XHTML 1.0 -muotoon.

Miika Nurminen
22.10.2003

MarkUp Validation Service

Jump To: [Results]

This Page Is Valid XHTML 1.0 Strict!

Tip Of The Day:
Use <h1> for top-level heading

The uploaded file was checked and found to be valid XHTML 1.0 Strict. This means that the resource in question identified itself as “XHTML 1.0 Strict” and that we successfully performed a formal validation using an SGML or XML Parser (depending on the markup language used).

Valid XHTML 1.0! To show your readers that you have taken the care to create an interoperable Web page, you may display this icon on any page that validates. Here is the HTML you could use to add this icon to your Web page:

    <p>      <a href="http://validator.w3.org/check/referer"><img          src="http://www.w3.org/Icons/valid-xhtml10"          alt="Valid XHTML 1.0!" height="31" width="88" /></a>    </p>   

If you like, you can download a copy of this image (in PNG or GIF format) to keep in your local web directory, and change the HTML fragment above to reference your local image rather than the one on this server.

Valid XHTML 1.0! The W3C Validator Team
Date: 2002/11/30 23:18:00