HTML als Seitenbeschreibungssprache

Der Browser liest die Seiten des WWW in HTML und stellt sie dar

HTML ist eine Abkürzung für Hypetext Markup Language. Eine Beschreibungssprache mit Hypertext-Funktionen. Die «Sprache» HTML ist ein internationaler Standard für die Publikation von Informationen im World Wide Web.

HTML ist somit nicht proprietär, das heisst HTML ist unabhängig von Produkt-Herstellern und Systemplattformen. HTML besteht aus einem umfangreichen Satz von Befehlselementen, sogenannten «Tags». Diese HTML-Tags haben grundsätzlich stets einen Anfang bzw. eine Einleitung und ein Ende bzw. einen Abschluss. Ein Beispiel:

<html>
<body>
<h1>Überschrift 1</h1>
<p>Um Text als Überschrift 1 hervorzuheben verwendet man zum Beispiel das H1-Tag.</p>
</body>
</html>

Ein wichtiger Punkt in den grundlegenden Konzepten von HTML ist ein standardisiertes, strukturiertes Dateiformat für die Darstellung von Internet-Inhalten auf allen Plattformen. Weiterhin wurde bei der Entwicklung von HTML der Grundsatz gefasst: Die Beschreibungssprache soll den schnellen Zugriff auf Informationen von allen Informatik-Plattformen ermöglichen. Die Wurzeln von HTML liegen bei SGML - der Standard Generalised Mark-up Language.

Tim Berners-Lee
Tim Berners-Lee, der Entwickler der «Sprache» HTML

Der Ingenieur Tim Berners-Lee arbeitete nach seinem Abschluss an der Oxford University einige Jahre im Telekommunikationsbereich, bevor er zum CERN in Genf wechselte.

Tim Berners-Lee legte den Grundstein für das heutige World Wide Web Ende 1990, während seiner Dokumentations-Arbeit für ein CERN-Projekt (Europäisches Zentrum für Kernforschung, das Akronym «CERN» stammt von der früheren französischen Bezeichnung Conseil Europeen pour la Recherche Nucleaire). Somit ist HTML (und damit das WWW) eigentlich fast eine Schweizer Entwicklung.

Den ersten WWW-Client schrieb Tim Berners-Lee für NeXTStep, ein Betriebssystem der NeXT-Plattform. Das Betriebssystem ist heute vom Markt verschwunden, NeXTStep war eine Entwicklung des Apple-Mitbegründers Steve Jobs, die NeXT-Architektur hat sich aber (leider) nicht durchsetzen können. Tim definierte die Syntax von HTML 1.0, führte den Begriff der URL ein und entwickelte zusammen mit anderen Forschern HTTP als Übertragungsprotokoll zwischen Server und Client.

In der Übersichtstabelle finden Sie einen Link mit dem Namen «SelfHTML», dies ist die beste HTML-Dokumentation die ich kenne. Erstellt wurde sie von Stefan Münz, sie ist sehr verständlich geschrieben, äusserst umfangreich und zudem kostenlos über das WWW jederzeit abrufbar.

HTML-Standards
Die Sprache HTML wurde evolutionär in mehreren Versionen bis zum heutigen Standard entwickelt.

HTML 0.0
Die Ur-Version (03. November 1992) von HTML beinhaltet lediglich die Verarbeitung von Überschriften, Listen, Aufzählungen und Anker bzw. Textmarken. Es können noch keine Bilder in die HTML-Dokumente integriert werden. Als Browser wird häufig die Software Lynx eingesetzt, ein textorientierte Applikation, die auch unter DOS läuft.

HTML 1.0
Mit der Version 1.0 wird die Bild/Text-Integration möglich, das CERN gibt diese Version am 30. April 1993 frei. Ebenfalls werden Hervorhebungen wie Fettdruck, Kursivschrift usw. unterstützt. Alle Browser in einer grafischen Oberfläche (GUI) müssen den HTML 1.0-Standard erfüllen.

HTML 2.0
Durch die Einführung der Formulartechnik erleben die ersten Gästebücher und Meinungs-Umfragebogen einen wahren Boom ... viele wollen alles wissen, die Frage ist nur, wer antwortet darauf? Der Standard wird im November 1995 verabschiedet.

HTML 3.0 / 3.2
Eine offizielle Version 3.0 gab es eigentlich nicht, Netscape führte mit der Version 3 seiner Browser soviel neue Techniken ein, dass das W3C kurzerhand einen neue Spezifikation HTML 3.2 definierte. Wichtige Neuerungen:
  • Tabellendarstellungen mit Spalten und Zeilen
  • Kombinationsmöglichkeiten von Schrift-Auszeichnungen wie kursiv und fett zu fettkursiv
  • Zentrierte und rechtsbündige Text-Ausrichtung
  • Unterstützung von Client-Image-Maps. Das sind Grafiken mit hinterlegten Hyperlinks
  • Einbettung von Java-Applets in HTML-Dokumente

Die Internet Engineering Taskforce (IETF) verabschiedete den Standard HTML 3.2 am 14. Januar 1997.

HTML 4.0
Dynamisches HTML wird ab 18. Dezember 1997 offiziell unterstützt. DHTML ist eine Kombination von HTML und JavaScript. Die CSS 1 und 2-Normen werden vom W3C offiziell in den HTML-Standard integriert, dabei werden weitgehend die Konzepte von Microsoft und dem Internet Explorer 4.x befolgt.

Netscape unterstützt die CSS-Standards in allen Versionen 4.x nur marginal, was für Web-Designer einen deutlichen Mehraufwand bedeutete (Crossbrowser-Entwicklung). Netscape verliert - auch in Unternehmen - deutlich an Kredit und wird zunehmend durch den Internet Explorer verdrängt.

XHTML 1.0
Die Kombination von XML 1.0 und HTML 4.0 wird am 26. Januar 2000 im Standard XHTML 1.0 verabschiedet. Eine wesentliche Neuerung zu allen bisherigen HTML-Standards besteht darin, dass jedes HTML-Tag (Befehl) korrekt abgeschlossen werden muss, zudem ist beim Abschluss die Reihenfolge zu beachten:

<hr></hr>
<img src="beispiel.jpg"></img>
<hr/>

Diese Regelung gilt auch für Tags die bis und mit HTML 4.0 nicht geschlossen werden mussten (Beispiel:<hr>). Alternativ kann ein HTML-Tag mit einem abschliessenden Schrägstrich geschlossen werden.

Die folgenden Versionen von XHTML bzw. HTML werden nicht mehr auf SGML sondern auf Basis von XML entwickelt.

Was ist SGML?
Die Sprache HTML basiert bis und mit Version 4.0 auf der SGML-Konzeption. SGML ist eine standardisierte Beschreibungssprache (Markup Language) für die Darstellung von Dokumenten auf Computern nach ISO (International Standards Organization)-Norm. SGML ist eine Kurzform von «Standard Generalised Mark-up Language», die Grundstrukturen von SGML wurden von IBM unter dem Namen GML entwickelt, die ISO erweiterte die Definitionen und nennte den Standard nun SGML.

Ein SGML-Dokument enthält keine Informationen über die Darstellung auf dem Bildschirm oder dem Papier. Ein Präsentationsprogramm («Browser») muss die Darstellung auf Papier oder Bildschirm übernehmen. Diese Unabhängigkeit ist für den Austausch von Dokumenten zwischen Informationsplattformen sehr wertvoll. Sie ermöglicht verschiedene Sichten eines Dokuments, die gezielte Suche nach Informationen usw. Für viele Autoren ist es dennoch sehr wichtig Informationen auch mit Formatierungen zur Verfügung zu stellen, wird diese Arbeit korrekt nach den SGML-Normen ausgeführt, so kann Textgliederung als sehr wichtiger Teil der Texterstellung (Informationsbereitstellung) betrachtet werden. 

Syntax von SGML
Die Syntax (Standardisierung von Wort- oder Befehlsfolgen) von SGML ist für die Bedürfnisse, für die SGML benutzt wird, genügend. Techniker bezeichnen die Sprache wegen ihrer Nüchternheit als geradezu wunderschön, da kein Gestaltungselement die Informationen beeinflusst. Die Sprache SGML hat Ihre Wurzlen eindeutig bei den textorientierten Systemen, im Vergleich zum aktuellen HTML-Standard wirken SGML-Dokumente fast ein wenig plump.


Umlaute und Sonderzeichen
Damit die Umlaute und Sonderzeichen in HTML-Texten auf allen Plattformen (Mac, UNIX, Windows, Windows CE bzw. PocketPC, Palm usw.) richtig dargestellt werden, sollten im HTML-Code anstelle der normalen Umlaute die folgenden Codierungen verwendet werden:

Umlaute und Sonderzeichen in HTML-Codierung

Benutzerfreundliche HTML-Editoren oder Content Management Systeme nehmen die Übersetzung von Sonderzeichen und Umlauten in die korrekten HTML-Codes automatisch vor. Damit muss sich der Benutzer nicht um die technischen Übersetzungen kümmern.