HTML Meta Tags

Die HTML Metatags sind all die teils nützlichen und oft lustigen Angaben, die von Webseiten-Erstellern in den Kopfbereich ihrer HTML-Dokumente gedonnert werden. Nützlich sind nur eine handvoll dieser Meta-Angaben. Im Web real existieren jedoch hunderte verschiedener Meta-Tags, teilweise sehr phantasievolle Gebilde, die allerdings ohne jeden praktischen Nutzen sind.

Nützliche HTML Meta-Angaben

Die Liste der wirklich sinnvollen Meta-Angaben ist eher kurz und leicht zu merken.

<meta http-equiv="content-type" content="text/html; charset=iso-8859-1">

Dies ist die am häufigsten gebrauchte Angabe in den Meta-Daten von Webseiten. Die teil dem Browser den Benutzers und auch den Suchmaschinen-Robots mit, um welchen Zeichensatz es sich handelt. In Westeuropa ist der ISO-8859-1 Zeichensatz der übliche, zunehmend wird jedoch auch UTF-8 genutzt, der universell einsetzbar ist. Dies hängt jedoch auch vom verwendeten Texteditor ab. So speichert der gEdit-Editor (Ubuntu Linux und andere) seine Texte standardmäßig in UTF-8, während Editoren unter Windows oft noch in ISO-8859-1 speichern.

<meta http-equiv="content-language" content="de"> <meta name="language" content="de">

Gibt an, in welcher Sprache eine Webseite hauptsächlich geschrieben ist. Es schadet nicht, diesen Wert nicht anzugeben, allerdings gibt es einige wenige Programme, die diese Angabe auswerten.

<meta name="description" content="Eine Webseite über Webseiten und das machen von Webseiten.">

Die "description"-Angabe wird genutzt, um den Inhalt einer Webseite zusammenzufassen. Diese Meta-Angabe ist die am dritt-häufigsten benutzte im Web, besonders deshalb, weil sie von Suchmaschinen wie Google ausgewertet wird. Die Meta-Beschreibung wird oft in den Suchergebnis-Seiten angezeigt, daher sollte sie das Interesse eines Nutzers wecken, die eigene Webseite zu besuchen.

<meta http-equiv="refresh" content="3;url=http://www.example.com/">

Diese Angabe leitet den Browser zu einer anderen Adresse um. Diese Angabe kann sinnvoll sein, um das vorhandene Dokument erneut zu laden, oder um zu einer aktuelleren Version eines veralteten Dokuments weiterzuleiten. Dies ist jedoch eine funktionale Angabe und dient nicht der Information über ein Dokument.

<meta http-equiv="Set-Cookie" content="cookievalue=xxx;expires=Wednesday, 21-Oct-98 16:14:21 GMT; path=/">

Dies ist ebenfalls eine funktionale Angabe, durch die von der jeweiligen Webseite ein Cookie im Browser des Nutzers gesetzt werden kann.

<meta name="robots" content="nofollow,noindex,noarchive"> <meta name="googlebot" content="nofollow,noindex,noarchive,noodp,nosnippet"> <meta name="msnbot" content="nofollow,noindex,noarchive">

Mit dieser Meta-Angabe kann das Verhalten von Robots / Crawlern gesteuert werden, also Programmen, die automatisiert das Web durchsuchen und Dokumente herunterladen und auswerten. Übliche Angaben sind:

  • nofollow Suchmaschinen-Robots sollen Links auf der Webseite nicht folgen.
  • noindex Das Dokument darf durch Suchmaschinen-Robots heruntergeladen werden, der Inhalt des Dokuments darf jedoch nicht in den Suchergebnissen angezeigt werden. Die Adresse (URL) des Dokuments darf jedoch angezeigt werden.
  • noarchive Das Dokument darf nicht durch Suchmaschinen oder Web-Archive langfristig gespeichert und zugänglich gemacht werden. Hiermit sind besonders der Google-Cache und das Web-Archive gemeint.
  • noodp In den Suchergebnissen von Google wird gelegentlich die Beschreibung einer Webseite aus dem Open Directory Project verwendet. Durch die Angabe "noodp" wird Google untersagt, diese Beschreibung in den Suchergebnissen anzuzeigen.
  • nosnippet Dies verhindert, dass Google in den Suchergebnissen einen Ausschnitt aus dem Test der Seite oder die "description"-Angabe der Meta-Daten verwendet. Der Titel des HTML-Dokuments wird jedoch angezeigt.

<meta http-equiv="imagetoolbar" content="no">

Im Microsoft Internet Explorer wird seit der Version 5 über Bildern automatisch eine Werkzeugleiste eingeblendet, wenn der Mauszeiger über das Bild fährt. Um die Anzeige dieser Werkzeugleisten auf den eigenen Webseiten zu verhindern, hat Microsoft diesen Meta-Tag erfunden.

<meta name="MSSmartTagsPreventParsing" content="true">

Noch ein Meta-Tag, um eine Microsoft-Erfindung wieder los zu werden. Mit den so genannten Smart Tags wollte Microsoft vor einige Jahren alle Arten von Dokumenten automatisch mit Links zu eigenen Informationen versehen, was zu einer großen Protestwelle im Netz führte. Es wurde dann nur eine abgespeckte Version der "Smart Tags" eingeführt. Um zu verhindern, dass Software von Microsoft automatisch zusätzliche Links zu Microsoft-Webseiten in die eigen HTML-Dokumente einschleust, kann man diese Meta-Angabe angeben.

Unnütze Meta-Angaben auf Webseiten

<meta name="keywords" content="Webseite, Webseiten, Website">

Die zweit-populärste Meta-Angabe im Web ist auch gleichzeitig die populärste unnütze Angabe. Sie wird inzwischen weder von Google noch von anderen Suchmaschinen ausgewertet, und auch Browser und andere Client-Programme nutzen diese Angabe nicht. Der einzige Grund, diese Angabe in HTML-Dokumente aufzunehmen wäre eine Nutzung von Schlagworten in einer internen Suchmaschine (innerhalb einer Firma oder Organisation). Dies trifft jedoch für die allermeisten Dokumente im Web nicht zu.

<meta http-equiv="expires" content="Tue, 01 Jan 1980 1:00:00 GMT"> <meta http-equiv="pragma" content="no-cache">

Beide Angaben haben wenig praktischen Nutzen und stellen Versuche dar, Webbrowser und Suchmaschinen dazu zubringen, das HTML-Dokument erneut zu laden, statt es aus dem Zwischenspeicher zu holen. Solche Steuerungsangaben sollten eigentlich durch den Webserver in einem HTTP-Header übertragen werden, und nicht durch das HTML-Dokument selbst.

<meta http-equiv="content-style-type" content="css">

Eigentlich eine sinnvolle Angabe um die Standard-Sprache für Stylesheets festzulegen, die im jeweilgen HTML-Dokument verwendung findet. Da es jedoch ohnehin nur eine einzige Sprache für Stylesheet gibt, nämlich CSS, ist diese Angabe überflüssig.

<meta name="copyright" content="Max Mustermann"> <meta name="author" content="Max Mustermann"> <meta name="designer" content="Max Mustermann">

Eigentlich eine gute Idee, im Header einer HTML-Datei Angaben über diese Dinge unterzubringen. Leider gibt es kein Programm und keine Suchmaschine, die diese Daten auswertet oder in irgendeiner Form nutzen würde.

<meta name="revisit-after" content="2 days">

In den Anfangszeiten des sollte hierdurch den Suchmaschinen mitgeteilt werden, wann ein Dokument erneut auf aktuelle Inhalte überprüft werden sollte. Diese Angaben werden seit Jahren von allen Suchmaschinen ignoriert und sind nutzlos. Google & Co. speichern intern, wie oft ein Dokument in der Vergangenheit aktualisiert wurde und errechnen anhand dieser Werte, wann es wieder für eine erneute Aktualisierung gelesen wird.

<meta name="generator" content="Frontpage 4.0"> <meta name="publisher" content="Frontpage 4.0"> <meta name="progid" content="5465464">

Einige Editoren zum Erstellen von Webseiten setzen diesen Meta-Tag, er hat aber für den Anwender keinen praktischen Nutzen. Der "progid" Tag wird ausschließlich von HTML-Editoren von Microsoft gesetzt.

<meta name="distribution" content="global">

Hierdurch sollte einmal festgelegt werden, für welche Zielgruppe ein HTML-Dokument bestimmt war. Diese Angaben wurden jedoch nie durch Suchmaschinen ausgewertet. Angeblich sollen hier die erlaubten Werte "global", "local" und "iu" (internal use).

<meta name="rating" content="">

Der Meta-Angabe "rating" war ursprünglich geplant um Webseiten ähnlich wie Filme auf Tauglichkeit für Jugendliche und Kinder zu bewerten. Es gab jedoch nie ein international einheitliches System für die Angabe dieses Meta-Wertes. Hier sollte man sich besser an die Bewertungsangaben durch die International Content Rating Association halten, die im Netz weitverbreitet und informell akzeptiert sind.

<meta name="title" content="Der Titel der Webseite">

Dies ist sozusagen die Meta-Tag-Version des bekannten <title> Tags von HTML. Der Titel der Webseite sollte unbedingt im HTML <title> Tag angegeben werden. Eine zusätzliche Angabe in einem Meta-Tag ist daher überflüssig.

<meta name="abstract" content="Eine längere Beschreibung des Inhalts.">

Dieser Meta-Tag ist ebenfalls nie über den Status eines Vorschlags hinausgekommen und wurde nur für einige Zeit von IBM verwendet (die ihn auch vorgeschlagen hatten).

<meta name="resource-type" content="">

Hierdurch soll wohl die Art des Inhalts des HTML-Dokuments angegeben werden. Es wird weder von Suchmaschine noch von Programmen verstanden. Eine Angabe des Dokument-Typs sollte immer über die in XML standardisierte "Document Type Declaration" erfolgen.

<meta http-equiv="page-exit" content="RevealTrans(Duration=2.500,Transition=6)">

Einige von Microsoft eingeführte Meta-Tags, die sich glücklicherweise nie durchgesetzt haben. Ab dem Internet Explorer 4.0 führen sie dazu, dass HTML-Dokumente mit allerlei Übergangsefekten angezeigt werden, ähnlich wie bei OpenOffice Presentation oder Microsoft PowerPoint.

Dublin Core

Irgendwann Ende der 1990er Jahre wollte eine Gruppe dann das ansteigende Gewusel im Meta-Angaben-Dickicht beenden und hat es nur weiter verstärkt. Dadurch hat sich einerseits gezeigt, dass die Aussage "Die Straße zur Hölle ist gepflastert mit guten Absichten" der Wahrheit sehr Nahe kommt, anderseits haben sich die Möglichkeiten, sinnlose Meta-Tags in den HEAD-Bereich des HTML-Dokuments zu stopfen effektiv verdoppelt.

Um es gleich vorweg zu nehmen: keine einzige der "Dublin Core"-Angaben hat irgendeinen praktischen Nutzen für Webbrowser oder Suchmaschinen.

Die "Dublin Core"-Metaangaben beginnen üblicherweise mit einem "dc" gefolgt von einem "." (wohl um das ganze technisch und irgendwie strukturiert aussehen zu lassen). Gefolgt werden diese 3 Zeichen von den üblichen Angaben wie "description" oder "author" usw. Zusätzlich hat die Dublin-Gruppe aber noch einen ganzen Stapel weiterer Meta-Angaben erfunden, die jedoch ebenso nutzlos sind im heutigen Web.

Frei erfundene und lustige HTML Meta-Angaben

<meta name="jedi-mind-trick" content="You will bookmark this site and use it a lot.">

Es ist wohl ein wenig Black Hat seine Besucher auf diese Weise zum Bookmarken der Webseite zu bringen, aber was tut man nicht alles als geschäftstüchtiger SEO und Star-Wars-Fan, um seine Webseiten zum Erfolg zu führen. May the Force be with you!

<meta name="pagerank" content="8">

Einer der wohl wichtigsten Metatags. Also geübter SEO weis man natürlich, dass der PageRank (über den das Google wacht) der wichtigste Saft ist, der einer Webseite zum Erfolg verhilft. Nun haben ein paar gefeuerte Ex-Googler ausgepackt und diesen (ehemals geheimen) HTML Meta-Tag ausgeplaudert. Was wenige wissen: um nicht aufzufallen sollte man hier nicht den Wert 10 eintragen! Sonst guckt eventuell Lary persönlich auf die Seite und sie fliegt aus dem Index!

Quellen: