Internationale Domain-Namen (IDNs) einfach erklärt

Laut der Statistik von statista.com vom September 2023 nutzten im Jahre 2023 weltweit mehr als 5,4 Milliarden Menschen das World Wide Web - tendenz steigend. Dabei kommt es immer öfter vor, dass die Nutzer auf ihre eigene Muttersprache zurückgreifen, was durch die internationalisierte Domain-Namen (IDN) ermöglicht wird. Im nachfolgenden Artikel möchten wir Ihnen erklären was IDNs sind und wie sie funktionieren.

Was sind internationalisierte Domain-Namen (IDNs)?

Ein internationalisierter Domain-Name (IDN) ist laut Definition der IETF (Internet Engineering Task Force) ein Domain-Name, der neben den Buchstaben des lateinischen Alphabets auch Sonderzeichen, wie z.B. Umaute oder Buchstaben anderer Alphabete, enthält. Da das Domain Name System (DNS) jedoch auf dem limitierten Standardzeichensatz "ASCII" beruht, können Sonderzeichen vom DNS bei der Übersetzung der URLs in IP-Adressen nicht verarbeitet werden.

Damit das DNS sowie andere Internetprotokolle auch Domain-Namen mit Sonderzeichen verstehen, wurde im Jahre 2003 der Internetstandard "Internationalizing Domain Names in Applications" (IDNA) eingeführt. IDNA nutzt eine standardisierte Übersetzung, um Unicode in ASCII umzuwandeln. Durch diese Übersetzung können auch Zeichen in Domain-Namen verwendet werden, die nicht im ASCII-Zeichensatz enthalten sind.

Nutzen Sie jetzt unseren Domain-Checker, um sich Ihre Wunschdomain zu sichern. Domain-Namen mit Sonderzeichen, wie z.B. Umlaute, werden automatisch in das benötigte Format umgewandelt.

Wie funktioniert IDNA?

Im World Wide Web kommen viele unterschiedliche Systeme zum Einsatz, die ausschließlich mit dem ASCII-Zeichensatz arbeiten können. Damit diese auch internationalisierte Domain-Namen verstehen können, kann jede IDN von Unicode in einen ACE-String übersetzt werden, der wiederum auf ASCII-Zeichen basiert. Durch diese Übersetzung kann z.B. im Browser eine URL mit Umlaut eingegeben werden, während der Server die URL ausschließlich mit dem ASCII-Zeichensatz verarbeitet. 

Dieses Verfahren wurde im Internetstandard IDNA2003 bzw. in dessen Überarbeitung IDNA2008 definiert. Die Verarbeitung der URL von Unicode in ASCII findet immer clientseitig - also im Browser, E-Mail-Programm, FTP-Client, etc.) - statt und basiert auf einem standardisierten Kodierungsverfahren. Dieses Verfahren wird als Punycode bezeichnet.

Was ist ein Punycode?

Damit Unicode-Zeichenketten verlustfrei und eindeutig in den ASCII-Zeichensatz übertragen werden können, wurde der Punycode im RFC3492 standardisiert. Für dessen Erstellung werden alle Zeichen aus dem Domain-Namen, die nicht im ASCII-Zeichensatz vorhanden sind, entfernt, anschließend kodiert und durch einen Bindestrich getrennt an den Domain-Namen angehängt. Mit dieser Zeichenfolge lässt sich bestimmen, welches Unicodezeichen enthalten ist und an welcher Position es sich im Domain-Namen befindet. Des Weiteren beginnt jeder ACE-String mit dem Präfix "xn-", wodurch der IDN und der Punycode unmissverständlich gekennzeichnet wird.

Sollten Sie sich unsicher sein, wie Sie den ACE-String nach dem Punycode-Verfahren genau erstellen müssen, dann können Sie zur Generierung einen IDN-Converter verwenden.

Was sind die Unterschiede zwischen IDNA2003 und IDNA2008?

Anders als in der überarbeiteten Variante wurde mit IDNA2003 eine internationalisierte URL mit dem Nameprep-Verfahren angepasst. Bei diesem Verfahren wurden Groß- zu Kleinbuchstaben umgewandelt, Steuerzeichen entfernt und entsprechende Zeichen in eine einheitliche Form gebracht. Mit IDNA2008 wurde das Nameprep-Verfahren durch das Punycode-Verfahren ersetzt. Dadurch findet zwar keine Normalisierung mehr statt, allerdings empfiehlt IDNA für die Umwandlung von Groß- in Kleinbuchstaben einen Algorithmus einzusetzen.

Von der Umstellung auf das Punycode-Verfahren profitieren unter anderem die Nutzer im deutschsprachigen Raum. Unter IDNA2003 wurde das bekannte Unicodezeichen "ß" ursprünglich mit "ss" gleichgestellt. Dadurch wurden Domain-Namen wie z.B. www.fußballclub-durmersheim.de nach dem Nameprep-Verfahren automatisch in www.fussballclub-durmersheim.de umgewandelt. Nach der Veröffentlichen von IDNA2008 im Jahre 2010 wird diese Anpassung nicht mehr angewandt. Stattdessen wird das Unicodezeichen "ß" als "Latin small letter sharp s" betrachtet und kann wie gewohnt in einer IDN-Domain verwendet werden.

Des Weiteren stehen unter IDNA2008 ca. 8.000 Zeichen nicht mehr zur Verfügung, die zuvor unter IDNA2003 in Domain-Namen möglich waren. Zudem werden vier Zeichen, wie z.B. "ß", unter IDNA2008 anders interpretiert als unter IDNA2003. Weitere Unterschiede zwischen den beiden Internetstandards können Sie in einer ausführlichen Diskussion im "Unicode Technical Standard #46" finden. Nachfolgend finden Sie eine zusammenfassende Übersicht über die hauptsächlichen Unterschiede zwischen IDNA2003 und IDNA2008:

IDNA2003
IDNA2008
Normalisierung nach Nameprep-Verfahren
keine Vorgabe zur Normalisierung
gültig ab Unicode 3.2
Gültig ab Unicode 5.2
Strikte Vorgaben für linksläufige Schriften
Eindeutigere Vorgaben für linksläufige Schriften
Groß- und Kleinbuchstaben als separate Zeichen betrachtet
Großbuchstaben werden in Kleinbuchstaben umgewandelt

Viele Symbole nicht mehr erlaubt (z.B. grafische Symbole sowie manche Satzzeichen)

"Remapping" von manchen Unicode-Zeichen entfernt, da Unregelmäßigkeiten auftreten könnten


Welche Probleme können durch die Nutzung von IDNs entstehen?

Im Normalfall sollten alle gängigen Internet-Programme mit internationalisierten Domainnamen arbeiten können und diese verstehen. Allerdings kann es unter Umständen zu Problemen kommen, da die Umstellung von IDNA2003 zu IDNA2008 im Internet noch nicht vollumfänglich übernommen wurde. So kann es z.B. sein, dass es im deutschsprachigen Raum zu unterschiedlichen Interpretationen des Buchstabens "ß" kommen kann. Nach IDNA2003 muss "ß" zwingend in "ss" umgewandelt werden. Während aktuelle Systeme den Buchstaben korrekterweise nach IDNA2008 in einen Punycode umwandeln, ist der Domain-Name für veraltete Systeme, die nach IDNA2003 arbeiten, nicht auffindbar. Um das Problem zu umgehen, können Webseitenbetreiber einfach beide Varianten des Domain-Namens registrieren und über einen Redirect (Domain-Weiterleitung) die Besucher der Webseite auf die Hauptseite umleiten.

Wir verwenden Cookies für die technische Funktionalität dieser Website. Mit Ihrer Zustimmung erfassen wir außerdem Seitenaufrufe und andere statistische Daten in anonymisierter Form.

Einzeln auswählen
Cookie-Einstellungen
Datenschutzbestimmungen lesen