Unicode bewegt die Welt
Was ist Unicode?
Der Unicode ist ein international gültiger Standard für bestimmte, welcher in Computern für eine vielsprachige Textverarbeitung und auch im Netz für die Codierung von HTML (Hypertext Markup Language) und auch für Internet-Protokolle angewandt wird. Dieser Code umfasst Symbole und auch Schriftzeichen aus den unterschiedlichen Kulturen. So ist die Datenbank der Unicode-Zeichen sehr umfangreich, die circa 230.
000 Zeichen umfasst und somit eine Reserve von knapp einer Million Zeichen bietet. Die Zeichen werden zum Beispiel auch Basis der
Instagram Schrift verwendet
Der Name Unicode steht für den internationalen Standard, in welchem eine einheitliche Kodierung der Zeichen und Zeichenketten bestimmt ist. Er hat jenes Ziel, alle existierenden Schriftzeichen verschiedener Kulturkreise und Sprachen zu vereinen und auf diese Weise digitale Sprachbarrieren zu vermeiden. Alle Zeichen, die in dem Unicode enthalten sind, sind universell und auch global codiert. Dieser Standard zeichnet sich vor allem durch den generischen Ansatz aus, welcher es ermöglicht, den Unicode auch künftig nutzen und so wachsende Zeichensätze und Sprachsysteme repräsentieren zu können.
Wie entstand Unicode?
Die Erfindung und Entwicklung des Unicodes ist durch das Unicode-Konsortium definiert. Die erste Version entstammt aus dem Jahr 1990. In einer bestimmten Regelmäßigkeit hat das Konsortium neue und auch aktualisierte Versionen bekannt gegeben. 1991 erschien die Version Unicode 1.0, gefolgt von der Version 1.1. Im Jahre 1996 erschien Unicode 2.0, im Jahr 2000 Unicode 3.0 und im Jahre 2003 wurde Unicode 4.0 herausgegeben.
Wie entwickelt sich Unicode?
Unicode 3.0 kann 65.536 Zeichen darstellen. Dazu gehören auch chinesische oder japanische Zeichen und Schriftsätze wie auch hebräische, kyrillische, skandinavische, griechische, arabische, u.a. Insgesamt kennt der Unicode mehr als 50 Schriftsätze aus exotischsten Ländern. Zudem kennt der Unicode mehr als 8.000 Kontrollsymbole und Zeichen. Die ersten 128 Zeichen des Unicodes sind mit dem ASCII nach der ISO 8859 zusammenfallend.
In der Version des Unicode s 4.0, erfuhr der Unicode eine große Erweiterung um 1.226 neue Schriftzeichen gegenüber der vorherigen Version 3.2. Erweiterungen der Unicoe-Version 4.0 umfassen hierbei Symbole für kaufmännische, mathematische und technische Anwendungen. Hierzu gehören auch Zeichen für Währungen. Außerdem gibt es weitere Schriftzeichen aus dem Orient sowie aus Südostasien und Schriftzeichen von historischen Schriften und jenen von Indianerschriften.
Der Unicode 5.0 beinhaltet die vorherigen Änderungen und auch Zeichen, die für indische Sprachen, für den akademischen Gebrauch und für Mathematiker benötigt werden. Durch die Version 5.
0 erfahren vor allem die Internet-Protokolle eine erhabenere Stabilität. Unicode 5.0 bietet außerdem eine höhere Flexibilität bei einer Segmentierung der Zeichen, Sätzen und Wörtern und auch höhere Konformitätsanforderungen.
Der Unicode versteht verschiedene Transformationsformate, jene Unicode Transformation Formats, mit denen die Zeichensätze für eine Verarbeitung transformiert werden. Neben UTF-8, bei welchem ein Zeichen durch genau ein Byte und auch Single Byte Character Set, gibt es auch den UTF-16 sowie den UTF-32.
Anwendungsbeispiele und Einsatzgebiete von Unicode
Der Unicode-Standard hat vor allem im Bereich der Programmierung für das Internet Anwendung gefunden. HTML-Dokumente waren hierbei die ersten Dateien, welche direkt mit jenen hexadezimalen Hinweisen arbeiten konnten. Die Browser des Nutzers haben diese HTML-Engines implementiert, welche die Angaben in Zeichen und auch Sonderzeichen, übersetzen konnten. Im deutschen Raum spielt es vor allem für die Darstellung der Umlaute und des “ß” die entscheidende Rolle. Aber auch diese
Herzsymbole sind mit Unicode gezeichnet.
Auch jene XML-Semantik, welche sich in erster Linie für Textverarbeitungsprogramme und Schnittstellen durchgesetzt hat, implementiert jene Symbole, die in dem Unicode codiert sind. Die Entwicklung führt dazu, dass die Textverarbeitungsprogramme ansteigend Editoren für die Schriftzeichen im Hexadezimalformat beinhalten.