Zeichen in HTML festgelegt
Es gibt zahlreiche Zeichensätze, die in früheren Versionen von HTML verwendet wurden. Hier werden wir alle zuvor und derzeit unterstützten Charaktere besprechen.
ASCII -Zeichensatz
Das ASCII ist ein 7-Bit-Zeichensatz, mit dem 128 Zeichen die englischsprachigen Begriffe im verständlichen Computerformat darstellen können. Einige Merkmale von ASCII werden nachstehend beschrieben:
- Die Ziffern (0-9) und alle 26 alphabetischen Buchstaben können mit ASCII dargestellt werden
- Alle in HTML verwendeten Zeichensätze basieren auf ASCII
Die primäre Einschränkung des ASCII-Zeichensatzes ist, dass es nur 128 Zeichen unterstützte, die nur englische Sprachbegriffe (Alphabete), Ziffern (0-9) und Zeichensetzung unterstützen konnten. Sprachabhängig und begrenzt.
ISO 8859-1 Zeichenset
Aus den jüngsten Versionen, HTML 4.0 kam mit dem ISO-8859-1 als Standardcharakter-Set. Der ISO 8859-1 ist eine Erweiterung des ASCII-Zeichensatzes und repräsentiert die Zeichen im 8-Bit-Code. Es kann 256 Zeichen darstellen, was es auch zu einem sprachabhängigen Codierungsschema macht. Ein Zeichensatz ist im Meta-Tag des HTML-Dokuments definiert, und der folgende Code hilft bei der Verwendung des ISO 8859-1 in Ihrem HTML-Dokument:
Notiz: Obwohl HTML5 einen UTF-8-Zeichensatz enthält, kann es auch mit ISO-8859-1 verwendet werden, indem die folgende Zeile in Ihrem Kopf-Tag verwendet wird.
UTF-8-Zeichensatz
Der Unicode -Zeichensatz umfasst die Dezimalwerte, die die Zeichen, Symbole und Interpunktionsmarken darstellen. Diese auf Unicode-basierten Dezimalwerte werden dann mithilfe von UTF-8, UTF-16 oder UTF-32 in das verständliche Format konvertiert. Der UTF-8 wird jedoch für Webseiten empfohlen, da alle Zeichen/Symbole/Interpunktionsmarken abdeckt, die in einem HTML-Dokument verwendet werden können.
Im Folgenden sind die herausragenden Merkmale von UTF-8 aufgeführt
- Das neueste Zeichensatz war ein Standard für HTML5.
- Es kann auch zur HTML4 -Version hinzugefügt werden.
- Die UTF-8 funktioniert auf der Grundlage von ASCII und die ersten 128 Zeichen in UTF-8 sind die gleichen wie von ASCII.
- Unterstützt alle Symbole, Charaktere und Zeichensetzung, die weltweit verwendet werden
- Konvertiert die Zahlen/Zeichen/Symbole/Zeichensetzung in ein bis vier Bytes
Aus der obigen Diskussion machte die Bedeutung von UTF-8 einen soliden Boden für die Vergleiche von ASCII- und ISO-8859-1-Charakter-Sätzen.
Notiz: Der Unicode.org liefert alle Unicodes der Zeichen, Symbole, Emojis, Interpunktionsmarken.
So verwenden Sie UTF-8 in HTML4
Der HTML4 wurde mit ISO-889-1 als Standardzeichensatz geliefert. Sie können jedoch den in HTML4 eingestellten UTF-8-Charakter mithilfe des folgenden Meta-Tags hinzufügen.
So verwenden Sie ISO-8859-1 in HTML5
Da der Standardzeichensatz von HTML5 UTF-8 ist und die älteren Zeichensätze übertrifft. Sie können jedoch den ISO-8859-1-Zeichen in Ihrem HTML-Dokument hinzufügen, indem Sie die folgende Zeile in unserem Kopf-Tag verwenden.
Abschluss
Der Zeichensatz setzt die Symbole, Zeichen oder einen Tastenanschlag in ein computerlesbares Format um. Dieser Artikel bietet einen Überblick über die in HTML verwendeten Zeichensätze, die von früheren Versionen zu den neuesten HTML5 -. Der ASCII ist der älteste Charakter mit begrenzter Unterstützung für Zeichen und Sprache (nur englische Sprache). Später wurde ASCII auf 256 Zeichen mit 8-Bit-Unterstützung erweitert, um einen neuen Charakter-Set mit dem Namen ISO-8859-1 zu erstellen. Der ISO-8859-1 ist das Standardzeichen für HTML4, bietet jedoch eine begrenzte Unterstützung von Zeichen (256). Der UTF-8 deckt alle Mängel des ISO-8859-1 ab und somit wurde UTF-8 als Standardcharakter in HTML5 eingestellt.