get_html_translation_table
(PHP 4, PHP 5, PHP 7, PHP 8)
get_html_translation_table — Liefert die Umwandlungstabelle, die von htmlspecialchars() und htmlentities() verwendet wird
Beschreibung
$table = HTML_SPECIALCHARS, int $flags = ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML401, string $encoding = "UTF-8"): arrayget_html_translation_table() gibt die Umwandlungs-Tabelle zurück, die intern in den Funktionen htmlspecialchars() und htmlentities() verwendet wird.
Hinweis:
Sonderzeichen können auf unterschiedliche Weise kodiert werden.
"kann kodiert werden als","oder". get_html_translation_table() gibt nur die von htmlspecialchars() und htmlentities() genutzte Form zurück.
Parameter-Liste
-
table -
Die Tabelle, die zurückgegeben werden soll. Entweder
HTML_ENTITIESoderHTML_SPECIALCHARS. -
flags -
Eine Bitmaske von einem oder mehreren der folgenden Flags, die festlegen, welche Anführungszeichen die Tabelle enthalten wird, sowie für welchen Dokumenttyp sie ist. Der Standardwert ist
ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML401.Verfügbare flags-KonstantenName der Konstante Beschreibung ENT_COMPATDie Tabelle soll Entities für doppelte Anführungszeichen enthalten, aber nicht für einfache. ENT_QUOTESDie Tabelle soll Entities sowohl für einfache als auch doppelte Anführungszeichen enthalten. ENT_NOQUOTESDie Tabelle soll weder Entities für einfache noch für doppelte Anführungszeichen enthalten. ENT_SUBSTITUTEErsetzt ungültige Code-Unit-Sequenzen mit dem Unicode-Ersatzzeichen U+FFFD (UTF-8) oder � (andernfalls), anstatt eine leere Zeichenkette zurückzugeben. ENT_HTML401Die Tabelle für HTML 4.01. ENT_XML1Die Tabelle für XML 1. ENT_XHTMLDie Tabelle für XHTML. ENT_HTML5Die Tabelle für HTML 5. -
encoding -
Definiert die zu verwendende Zeichenkodierung. Wenn nicht angegeben, ist der Standardwert für dieses Argument UTF-8.
Die folgenden Zeichensätze werden unterstützt:
Unterstützte Zeichensätze Zeichensatz Alias Beschreibung ISO-8859-1 ISO8859-1 Westeuropäisch, Latin-1. ISO-8859-5 ISO8859-5 Wenig verwendeter kyrillischer Zeichensatz (Latin/Cyrillic). ISO-8859-15 ISO8859-15 Westeuropäisch, Latin-9. Enthält das Euro-Zeichen sowie französische und finnische Buchstaben, die in Latin-1(ISO-8859-1) fehlen. UTF-8 ASCII-kompatibles Multi-Byte 8-Bit Unicode. cp866 ibm866, 866 DOS-spezifischer kyrillischer Zeichensatz. cp1251 Windows-1251, win-1251, 1251 Windows-spezifischer kyrillischer Zeichensatz. cp1252 Windows-1252, 1252 Windows spezifischer Zeichensatz für westeuropäische Sprachen. KOI8-R koi8-ru, koi8r Russisch. BIG5 950 Traditionelles Chinesisch, hauptsächlich in Taiwan verwendet. GB2312 936 Vereinfachtes Chinesisch, nationaler Standard-Zeichensatz. BIG5-HKSCS Big5 mit Hongkong-spezifischen Erweiterungen; traditionelles Chinesisch. Shift_JIS SJIS, SJIS-win, cp932, 932 Japanisch EUC-JP EUCJP, eucJP-win Japanisch MacRoman Zeichensatz, der von Mac OS verwendet wurde. ''Eine leere Zeichenkette aktiviert die Erkennung durch die Kodierung des Skripts (Zend multibyte), default_charset und die aktuelle Sprachumgebung (siehe nl_langinfo() und setlocale()), in dieser Reihenfolge. Nicht empfehlenswert. Hinweis: Weitere Zeichensätze sind nicht implementiert. Statt dessen wird die Standard-Kodierung verwendet und eine Warnung ausgegeben.
Rückgabewerte
Gibt die Umwandlungstabelle als Array zurück, wobei die ursprünglichen Zeichen die Schlüssel sind und die Entities die Werte.
Changelog
| Version | Beschreibung |
|---|---|
| 8.1.0 |
flags geändert von
ENT_COMPAT zu ENT_QUOTES |
ENT_SUBSTITUTE | ENT_HTML401.
|
Beispiele
Beispiel #1 Beispiel für eine Umwandlungstabelle
<?php
var_dump(get_html_translation_table(HTML_ENTITIES, ENT_QUOTES | ENT_HTML5));
?>
Das oben gezeigte Beispiel erzeugt eine ähnliche Ausgabe wie:
array(1510) {
["
"]=>
string(9) "
"
["!"]=>
string(6) "!"
["""]=>
string(6) """
["#"]=>
string(5) "#"
["$"]=>
string(8) "$"
["%"]=>
string(8) "%"
["&"]=>
string(5) "&"
["'"]=>
string(6) "'"
// ...
}
Siehe auch
- htmlspecialchars() - Wandelt Sonderzeichen in HTML-Entities um
- htmlentities() - Wandelt alle geeigneten Zeichen in entsprechende HTML-Entities um
- html_entity_decode() - Wandelt HTML-Entities in ihre entsprechenden Zeichen um

