html_entity_decode
(PHP 4 >= 4.3.0, PHP 5)
html_entity_decode — Converte le entità HTML nei corrispondenti caratteri
Descrizione
La funzione html_entity_decode() è l'opposto di htmlentities() converte tutte le entità HTML presenti nel parametro string nel corrispondente carattere.
Il secondo parametro, quote_style , opzionale, indica cosa occorre fare per gli apici 'singoli' e "doppi". Sono possibili tre scelte indicate da tre costanti con default ENT_COMPAT:
Nome della costante | Descrizione |
---|---|
ENT_COMPAT | Converte gli apici doppi e lascia inalterati gli apici singoli. |
ENT_QUOTES | Converte sia gli apici doppi sia gli apici singoli. |
ENT_NOQUOTES | Lascia entrambi i tipi di apici inalterati. |
Per il terzo parametro opzionale, charset , si utilizza come default il set di caratteri ISO-8859-1. Questo parametro indica quale set di caratteri utilizzare per la conversione.
Elenco dei set di caratteri supportati dal PHP 4.3.0 e successivi.
Set di caratteri | Alias | Descrizione |
---|---|---|
ISO-8859-1 | ISO8859-1 | Western European, Latin-1 |
ISO-8859-15 | ISO8859-15 | Western European, Latin-9. Con in più il simbolo dell'Euro e i caratteri francesi e finnici mancanti in Latin-1(ISO-8859-1). |
UTF-8 | Set ASCII compatibile con il set multi-byte Unicode su 8-bit. | |
cp866 | ibm866, 866 | Set di caratteri cirillico specifico del Dos. Supportato dalla 4.3.2. |
cp1251 | Windows-1251, win-1251, 1251 | Set di caratteri cirillico specifico di Windows, Supportato dalla 4.3.2. |
cp1252 | Windows-1252, 1252 | Set di caratteri specifico di Windows per l'Europa occidentale. |
KOI8-R | koi8-ru, koi8r | Russo. Supportato dalla 4.3.2. |
BIG5 | 950 | Cinese tradizionale, usato principalmente a Taiwan. |
GB2312 | 936 | Cinese semplificato, set di caratteri nazionale standard. |
BIG5-HKSCS | Big5 con estensioni per Hong Kong, cinese tradizionale. | |
Shift_JIS | SJIS, 932 | Giapponese. |
EUC-JP | EUCJP | Giapponese. |
Nota: Ogni altro set di caratteri non è riconosciuto e sarà sostituito con con il set ISO-8859-1.
Example#1 Decodifica delle entità HTML
<?php
$orig = "I'll \"walk\" the <b>dog</b> now";
$a = htmlentities($orig);
$b = html_entity_decode($a);
echo $a; // I'll "walk" the <b>dog</b> now
echo $b; // I'll "walk" the <b>dog</b> now
// Per utilizzatori di versioni di PHP antecedenti alla 4.3.0:
function unhtmlentities($string)
{
$trans_tbl = get_html_translation_table(HTML_ENTITIES);
$trans_tbl = array_flip($trans_tbl);
return strtr($string, $trans_tbl);
}
$c = unhtmlentities($a);
echo $c; // I'll "walk" the <b>dog</b> now
?>
Nota: Ci si può chiedere come mai la sequenza trim(html_entity_decode(' ')); non produca una stringa vuota; questo accade perchè l'intità ' ' non corrisponde al codice ASCII 32 (che verrebbe rimosso da trim()), ma, nella codifica di default ISO-8859-1, corrisponde al carattere ASCII 160 (0xa0).
Vedere anche htmlentities(), htmlspecialchars(), get_html_translation_table(), and urldecode().