Forum und email

utf8_encode

(PHP 4, PHP 5)

utf8_encode — ISO-8859-1 szöveget UTF-8 szerint kódol át

Leírás

string utf8_encode ( string $data )

Ez a függvény a data paraméterben átadott sztringet UTF-8 szerint kódolja, és ezt a kódolt alakot adja vissza. Az UTF-8 az Unicode szabványos módszere a hosszú karakterek értékének bájtfolyamba kódolására. Az UTF-8 átlátszó megoldás a sima ASCII karakterek esetén, ön-szinkronizáló tulajdonsággal bír (azaz a programok meg tudják határozni, hogy hol kezdődnek a karakterek a bájtfolyamon belül) és a hagyományos összehasonlító-függvényekkel és egyebekkel együtt is használhatók. PHP az UTF-8 karaktereket 4 bájtos hosszig az alábbiak szerint kódolja:

UTF-8 kódolás
bájtok bitek ábrázolás
1 7 0bbbbbbb
2 11 110bbbbb 10bbbbbb
3 16 1110bbbb 10bbbbbb 10bbbbbb
4 21 11110bbb 10bbbbbb 10bbbbbb 10bbbbbb
Ahol minden b egy bitet jelent, amit karakter tárolásához használható.