utf8_encode

(PHP 3>= 3.0.6, PHP 4 , PHP 5)

utf8_encode -- Codifica um string ISO-8859-1 para UTF-8

Descrição

string utf8_encode ( string data )

Esta função codifica uma string data para UTF-8, e retorna uma versão codificada. UTF-8 é o mecanismo padrão usado pela Unicode para codificação de valores amplos de caractere dentro de um byte stream. UTF-8 é transparente para caracteres simplesASCII, é auto-sincronizado (quer dizer que isso é possível para um programa compreender onde nos caracteres bytestream começar) e pode ser usado funções de comparção de strings normais para seleção e semelhança. PHP codifica caracteres UTF-8 em até quatro bytes, desse jeito:

Tabela 1. UTF-8 encoding

bytesbitsrepresentation
170bbbbbbb
211110bbbbb 10bbbbbb
3161110bbbb 10bbbbbb 10bbbbbb
42111110bbb 10bbbbbb 10bbbbbb 10bbbbbb
Cada b representa um bit que pode ser usado para guardar dados de caracter.