php html сущности в символы
Php html сущности в символы
Описание string html_entity_decode ( string string [, int quote_style [, string charset]] )
Необязательный аргумент quote_style позволяет указать способ обработки ‘одиночных’ и «двойных» кавычек. Значением этого аргумента может быть одна из трех следующих констант (по умолчанию ENT_COMPAT ):
Таблица 1. Константы quote_style
Имя константы | Описание |
---|---|
ENT_COMPAT | Преобразуются двойные кавычки, одиночные остаются без изменений. |
ENT_QUOTES | Преобразуются и двойные, и одиночные кавычки. |
ENT_NOQUOTES | И двойные, и одиночные кавычки остаются без изменений. |
Необязательный третий аргумент charset определяет кодировку, используемую при преобразовании. По умолчанию используется кодировка ISO-8859-1.
Начиная с PHP 4.3.0 поддерживаются следующие кодировки.
Таблица 2. Поддерживаемые кодировки
Кодировка | Псевдонимы | Описание |
---|---|---|
ISO-8859-1 | ISO8859-1 | Западно-европейская Latin-1 |
ISO-8859-15 | ISO8859-15 | Западно-европейская Latin-9. Добавляет знак евро, французские и финские буквы к кодировке Latin-1(ISO-8859-1). |
UTF-8 | 8-битная Unicode, совместимая с ASCII. | |
cp866 | ibm866, 866 | Кириллическая кодировка, применяемая в DOS. Поддерживается в версии 4.3.2. |
cp1251 | Windows-1251, win-1251, 1251 | Кириллическая кодировка, применяемая в Windows. Поддерживается в версии 4.3.2. |
cp1252 | Windows-1252, 1252 | Западно-европейская кодировка, применяемая в Windows. |
KOI8-R | koi8-ru, koi8r | Русская кодировка. Поддерживается в версии 4.3.2. |
BIG5 | 950 | Традиционный китайский, применяется в основном на Тайване. |
GB2312 | 936 | Упрощенный китайский, стандартная национальная кодировка. |
BIG5-HKSCS | Расширенная Big5, применяемая в Гонг-Конге. | |
Shift_JIS | SJIS, 932 | Японская кодировка. |
EUC-JP | EUCJP | Японская кодировка. |
Замечание: Не перечисленные выше кодировки не поддерживаются, и вместо них применяется ISO-8859-1.
Пример 1. Декодирование HTML сущностей
= «I’ll \»walk\» the dog now» ;
htmlspecialchars — Преобразует специальные символы в HTML-сущности ОписаниеСписок параметровБитовая маска из нижеуказанных флагов, определяющих режим обработки кавычек, некорректных кодовых последовательностей и используемый тип документа. По умолчанию используется ENT_COMPAT | ENT_HTML401.
Необязательный аргумент определяющий кодировку, используемую при конвертации симоволов. Если не указан, то значением по умолчанию для encoding зависит от используемой версии PHP. В PHP 5.6 и старше, для значения по умолчанию используется конфигурационная опция default_charset. В PHP 5.4 и 5.5 используется UTF-8 по умолчанию. Более ранние версии PHP используют ISO-8859-1. Хотя этот аргумент является технически необязательным, настоятельно рекомендуется указать правильное значение для вашего кода, если вы используете PHP 5.5 или выше, или если ваша опция конфигурации default_charset может быть задана неверно для входных данных. Поддерживаются следующие кодировки:
Если параметр double_encode выключен, то PHP не будет преобразовывать существующие html-сущности. По умолчанию преобразуется все без ограничений. Возвращаемые значенияСписок измененийПримерыПример #1 Пример использования htmlspecialchars() ПримечанияСмотрите такжеhtmlentities — Преобразует все возможные символы в соответствующие HTML-сущности ОписаниеЭта функция идентична htmlspecialchars() за исключением того, что htmlentities() преобразует все символы в соответствющие HTML-сущности (для тех символов, для которых HTML сущности существуют). Список параметровБитовая маска из нижеуказанных флагов, определяющих режим обработки кавычек, некорректных кодовых последовательностей и используемый тип документа. По умолчанию используется ENT_COMPAT | ENT_HTML401.
Необязательный аргумент определяющий кодировку, используемую при конвертации симоволов. Если не указан, то значением по умолчанию для encoding зависит от используемой версии PHP. В PHP 5.6 и старше, для значения по умолчанию используется конфигурационная опция default_charset. В PHP 5.4 и 5.5 используется UTF-8 по умолчанию. Более ранние версии PHP используют ISO-8859-1. Хотя этот аргумент является технически необязательным, настоятельно рекомендуется указать правильное значение для вашего кода, если вы используете PHP 5.5 или выше, или если ваша опция конфигурации default_charset может быть задана неверно для входных данных. Поддерживаются следующие кодировки:
При выключении параметра double_encode PHP не будет преобразовывать существующие html-сущности. По умолчанию преобразуется все без ограничений. Возвращаемые значенияВозвращает преобразованную строку. Список измененийПримерыПример #1 Пример использования htmlentities() Пример #2 Использование ENT_IGNORE Смотрите такжеhtmlspecialchars_decode — Преобразует специальные HTML-сущности обратно в соответствующие символы ОписаниеСписок параметровСтрока, которую надо преобразовать. Битовая маска из одного или нескольких следующих флагов, которые указывают как обрабатывать кавычки и какие типы документов использовать. Значением по умолчанию является ENT_COMPAT | ENT_HTML401.
Возвращаемые значенияВозвращает преобразованную строку. Список измененийПримерыПример #1 Пример использования функции htmlspecialchars_decode() Результат выполнения данного примера: Смотрите такжеhtmlspecialchars_decode(PHP 5 >= 5.1.0, PHP 7, PHP 8) htmlspecialchars_decode — Преобразует специальные HTML-сущности обратно в соответствующие символы ОписаниеСписок параметровСтрока, которую надо преобразовать. Возвращаемые значенияВозвращает преобразованную строку. ПримерыПример #1 Пример использования функции htmlspecialchars_decode() Результат выполнения данного примера: Смотрите такжеUser Contributed Notes 8 notesThe example for «htmlspecialchars_decode()» below sadly does not work for all PHP4 versions. Quote from the PHP manual: But it does NOT! At least not for PHP version 4.4.2. This comment now is not to report this bug again (though I really believe it is one), but to complete the example and warn people of this pitfall. To make sure your htmlspecialchars_decode fake for PHP4 works, you should do something like this: This should be the best way to do it. that works also with ä and » and so on. function htmlspecialchars_decode_PHP4($uSTR) Well, consider someone sending ‘&’ to your PHP script: There is, unfortunately, no reliable way to determine whether HTML is escaped or not that does not come with this caveat that I know of. Rather than try and catch the case ‘I’ve already encoded this’, you are better off avoiding double-escaping by simply escaping the HTML as close to the actual output as you can muster, e.g. in the view in an MVC development structure. If you use `htmlspecialchars()` to change things like the ampersand (&) into it’s HTML equivalent (&), you might run into a situation where you mistakenly pass the same string to the function twice, resulting in things appearing on your website like, as I call it, the ampersanded amp; «&». Clearly nobody want’s «&» on his or her web page where there is supposed to be just an ampersand. Here’s a quick and easy trick to make sure this doesn’t happen: = «This is a string that could be passed to htmlspecialchars multiple times.» ; ?> Now, if your dealing with text that is a mixed bag (has HTML entities and non-HTML entities) you’re on your own. [Update of previous note, having noticed I forgot to put in quote style] PHP4 Compatible function: // you can do it a bunch of times, it still won’t screw you! ?> Put it in a function. Add it to the method of some abstract data class. For PHP4 Compatibility:
|