php header text plain
Как грамотно отправлять почту из скриптов (в частности — на PHP)
Первая часть текста взята из инструкции хостинг-провайдера Netangels. Вторая — авторская.
Отправка почты из скриптов на PHP — вещь, которая очень часто встречается в веб-приложениях. К сожалению, как показывает практика, большинство разработчиков используют эту функцию неправильно, допуская в своих скриптах одни и те же ошибки. В результате оказывается, что письмо получателю пришло в неверной кодировке, просто не дошло, или дошло, но отображается совсем не так, как этого хотел автор.
Для того, чтобы быть уверенным, что ваше сообщение отправляется действительно верно, необходимо иметь по меньшей мере базовые представления о формате почтового сообщения. Формат почтового сообщения описан в нескольких стандартизирующих документах, основными из которых являются RFC 822 (описывает формат передачи простого текста на английском языке) и RFC 2045 и далее (описывает расширения этого формата для передачи произвольных данных).
Формат почтового сообщения
Ниже приведен самый простой пример текстового сообщения, составленного в соответствии с приведенными выше стандартами и готового к отправке.
To: =?windows-1251?b?0J/QvtC70YPRh9Cw0YLQtdC70Yw/PQ==?=
Subject: =?windows-1251?b?0Y3RgtC+INGC0LXQvNCwINGB0L7QvtCx0YnQtdC90LjRjz89?=
Content-Type: text/plain; charset=«windows-1251»
Content-Transfer-Encoding: 8bit
Это почтовое сообщение на русском языке
Содержит несколько строк
Именно в таком формате клиент для отправки почты (MS Outlook или Mozilla Thunderbird) подготавливает сообщение, а затем отправляет его получателю (кстати, большинство почтовых клиентов позволяют просмотреть исходный код сообщения, в Mozilla Thunderbird, например, для этого служит комбинация клавиш Ctrl+U). Задача нашего скрипта языке PHP — добиться точно такого же формата письма.
Как видно из приведенного выше примера, электронное письмо содержит две части: в одной (верхней) размещаются заголовки, а в другой (нижней) собствено текст письма. Отделены эти части друг от друга пустой строкой. Заголовки состоят из строк, в которых содержится тема письма (Subject), имя и адрес отправителя (From), получателя (To) и другая информация. В самом простом случае каждая строка содержит пару «ИмяЗаголовка: ЗначениеЗаголовка». Особенно необходимо подчеркнуть, что, согласно стандартам, в заголовках ни при каких обстоятельствах не должны содержаться символы, не присутствующие в ASCII таблице — латинские буквы, цифры, знаки пунктуации и псевдографики.
Грамотное использование русских символов в заголовках почтового сообщения
=? кодировка? способ кодирования? закодированный текст?=
Кодировка может быть любой из списка «windows-1251», «koi8-r», «utf-8» и т.д. Во всех случаях, как правило, кодировка сообщения будет совпадать с кодировкой в которой работает сайт. То есть в большинстве случаев это будет «windows-1251», реже — «utf-8».
Способ кодирования указывает на то, каким именно образом русские символы будут преобразованы в безопасный набор. Способа определяется два: так называемый «Q-encoding» (обозначается одной буквой «Q») и «Base64» (обозначается одной буквой «B»).
К сожалению, штатной функции, которая бы могла бы обычную строку преобразовать в Q-encoded текст, в PHP нет, зато есть функция, которая умеет выполнять аналогичное преобразование в Base64. Итак, PHP код правильного создания заголовка темы почтового сообщения может выглядеть следующим образом:
Content-type: multipart/.
С этим заголовком знаком любой разработчик, которому доводилось решать проблемы отправки писем с вложениями или HTML письмами. И зачастую письма, сформированные без использования библиотек вроде PEAR::Mail_mime отображаются не очень корректно. Практика показывает, что если при формировании письма жестко придерживаться стандарта, которы задается в RFC (в частности — RFC 2046) — подавляющее большинство клиентских программ (включая таких любителей придерживаться стандартов, как Mozilla Thunderbird) отображает письмо корректно. Далее мы будем исходить из того, что читатель этого документа представляет себе основной синтаксис команд и понимает, что таке boundary и почему необходимо указывать Content-type для каждой из частей письма. Постараемся отметить основные ошибки.
Ошибка первая — неверный subtype
Ошибка вторая — неверный порядок частей
Ошибка третья — выбор только одного субтипа
Зачастую разработчик, формирующий из программы письмо забывает, что любая из частей письма может так же иметь Content-type: multipart, а значит можно выстроить некоторое подобие древовидной структуры, гарантирующей, что каждая из частей письма займет правильное место. Вот как примерно может выглядеть структура письма, имеющего текстовую и HTML версию (HTML с картинками), а так же приложенный документ MS Word:
Converting HTML to plain text in PHP for e-mail
I use TinyMCE to allow minimal formatting of text within my site. From the HTML that’s produced, I’d like to convert it to plain text for e-mail. I’ve been using a class called html2text, but it’s really lacking in UTF-8 support, among other things. I do, however, like that it maps certain HTML tags to plain text formatting — like putting underscores around text that previously had tags in the HTML.
Does anyone use a similar approach to converting HTML to plain text in PHP? And if so: Do you recommend any third-party classes that I can use? Or how do you best tackle this issue?
14 Answers 14
Use html2text (example HTML to text), licensed under the Eclipse Public License. It uses PHP’s DOM methods to load from HTML, and then iterates over the resulting DOM to extract plain text. Usage:
Although incomplete, it is open source and contributions are welcome.
Issues with other conversion scripts:
here is another solution:
For other variations of sanitization functions, see:
Converting from HTML to text using a DOMDocument is a viable solution. Consider HTML2Text, which requires PHP5:
Regarding UTF-8, the write-up on the «howto» page states:
PHP’s own support for unicode is quite poor, and it does not always handle utf-8 correctly. Although the html2text script uses unicode-safe methods (without needing the mbstring module), it cannot always cope with PHP’s own handling of encodings. PHP does not really understand unicode or encodings like utf-8, and uses the base encoding of the system, which tends to be one of the ISO-8859 family. As a result, what may look to you like a valid character in your text editor, in either utf-8 or single-byte, may well be misinterpreted by PHP. So even though you think you are feeding a valid character into html2text, you may well not be.
The author provides several approaches to solving this and states that version 2 of HTML2Text (using DOMDocument) has UTF-8 support.
Php header text plain
Заголовки HTTP используются для «общения» браузера и web-сервера, например, когда браузер запрашивает какой-либо документ, он посылает заголовок GET, а когда сервер возвращает тип документа, то он делает это ни как-нибудь, а в заголовке Content-type.
Мы уже частично рассматривали заголовки протокола HTTP, но теперь остановимся на них подробнее.
Итак, приведем список и краткое описание основных заголовков HTTP.
Заголовок Accept
Заголовок Accept предназначен для информирования сервера о типах данных, которые поддерживаются клиентом (браузером). В этом заголовке браузер перечисляет, какие типы документов он «понимает». Пере-
числение идет через запятую.
Используется переменная окружения HTTP_ACCEPT. Пример использования:
Accept: text/html, text/plain, image/jpeg
В последнее время вместо списка указывается значение *.*, что означает «все типы».
Заголовок Content-type
Данный заголовок предназначен для идентификации типа передаваемых данных. При этом заголовок Content-type использует переменную окружения CONTENT_TYPE. Обычно для этого заголовка указывается значение application/x-www-form-urlencoded. Таким образом, указывается формат, в котором все управляющие символы (т.е. символы, не являющиеся алфавитно-цифровыми) специально кодируются. О некоторых других MIME-типах вы можете узнать здесь.
Это тот самый формат передачи, который используется методами GET и POST.
Довольно распространен и другой формат, multipart/form-data.
Сервер никак не интерпретирует рассматриваемый заголовок, а просто передает его сценарию через переменную окружения.
Пример: Content-type: text/plain
Заголовок Content-length
Этот заголовок содержит строку, в которой записана длина передаваемых данных в байтах при использовании метода передачи POST. За заголовком закреплена одноименная переменная CONTENT_LENGTH.
Если задействуется метод GET, то этот заголовок отсутствует, и значит, переменная окружения не устанавливается.
Заголовок Cookie
В этом заголовке хранятся все Cookies. Данный заголовок использует переменную окружения HTTP_COOKIE. Для установки Cookies используется заголовок Set-Cookie.
Заголовок GET
Об этом заголовке мы упоминали ранее.
Заголовок GET использует следующие переменные окружения:
Заголовок Location
Получив заголовок Location вместе с указанным в нем URL, сервер немедленно переходит по указанному URL, не дожидаясь, пока тело документа загрузится:
Пример: Location: http://www.somehost.com/
Заголовок POST
Этот заголовок использует те же переменные окружения, что и заголовок GET (переменная REQUEST_METHOD содержит значение POST). Напомним, что данные методом POST можно передавать в конце заголовков.
Напомним формат заголовка POST: POST сценарий?параметры HTTP/1.0
Заголовок Pragma
Пример заголовка: Pragma: no-cache
Данный заголовок содержит название и версию программного обеспечения сервера. Например:
Server: Apache/1.3.23 (Unix) (Red-Hat/Linux) mod_ssl/2.8.7 OpenSSL/0.9.6b Dav/1.0.3 PHP/4.3.0 mod_perl/1.26 configured
Заголовок Referer
С помощью этого заголовка можно узнать ссылающийся на нас сервер. Это бывает полезно, когда нам необходимо узать обратные ссылки, например, при анализе эффективности сетевой рекламы.
Переменная окружения: HTTP_REFERER.
Заголовок User-Agent
Содержит версию браузера. Например: User-Agent: Mozilla/5.0 (compatible; Konqueror/3.0.0-10; Linux).
Переменная окружения: HTTP_REFERER.
Некоторые комментарии по HTTP-заголовкам
Мы ознакомились с названиями заголовков и соответствующим им переменным окружения.
Необходимо помнить основные приципы:
Передача заголовков HTTP в PHP
В PHP есть встроенные функции для работы с заголовками HTTP.
Для передачи заголовков HTTP предназначена функция header()
Приведем практические примеры:
( «Location: http://www.example.com/» ); /* Производит перенаправление браузера на другой ресурс */
/* Внимание! Убедитесь, что код, расположенный ниже не исполняется */
exit;
?>
// Date in the past
header ( «Expires: Mon, 26 Jul 1997 05:00:00 GMT» );
// HTTP/1.0
header ( «Pragma: no-cache» );
?>
Output rendered HTML as plain text
I trying to show the rendered output thrown by a PHP file as text.
The text should contain the HTML tags as well.
Something like what you’d get when you do a «View Source» on a web page.
How can I achieve this?
Hope this will make sense, or else if you want to display this to the user, an alternative way would be to pass the output through htmlspecialchars(); function.
try using php’s show_source(); function.
give it a link to your text file e.g.
and be careful with it because it can expose passwords and other sensitive information
To do this, the easiest way is to capture everything which is sent to the output and buffer it. At the end you can decide whether you want to render it just like you always do, or whether you want to use htmlspecialchars() to display the source.
At the start of your code, place the following statement:
At the end of your code, add the following:
Remember though, any html-code has to be outputted within pre tags and escaped.
Another trick which I actually used to do this was make a hyperlink with the view-source url in it.
Works perfectly on Chrome, Firefox and Opera but not on IE.
Not the answer you’re looking for? Browse other questions tagged php html view-source or ask your own question.
Linked
Related
site design / logo © 2021 Stack Exchange Inc; user contributions licensed under cc by-sa. rev 2021.9.17.40238
By clicking “Accept all cookies”, you agree Stack Exchange can store cookies on your device and disclose information in accordance with our Cookie Policy.
Заголовки HTTP через PHP
Вообще нужно сказать, что заголовки HTTP используются для общения между браузером и веб-сервером. То есть один говорить в каком формате принимает, другой в каком передает.
void header ( string string [, bool replace [, int http_response_code]] )
1) Вообще их можно узнать через функцию: var_dump(getallheaders());
Узнать операционку пользователя и версию браузера можно так:
2) А узнать то, что отправили можно так, через функцию headers_list():
header(«Человек: это звучит гордо!»);
var_dump(headers_list());
1) Для переадрессации на другой сайт. Вы скорее всего видели в своей жизни неоднократно, заходишь на свой сайт, а он перекидывает тебя на другой, так вот это и есть применение заголовков таким образом:
header( ‘Location: https://saitsozdanie.ru/’ );
или перекинь меня пожалуйста, через 5 секунд после захода:
header( ‘Refresh: 5; url=https://saitsozdanie.ru/’ ); (то же самое но с помощью html тегов )
2) Для установки кодировки сайта:
header(‘Content-Type: text/html; charset=utf-8’);
или тоже самое html тегом:
3) Для отработки ошибок:
//Страница выполнена корректно
header( ‘HTTP/1.1 200 OK’ );
//Запрашиваемая страница не найдена
header( ‘HTTP/1.1 404 Not Found’ );
//Доступ запрещен:
header( ‘HTTP/1.1 403 Forbidden’ ); //Страница перемещена навсегда.
//Используется для корректировки урлов поисковых серверов.
header( ‘HTTP/1.1 301 Moved Permanently’ );
//Сервер выполнил скрипт с ошибкой
header( ‘HTTP/1.1 500 Internal Server Error’ );
header(‘Content-Type: text/plain’); // plain text файл
header(‘Content-Type: image/jpeg’); // JPG картинка в формате
header(‘Content-Type: audio/mpeg’); // Audio MPEG (MP3. ) файл
header(‘Content-Type: application/x-shockwave-flash’); // Flash animation
5) Когда последний раз изменялось содержимое контента:
6) Заголовок на PHP для отключения кэширования:
header( ‘Cache-Control: no-cache, no-store, max-age=0, must-revalidate’ );
header( ‘Expires: Mon, 1 Apr 2001 01:02:03 GMT’ );
header( ‘Pragma: no-cache’ );
header( ‘Content-language: en’ ); // en = English