[Главная страница][Дистанционное образование]
Краткое руководство по WWW4MAIL
(перевод А. Кунгурова)
Навигация по паутине и поиск в базах данных по электронной почте
(следующее поколение).
(версия 2.0; декабрь 1998 года
Что такое www4mail?
Www4mail это бесплатная служба, которая даст вам возможность перемещаться по всему интернету и осуществлять поиск в нем через электронную почту (e-mail), с помощью любого стандартного WWW браузера и почтовой программы, умеющей работать с MIME (Multipurpose Internet Mail Exchange). Сообщения электронной почты автоматически передаются на вашу почтовую программу, когда вы выбираете (одну или несколько) кнопок которые связаны с другими страницами на интернет. Также доступны UUEncode и другие опции.
Как пользоваться Www4mail?
Это очень просто.
В теле почтового сообщения, адресованного www4, просто укажите адрес в интернете, который называется Uniform Resource Locator, или URL, того вебсайта или вебстраницы, который вы хотите вытащить. По умолчанию они будут посланы вам почтовыми вложениями. Чтобы получать документы в теле почтовых сообщений, вы можете добавить одну из опций - SEND, GET, GET SOURCE, или XSOURCE, о чем речь пойдет ниже. Или использовать XUUENCODE чтобы запросить содержание в формате UUEncode.
Получение документов из интернет в качестве почтовых вложений
Получение документов изнернет в виде почтовых вложений позволит вам сохранить и повторно использовать документ; Особенно для последующего поиска в интернет.
Например, чтобы получить какие-нибудь вебстраницы с вебсервера международного Центра Теоретической Физики имени Абдус Салама в Триесте, Италия, пошлите электронное сообщение
Кому: www4mail@wm.ictp.trieste.it
Тема: (все, что хотите)
а в теле сообщения укажите от одного до пяти адресов:
http://www.ictp.trieste.it/~www4mail
Www4mail ответит вам, а в ответе будут содержаться запрошенные документы, в виде вложений к электронной почте, которое вы сможете визуализировать с помощью любого стандартного интернет браузера, такого, как Netscape, Internet Explorer, Lynx и т.д. Будет сохранена оригинальная разметка страницы (таблицы, цвета и т.д.).
Вы можете получить сообщения, которые вас интересуют, выбрав соответствующие кнопки и щелкнув кнопку "Get selected documents" (Получить выбранные документы) в нижней части вебстраницы, чтобы сделать новый единичный запрос на www4mail.
Если вы хотите вытаскивать оригинальные, немодифицированные HTML исходники в качестве почтовых вложений, которые вы сможете визуализировать с помощью любого стандартного интернет браузера, такого как Netscape, Internet Explorer, Lynx и т.д., то наберите:
TSOURCE http://www.ictp.trieste.it/
Будет сохранена оригинальная разметка страницы (таблицы, цвета, фреймы и т.д.). Вы можете перечислить в теле сообщения до 5 URLов TSOURCE, но пишите каждый адрес TSOURCE на отдельной строке.
Получение документов в теле сообщения
Возможна также совместимость с альтернативными серверами типа Agora и GetWeb. По аналогии со службами "Agora" и "GetWeb", вы можете вытаскивать вебстраницы, преобразованные в текст, прямо в теле сообщения, если для вас это предпочтительно.
Для предыдущего примера, пошлите сообщение
Кому: www4mail@wm.ictp.trieste.it
Тема: все, что хотите
а в теле письма наберите один из следующих вариантов:
GET http://www.ictp.trieste.it/
или
SEND http://www.ictp.trieste.it/
Затем, чтобы продолжить передвигаться по интернет с помощью Www4mail, отправьте другое электронное почтовое сообщение на Www4mail и укажите URL(ы), которые вам нужны, как в предыдущем примере.
Если вы хотите вытаскивать немодифицированные HTML исходники в теле сообщения, напишите один из следующих вариантов:
GET SOURCE http://www.ictp.trieste.it/
или просто
SOURCE http://www.ictp.trieste.it/
В случае, если ваша почтовая программа не поддерживает MIME, вы можете получать отфильтрованные самой www4mail HTML исходники в теле сообщения, используя следующую опцию:
XSOURCE http://www.ictp.trieste.it/
В одном письме можно запросить до пяти URLов XSOURCE, но следите, чтобы каждый XSOURCE был на отдельной строке.
Как написать длинные URLы
Если запрашиваемый URL в одну строку не помещается, строку можно разделить с помощью знака Бэкслэш (). Например, используйте
Кому: www4mail@wm.ictp.trieste.it
Тема: все, что вам захочется
http://www.ictp.trieste.it/cgi-bin/ICTPsmr/mkhtml/smr2htm\par l.pl?smr1099/Announcement
Автоматическое разбиение сообщений
Все бинарные файлы, размером более 300 килобайт и менее 6 мегабайт будут автоматически разбиваться на куски поменьше, по 300 кб каждый, и посылаются как вложения MIME типа Base64.
Все текстовые и HTML файлы, размером более 300 кб и менее 6 мб автоматически будут сжаты программой pkzip и в дальнейшем будут интерпретироваться как бинарные файлы, которые подвергаются кодировке и разбиению при пересылке.
Существует также возможность UUкодирования бинарных файлов с помощью опции UUEncode при запросе.
Разбиение сообщений по запросу
Если программное обеспечение для вашей электронной почты или шлюза имеет ограничение на размер файла менее 300 кб, вы можете запросить, чтобы Www4mail разбивал сообщения на файлы меньшего размера. Чтобы уменьшить это значение, используйте команду GETSIZE.
Например, следующая команда разбивает файл на куски по 10 кб:
Кому: www4mail@wm.ictp.trieste.it
Тема: все, что хотите
GETSIZE 10000 one option line only!
URL_here
GETSIZE устанавливает размер ответов www4mail в байтах. Никакие другие символы не допускаются. В теле сообщения, которое вы отправляете на Www4mail, но пишите каждый URL на отдельной строке.
Когда www4mail отвечает на команду GETSIZE, запрошенный документ всегда пересылается в виде вложения. Вам может понадобиться заставить вашу почтовую программу сохранить их с помощью опции сохранения файла.
Наконец, соответствующее приложение или команда могут быть использованы для того, чтобы соединить все куски (на Unix используйте:
"cat file.1 file.2 file.3 > file", а в Dos используйте
"copy /b file.1+file.2+file.3 file").
Если вы отображаете в своем браузере документ, посланный Www4mail и хотите вытащить выбранные документы, разбитые на более мелкие куски, вы можете ввести максимальный размер ответов от Www4mail в окне около кнопки "Get selected documents" в нижней части вебстраницы, которую вы просматриваете.
Как вытащить любую часть разделенного сообщения
Следующая команда позволит вам вытащить любую часть разбитого сообщения:
Отправьте сообщение
Кому: www4mail@wm.ictp.trieste.it
Тема: Все, что вздумается
GETPART 1, 2 3 , 5-8 one option line only!
GETSIZE 10000 one option line only!
URL_here
GETPART устанавливает число частей, которое необходимо возвратить в каждом сообщении от www4mail. Если GETSIZE не указан, www4mail использует значения по умолчанию, см. раздел, посвященный автоматическому разбиению сообщений.
Когда www4mail отвечает на команду GETPART, запрошенный документ всегда пересылается как вложение. Вам возможно придется заставить свою почтовую программу сохранить эти части с помощью опции сохранения файла. Затем эти куски придется соединять с помощью программы или команды.
UUкодирование сообщений
Следующая команда позволит вам получить любой документ в формате
UUEncode.
Отправьте сообщение
To: www4mail@wm.ictp.trieste.it
Subject: (... whatever you like)
XUUENCODE
URL_here
Когда www4mail отвечает на команду XUUENCODE, запрошенный документ всегда посылается в теле сообщения. Www4mail всегда будет посылать дополнительные сообщения с вашей статистикой. Если запрашиваемый файл слишком большой, вы можете использовать команду GETPART, чтобы установить номер частей, которые должны возвращаться в каждом почтовом сообщении от www4mail, и команду GETSIZE, чтобы установить размер ответного сообщения от www4mail в байтах. Например,
To: www4mail@wm.ictp.trieste.it
Subject: (... whatever you like)
GETPART 1, 2 3 , 5-8 (use one option line only!)
GETSIZE 10000 (use one option line only!)
XUUENCODE
URL_here
После декодирования каждого фрагмента, их придется соединять с помощью соответствующей программы или команды.
Вытаскиваем вебстраницы в виде файлов Post Script
Следующая команда позволит вам вытащить любой документ, преобразованный в файл Post Script (включая рисунки, если они имеются, и т.д.). Отправьте сообщение
To: www4mail@wm.ictp.trieste.it
Subject: (... whatever you like)
GETPS one option line only!
URL_here
Если совместно с GETPS не используются другие команды (такие как GETSIZE, которые задают размер ответных сообщений от www4mail), www4mail использует значения по умолчанию.
Когда www4mail отвечает на команду GETPS, запрошенный документ всегда отправляется в виде вложения. Вам придется затем сохранять эти файлы, и при необходимости соединять их.
Если размер запрошенного файла превысит 300 кб, он будет разбит на несколько электронных почтовых сообщений. Потом эти куски придется соединять.
Чтобы получать вебстраницы в виде файлов Post Script в формате UUEncode и в теле сообщения, можно воспользоваться следующей опцией To: www4mail@wm.ictp.trieste.it
Subject: (... whatever you like)
GETPS (use one option line only!)
XUUENCODE
URL_here
Www4mail всегда будет посылать дополнительное сообщение с вашей статистикой.
Запросы на http/ftp сайты, защищенные паролем Поддержка авторизации пользователя для сайтов, защищенных паролями, также доступна в www4mail. Чтобы получить доступ к такому сайту или странице, которые соответствуют шаблону:
`protocol://username:password@site/directory' вы должны знать (и затем передать)
правильное имя пользователя и пароль.
В таких случаях, посылайте сообщение на
To: www4mail@wm.ictp.trieste.it
Subject: (... whatever you like)
и напишите в теле сообщения:
http://username:password@site/path
или
ftp://username:password@site/path
где site/path - это машина, домен, директория, файл, который вы хотите вытащить, а символ @ (собака) используется для того, чтобы отделить строку
с именем пользователя и паролем от строки с сайтом/путем.
После того, как вы получили ответ от www4mail, вы сможете переходить на такие защищенные страницы без дополнительной авторизации. Www4mail все сделает за вас автоматически.
Конечно, вы можете получить ту же самую информацию, в теле сообщения, и в виде простого текстового файла, добавив опции GET или SEND, или как исходник HTML, добавив опции GET SOURCE, SOURCE или XSOURCE.
Но пожалуйста, обратите внимание, что пароли, переданные таким образом, как и все остальное в электронной почте, не обязательно являются приватными, поскольку:
- www4mail соединяется во всех трансакциях локально.
- HTTP/FTP трансакции с любым сервером через электронную почту не
шифруются, и могут быть перехвачены на интернет.
Квотные ограничения для www4mail
На дату написания данного руководства, квотные ограничения для свободного использования www4mail ограничен 300 запросами в неделю (в категориях HTML, или текст, или исходник.
Если вы превысите свою квоту, www4mail проинформирует вас сообщением об ошибке 503 (услуга недоступна, превышена квота), и после этого ответы на ваши запросы отправляться не будут!
Предупреждение, ваша квота будет значительно отличаться, если вы будете запрашивать бинарные файлы, такие, как .exe, .zip. Такие файлы будут засчитываться от 3 до 5 раз больше. Рисунки, такие, как .gif, .jpg, будут засчитываться в 20 раз выше. Wwwmail предназначен для того, чтобы обеспечить доступ к (HTML) документам и осуществлять поиск в них.
Каждый ответ от www4mail содержит информацию о вашей оставшейся квоте и дне вашего последнего доступа (сводка за неделю). Например, в теле каждого ответного сообщения от www4mail вы найдете что-нибудь вроде этого:
Dear User,
Statistics of your (per week) usage of this service
===================================================
Remaining Quota : 295
Used Quota : 5
Last access : html on Tue Dec 8 14:08:04 1998
Также есть возможность проверять свою еженедельную квоту в любое время, надо только отправить сообщение
To: www4mail@wm.ictp.trieste.it
Subject: (... whatever you like)
и написать в теле сообщения:
XMYQUOTA
Контрольный список доступа www4mail (ACL)
Пожалуйста, обратите внимание, что хотя www4mail является бесплатной служборй, которая позволяет путешествовать по всему интернету с помощью электронной почты, она не будет предоставлять доступ к вебсайтам/документам, которые защищены авторскими правами или залицензированы, как большинство онлайновых газет/журналов, библиотечных CD-ромов, и т.д.
Www4mail ведет свой собственный приватный контрольный список доступа (ACL), который постоянно обновляется. См. ниже раздел "отказ от гарантий".
FTP и бинарные файлы через www4mail
Если вы используете www4mail для получения графических файлов (расширения .jpg, .gif), файлов с программами (расширения .tar, .hqx), документов Word (расширение .doc), или документов WordPerfect (расширение .wp), или сжатых файлов (расширение ,gz, .z), то www4mail будет пересылать такие файлы в виде вложений.
Например, если вы отправите сообщение
To: www4mail@wm.ictp.trieste.it
Subject: (... whatever you like)
ftp://ftp.andrew.cmu.edu/pub/mpack/mpack15d.zip
или
http://www.ictp.trieste.it/images/ProfSalam.gif
вы получите бинарное сообщение, в виде MIME вложения в формате Base64.
Также существует возможность UUкодирования бинарных файлов с помощью опции UUEncode по запросу. Пожалуйста, обратите внимание, что есть ограничение на число байт, которое www4mail вам пошлет!
Если файл имеет размер более 300 килобайт, www4mail разобьет его на два или более куска и пошлет эти куски в отдельных сообщениях. В этом случае вам придется восстанавливать первоначальный файл, соединив все отдельные части в единый файл.
При запросах на бинарные файлы ваша квота будет в значительной степени отличаться!
Специальные опции www4mail
www4mail-v2.0 был значительжно улучшен, чтобы включить специализированные опции, предназначенные для установки языка и набора символов; разрешения ссылок на рисунки и т.д. Эти новые опции были введены в результате обратной связи с испытателями в первые месяцы работы.
Например, вы также можете пользоваться любой из следующих опций:
XIMAGE
Эта опция включит ссылки на рисунки в документе, посланном в виде
вложения.
XLANGUAGE xx , xx
Эта опция позволяет установить список (разделенных запятыми) предпочитаемых языков для получения документа (пожалуйста, обратите внимание, что поддержка языков будет работать только в том случае, если она доступна на запрашиваемом сервере). Примеры доступных языков включают: de (немецкий), en (английский), fr (Французский).
XCHARSET
Эта опция позволяет задать список (разделенных запятыми) предпочтительных наборов символов для получения документов (пожалуйста, обратите внимание, что поддержка наборов символов будет работать только в том случае, если она поддерживается на запрашиваемом вебсервере). Примеры доступных наборов символов включают:
euc-cn (для китайского языка), euc-jp (для японского), iso-8859-6 (для
арабского), и т.д.
XMIME
Некоторые почтовые программы сами могут отображать text/html непосредственно. Для таких программ www4mail может генерировать другой заголовок Content-Type: для документов HTML. В этом случае, используя команду XMIME, вы заставляете пересылать HTML вложения с использованием заголовка MIME application/html. Это полезно, если вы хотите сделать так, чтобы ваш почтовый клиент не открывал самостоятельно вложения в формате HTML.
XURLCODE
При заполнении HTML форм через электронную почту, может случиться так, что ваши введенные данные где-нибудь повредятся где-нибудь по дороге, и в этом случае вы можете получить от вебсервера запрос повторно послать данные. Используя опцию XURLCODE, www4mail попытается проинструктировать ваш браузер, что данные перед отправкой по электронной почте необходимо кодировать. Это должно защитить целостность введенных вами данных и позволит передачу полей формы.
XBYJS
Некоторые браузеры не могут пересылать данные по электронной почте, например MSIE версии 3.0. Эта проблема обычно обнаруживается, когда вы проверяете ссылки, которые вы хотели бы получить и выбираете кнопку "Получить выбранные документы". А потом открывается ваш почтовый клиент, открывается окно создания сообщения, в поле для адреса написан адрес www4mail, а в теле сообщения пусто. Вы можете использовать опцию XBYJS чтобы обойти эту проблему, предполагая, что вы используете браузер, совместимый с JavaScript. Примечание: эта обработка пытается заполнить строку Тема, а не тело сообщения, что необходимо для www4mail. Но если вы заметите, что строка Тема: пуста, вам придется вырезать все символы, начиная с вопросительного знака в поле Кому: и вручную вставить их в строку Тема: .
Отказ от гарантий
Научный компьютерный отдел международного центра теоретической физики имени Абдус Салама является поставщиком исходного текста на Perl для www4mail. Он не может быть ответственным за содержание, представление или неверное представление документов, полученных из интернет с помощью www4mail. Все запросы, использование или неправильное использование этой службы сохраняется в файлах протокола.
Обновленную информацию относительно www4mail можно найти на
http://www.ictp.trieste.it/~www4mail
Если вы хотите послать свои комментарии, пожелания или сообщения об ошибках в www4mail, пишите по адресу
Желаем вам счастливых путешествий по интернет с помощью www4mail!