TPmail тестовой вывод.

Почтовый пакет TPmail для Unix систем

Выбор языка

[анг]  [рус]


Начало

Документация

Поддержка

Новости

Ресурсы

Контакты


Фильтрация спама с помощью алгоритмов LMTA и RHTA

Алгоритм LMTA (Legacy Mail Testing Algorithm) является одним из немногих успешных алгоритмов неконтентной фильтрации нелегитимных сообщений (спам почты). Алгоритм LMTA на входе должен иметь IP адрес хоста-отправителя, почтовый адрес отправителя из конверта сообщения (envelope-from address), имя хоста на стадии helo протокола SMTP. Использую эти три величины LMTA выдает ответ о легитимности отправителя для выбранных параметров, или, говоря научным языком, алгоритм указывет на связь или корреляцию между этими величинами. Поскольку нам нужем определенный ответ "да" или "нет", то эвристический результат мы превращаем в 1 или 0.
Как и любой сложной эвристический алгоритм со параметрической настройкой (например, алгоритмы контентной фильтрации) имеет "мягкие" и "жесткие" условия приема. Очевидно, что сдвигаясь в ту или иную сторону, можно сокращать прохождение спама, но увеличивать вероятность отказа в приеме легитимной почты, или наоборот. По умолчанию, анти-спам фильтр пакета TPmail имеет "мягкий" режим приема писем. Настройки алгоритма удалены из базовой комплекта алгоритма для избежания многих проблем. Настройка параметров алгоритма требует требует очень хорошего знания, опыта и понимания таких протоколов как SMTP, работы серверов доменных имен (DNS) и еще ряда вещей, которые достаточно сложны по своей природе. Поэтому рядовому пользователю или администратору проще работать с базовыми настройками, рассматривая LMTA как удачный "черный ящик". С выбранными базовыми настройками LMTA успешно работал на внешних испытаниях в организациях с различными объемами и характером почтового трафика.
Самой сильной и удивительной стороной LMTA является возможность отсечения спама без принятия самого сообщения еще на стадии обработки конверта письма без использования серверов черных списков или что-то аналогичного.




Алгоритм RHTA (Received Header Testing Algorithm) проверяет служебные поля сообщения на предмет соответствия стандартам RFC. Этот алгоритм, конечно, принадлежит к классу алгоритмов контентной фильтрации. К сожалению, алгоритм никому не прощает ошибок при заполнении служебных полей письма. Это относится к спам-сообщениям или обычным письмам. В среднем алгоритм отвергает более 30 процентов сообщений по тем или иным причинам. В чем же его ценность тогда? В том, что он обращает внимание пользователя на ошибки или странности в служебной письма. Например, спам письма часто пропускают определенные поля по той причине, что в в многих спам базах есть адреса, но нет верных сведений о адресатах. Это может сразу подсказать пользователю, что данные письма можно просто игнорировать.



Какова эффективность неконтентной фильтрации при использовании LMTA? Такое всегда трудно оценить, лучше всего опираться на получаемую статистику при помощи sma_stat и обратную связь с пользователями. К тому же каждая организация имеет свои правила при работе с электронной почтой. На тестовых прогонах алгоритм показывал эффективность до 98 процентов. Однако создатель LMTA достаточно скептически односится к подобного рода цифрам, как и к цифрам типа 99,9999 процентам от всевозможных пакетов контентной фильтрации. Все подобные цифры получаются на определенных выборках и бессмысленны вне них. А обобщения здесь вообще неуместны.



Алгоритм LMTA не работает при легальной доставке спама или при пересылке письма от доверенного отправителя через другой почтовый сервер (например, @mail.ru через провайдера в Южной Африке). Т.е. налицо наличие ошибки первого и второго рода. Однако эти ограничения присущи самой природе алгоритма. Такого рода ошибки должны закрываться статическими или динамическими листами приема или нужно использовать средства контентной фильтрации.



Насколько алгоритм LMTA сравним со всевозможными алгоритмами контентной фильтрации? Сравнить их крайне тяжело. Во-первых, алгоритм LMTA это всего лишь один алгоритм, а на другой стороне нет одного алгоритма, а есть группа алгоритмов, составляющая большую и сложную систему фильтрации. А во-вторых, есть взять классические методы сравнения алгоритмов (время исполнения и рабочий объем памяти), то LMTA окажется сразу победителем. В самом деле, скорость работы алгоритма LMTA не зависит от объема и контента сообщения, решение о приеме сообщения вырабатывается еще до приема самого сообщения, и алгоритму не нужны огромные базы сигнатур вместе с комнатами, полными экспертов-классифиакторов. LMTA не нужны операторы обучения для баз знаний, не нужно переобучения. Это единственный алгоритм из класса "install-run-forget". Но LMTA нельзя рассматривать как абсолютный победитель, ибо, если никто не может показать 100% результата на произвольной выборке, то победителя нет. Отметим лишь, что в среднем алгоритм LMTA удачнее "определяет" спам и делает это быстрее и эффективнее, чем системы контентной фильтрации.



Заключительный вывод может выглядить так.
Используйте алгоритм LMTA, но если у Вас есть любимая система контентной фильтрации, несложная в управлении, то поставив ее после LMTA вы сможете получить еще более выдающиеся результаты. Особенно, если при статистической обработке Вы будете использовать достоверные статистические результаты, извлеченные при помощи модуля sma_stat. Именно цифры sma_stat дадут Вам понимание истинного положения дел с почтой в Вашей организации, а не произвольные данные поставщиков программных продуктов.
Правда, практически все организации, установившие пакет TPmail, не используют каких-либо систем контентной фильтрации.



Valid HTML 3.2! Авторское Право © 2006 Дмитрий Стефанков Last modified: $Date: 2007-09-19 00:48:13+04 $ Powered by FreeBSD. Powered by Apache. Powered by OpenSSL.