В борьбу со спамом вступают специалисты по ДНК
Специалисты по биоинформатике из Исследовательского Центра имени Томаса Ватсона (Thomas J. Watson Research Center), в Нью-Йорке, разработали технологию для борьбы со спамом, поступающим с электронной почтой. Эта технология в свое время была названа Chung-Kwei, в честь китайского талисмана, защищающего дом от злых духов. Ученые первоначально использовали эту технологию для поиска одинаковых фрагментов в структуре ДНК. На этот раз вместо ДНК исследователи проанализировали алгоритмы 65 тыс. писем со спамом.
Каждое электронное письмо обрабатывалось как длинная цепь ДНК-подобных характеристик. Технология обнаружила 6 млн. повторяющихся фрагментов. Каждый из таких фрагментов представляет собой специфичную последовательность текстов и чисел, которые появляются более чем в одном из “непрошенных” посланий. Такой же обработке была подвергнута группа электронных посланий, не относящаяся к категории спамов. После этого из технологии были изъяты фрагменты, которые появлялись в обеих группах, а остались в работе лишь фрагменты, характерные для спамов. Затем вся поступающая почта была проанализирована на предмет наличия в письмах того или иного “спамовского” фрагмента. Если число таких признаков в послании было высоко, послание относилось к категории спама, если - низко, то - к категории "здорового" послания.
Благодаря этой технологии возможно идентифицировать до 97% спама. Именно поэтому корпорация IBM уже планирует включить Chung-Kwei в набор противоспамовских программ SpamGuru.
Каждое электронное письмо обрабатывалось как длинная цепь ДНК-подобных характеристик. Технология обнаружила 6 млн. повторяющихся фрагментов. Каждый из таких фрагментов представляет собой специфичную последовательность текстов и чисел, которые появляются более чем в одном из “непрошенных” посланий. Такой же обработке была подвергнута группа электронных посланий, не относящаяся к категории спамов. После этого из технологии были изъяты фрагменты, которые появлялись в обеих группах, а остались в работе лишь фрагменты, характерные для спамов. Затем вся поступающая почта была проанализирована на предмет наличия в письмах того или иного “спамовского” фрагмента. Если число таких признаков в послании было высоко, послание относилось к категории спама, если - низко, то - к категории "здорового" послания.
Благодаря этой технологии возможно идентифицировать до 97% спама. Именно поэтому корпорация IBM уже планирует включить Chung-Kwei в набор противоспамовских программ SpamGuru.