[sa-conf] autolearn

Victor Ustugov victor на corvax.kiev.ua
Чт Мар 10 12:33:00 EET 2005


Nikolai V. Ivanyushin wrote:

>> вот у asm'а на abbyy самообучение наверняка включено. и обучает он 
>> bayes'а регулярно.
>>
>> но во вторник к нему привалила туча спама, которому его bayes начислил 
>> 0 баллов и дал вероятность 50%, а мой - начислил 5.4 балла при 
>> вероятности от 99 до 100%
> 
> А почему так у асма случилось?

вообще, у спамассассиновой реализации байеса очень капризный баланс 
между спамовыми и не спамовыми токенами. в общем, можно легко 
"переобучить" байес, когда его вообще начнет сильно плющить. поэтому я 
где-то раз в полгода или год убиваю базку байеса, переобучаю его. для 
этого храню архив спама за последние N лет. при этом храню копии 
неспамовых писем, которым байес начислил баллы (false posotoves). ну и 
просто неспамовых писем в резервных копиях почты просто навалом.

я не знаю, может это я что-то не так делаю, но если я не переобучаю 
байес время от времени, его эффективность сильно падает

-- 
Best wishes Victor Ustugov   mailto:victor на corvax.kiev.ua
public GnuPG/PGP key:        http://victor.corvax.kiev.ua/corvax.asc
ICQ: 77186900, 32418694      CRV2-RIPE, CRV-UANIC




Подробная информация о списке рассылки sa-conf