[sa-conf] autolearn

Alex Miller asm на asm.kiev.ua
Чт Мар 10 13:10:58 EET 2005


Victor Ustugov wrote:

> вообще, у спамассассиновой реализации байеса очень капризный баланс 
> между спамовыми и не спамовыми токенами. в общем, можно легко 
> "переобучить" байес, когда его вообще начнет сильно плющить. поэтому я 
> где-то раз в полгода или год убиваю базку байеса, переобучаю его. для 
> этого храню архив спама за последние N лет. при этом храню копии 
> неспамовых писем, которым байес начислил баллы (false posotoves). ну и 
> просто неспамовых писем в резервных копиях почты просто навалом.
> 
> я не знаю, может это я что-то не так делаю, но если я не переобучаю 
> байес время от времени, его эффективность сильно падает

	Я свой начал обучать где-то в декабре и закончил в январе, периодически 
подкидывая по паре писем по сей день. Есс-но что количество не-спама (ham'а) 
было существенно бОльшим при обучении (раза в три). Но я не думаю что это 
повод... Тем более что этих seminar'ов приходило уже немеряно!





Подробная информация о списке рассылки sa-conf