Victor Ustugov wrote:
> вообще, у спамассассиновой реализации байеса очень капризный баланс
> между спамовыми и не спамовыми токенами. в общем, можно легко
> "переобучить" байес, когда его вообще начнет сильно плющить. поэтому я
> где-то раз в полгода или год убиваю базку байеса, переобучаю его. для
> этого храню архив спама за последние N лет. при этом храню копии
> неспамовых писем, которым байес начислил баллы (false posotoves). ну и
> просто неспамовых писем в резервных копиях почты просто навалом.
>> я не знаю, может это я что-то не так делаю, но если я не переобучаю
> байес время от времени, его эффективность сильно падает
Я свой начал обучать где-то в декабре и закончил в январе, периодически
подкидывая по паре писем по сей день. Есс-но что количество не-спама (ham'а)
было существенно бОльшим при обучении (раза в три). Но я не думаю что это
повод... Тем более что этих seminar'ов приходило уже немеряно!