Nikolai V. Ivanyushin wrote:
>> вот у asm'а на abbyy самообучение наверняка включено. и обучает он
>> bayes'а регулярно.
>>>> но во вторник к нему привалила туча спама, которому его bayes начислил
>> 0 баллов и дал вероятность 50%, а мой - начислил 5.4 балла при
>> вероятности от 99 до 100%
>> А почему так у асма случилось?
вообще, у спамассассиновой реализации байеса очень капризный баланс
между спамовыми и не спамовыми токенами. в общем, можно легко
"переобучить" байес, когда его вообще начнет сильно плющить. поэтому я
где-то раз в полгода или год убиваю базку байеса, переобучаю его. для
этого храню архив спама за последние N лет. при этом храню копии
неспамовых писем, которым байес начислил баллы (false posotoves). ну и
просто неспамовых писем в резервных копиях почты просто навалом.
я не знаю, может это я что-то не так делаю, но если я не переобучаю
байес время от времени, его эффективность сильно падает
--
Best wishes Victor Ustugov mailto:victor на corvax.kiev.ua
public GnuPG/PGP key: http://victor.corvax.kiev.ua/corvax.asc
ICQ: 77186900, 32418694 CRV2-RIPE, CRV-UANIC