I znowu wysyp jakiegoś badziewia, maile z cyklu ze kumulacja ze graj online i takie tam. Upierdliwe i w duzych ilosciach. Ale świetnie wycina to reguła wzmacniająca czyli taka co wystąpienie dwóch lub więcej reguł punktuje. Tu mamy wysokiego bayesa( ktoś musi oczywiście używać) oraz link-unsubscribe.
Oto w sumei trzy reguly
- Sprawdza czy Bayes jest wysokie
- czy jest link unsubscribe
- właściwa sprawdza czy wystąpily dwa poprzednie
meta ZABOJCASPAMU_BAYES_HIGH (BAYES_80 + BAYES_90+ BAYES_95 + BAYES_99)>0 describe ZABOJCASPAMU_BAYES_HIGH Bayes high score ZABOJCASPAMU_BAYES_HIGH 0.001
header ZABOJCASPAMU_UNSUBS exists:List-Unsubscribe describe ZABOJCASPAMU_UNSUBS Zawiera List-Unsubscribe score ZABOJCASPAMU_UNSUBS 0.1
meta ZABOJCASPAMU_BAYESUNSUBS ( ZABOJCASPAMU_BAYES_HIGH && ZABOJCASPAMU_UNSUBS ) describe ZABOJCASPAMU_BAYESUNSUBS ( ZABOJCASPAMU_BAYES_HIGH && ZABOJCASPAMU_UNSUBS ) score ZABOJCASPAMU_BAYESUNSUBS 2.5
Akurat List-Unsubscribe mają wszystkie porządne mailing listy, tak więc ta reguła jest bezużyteczna a nawet gorzej (bo FP).
Z drugiej strony, wszystkie które ja czytam (debian-*, LKML-*, dng, itd) mają hyzia na punkcie netykiety, czyli żadnych HTMLi ani itp paskudztw, czyli raczej mała szansa aby sensowny mail dostał dużo na Bayesie. Ale jak ktoś ma na serwerze użytkowników biznesowych którzy korzystają z mailing list (moi o ile mi wiadomo nie), to FP będzie bardzo, bardzo dużo.
Niby masz racje ale ta regula dziala i nie generuje FP. Reguly wzmacniajace nie wymyslam tylko patrze na statystyki wystepowania regul. U mnie zauwazam sporadycznie FP