To odwieczny problem: polskie litery. Ogonki i kodowania. Jak wychwycić to mailach. Kodowań dużo więc możliwości ogromne. A rozwiazanie proste. Wystarczy zastąpić polską literem ciągiem .{1,9} czyli np
/to jest kąt/ zastępujemy /to jest k.{1,9}t/
Tak to działa i jest skuteczne. Szybkośc przetwarzania zapewne trochę spada ale radzi sobie dobrze z polkimi literami.
Nie chcę być krytykantem ale ogromna ilość błędów jest w tym poście. Rozumiem że czasami zapisuje się rzeczy na szybko, ale to już trochę przesada…
Poza tym, ta reguła jest IMO słaba. W ten sposób znajdzie się też fraza „to jest kompot” i wiele innych fraz które niekoniecznie będą wskazywały na spam.
oczywiscie to przykład. chodzi o dluzsze frazy .
To może warto by było użyć jakiegoś faktycznego przykładu?
Przykładowo chciałbym zablokować e-maile z wyrażeniem E-PASAŻ.EU. Wpisując / E-PASA.{1,9}\.EU/ blokuję też E-PASAŻER.EU, E-PASADENA.EU i inne. Nie wiem jak duższa fraza miała by się przyczynić do lepszego działania tej reguły.
Może w ten sposób
E-PASA[^\A-Z]\.EU
jeżeli chodzi o słowo E-PASAŻ.EU