100 milionów e-maili każdego dnia. Tyle spamu blokuje Gmail dzięki technologii uczenia maszynowego

Google ogłosiło, że korzysta obecnie z nowej technologii zabezpieczeń kont użytkowników, opartej na otwartoźródłowej bibliotece programistycznej TensorFlow. Algorytmy uczenia maszynowego blokują spam, który trudno było wykryć dotychczasowymi metodami.

Dzięki wykorzystaniu biblioteki TensorFlow, powstałej w 2015 roku przy udziale Google Brain Team, filtrowanie spamu na naszych skrzynkach pocztowych Gmail jest jeszcze bardziej efektywne. Obecnie algorytmy potrafią blokować wiadomości oparte na obrazach, e-maile z ukrytą zawartością oraz pochodzące z nowo utworzonych domen, które próbują udawać mało popularne strony, wysyłające niewielkie ilości komunikatów, a tak naprawdę również rozsyłają spam.

Uczenie maszynowe jest skuteczne, ponieważ pomaga zidentyfikować wzorce w dużych zbiorach danych. My, ludzie, zwykle nie operujemy na tak dużych zasobach informacji, stąd reguły dotyczące filtrów antyspamowych, tworzone przez pracowników Google’a, potrafią być bardzo dokładne, ale bywa, że brakuje im szerszej perspektywy.

tensorflow_gmail.gif

Przy milionach e-maili dziennie, proces nadawania odpowiednich reguł filtrom może być dla człowieka skomplikowane i czasochłonne. TensorFlow zawiera wiele narzędzi, które czynią ten proces łatwiejszym i bardziej wydajnym. Umożliwia na przykład wypróbowywanie różnych technik rozpoznawania spamu jednocześnie. Dotąd odbywało się to zwykle, stosując zasadę kolejki – sprawdzano skuteczność jednej, a następną testowano dopiero po zakończeniu działania pierwszej.

Dzięki otwartemu charakterowi TensorFlow, Google może eksperymentować z algorytmami uczenia maszynowego również w innych obszarach związanych z bezpieczeństwem, takimi jak wyłudzanie danych czy wykrywanie złośliwego oprogramowania.

W ten sposób nasze skrzynki mailowe są bardziej przejrzyste. Puchnie tylko folder ze spamem.

 

źródło: Google blog przez fonearena