Co myśli sobie o nas Google, kiedy w wyszukiwarce wpiszemy niechcący „yourube” zamiast „youtube”?

Google od dziesiątek lat musi radzić sobie z codziennymi błędami – nie tylko własnymi, ale i użytkowników sieci. I to właśnie te drugie są większym wyzwaniem.

1 na 10 wyszukiwanych haseł jest błędnie wpisywanych

To całkiem interesująca statystyka. Okazuje się, że wyszukując jakieś hasła w Google, bardzo często się mylimy. Albo podajemy nieprecyzyjne zapytania, albo po prostu sadzimy literówki. W takiej sytuacji, Google najpierw musi „domyślić się”, o co nam chodzi, a później przedstawić poprawne wyniki wyszukiwania. Trudna sprawa? Oj, tak! Specjaliści na blogu Google zdradzają, że ulepszają ten proces od ponad 20 lat!

Pomyłki we wprowadzaniu frazy są częste, gdy korzystamy z klawiatury w smartfonie, ale pojawiają się także, gdy naciskamy klawisze pełnowymiarowych klawiatur fizycznych. Bywa, że palec niechcący omsknie się nam na sąsiadujący klawisz i nieszczęście gotowe.

Przykład: Google musi brać poprawkę na to, że czasem zamiast „youtube” wpiszemy w okno wyszukiwania coś w rodzaju „7outub”, „yoitubd” czy „yourube”. Wyszukiwarka rozpoznaje ponad 10 tysięcy różnych odmian zapytań „YouTube”, a to wszystko przecież dotyczy tylko jednego hasła!

An animation of a misspelled search for "gobbledygook"

Google ma grube rozkminy, o co ci może chodzić

Niezależnie od tego, jak częste są nasze błędy, niektórzy z nas są na tyle wybitnymi jednostkami, że potrafią generować wręcz niemożliwe literówki, wykraczające poza ogólny schemat. Systemy sprawdzania pisowni Google muszą wtedy dwoić się i troić, by zorientować się, o co nam chodzi. Zwykle sugerują się one układem klawiatury. Otóż jeśli przypadkowo w jakimś słowie użyliśmy „u”, to algorytmy będą bardziej skłonne kombinować z użyciem liter „i” czy „j” niż z „s”, które znajduje się po drugiej stronie klawiatury. Choć wydaje się to dość oczywistym sposobem na rozwiązywanie „zagadek” związanych z pomyłkami, odpowiedniego stylu podejścia do problemu trzeba było maszyny nauczyć.

An animation of a misspelled search for YouTube

Dzięki coraz większym postępom w technologii, można było opracować całkiem nowy algorytm pisowni, który wykorzystuje sieci neuronowe. W ten sposób, Google znacznie lepiej uczy się i przewiduje pożądane frazy, nawet w wypadku błędów, które „widzi” po raz pierwszy. A to wszystko dzieje się błyskawicznie, bo tak złożony model, z 680 milionami parametrów, kończy pracę w czasie krótszym niż dwie milisekundy.

Skąd wiedzieli?

Być może spotkaliśmy z reakcją wyszukiwarki Google na nasze źle sformułowane zapytanie – wtedy pojawia się linijka „czy chodziło Ci o…”, ukazująca alternatywę, o którą zdaniem algorytmów nam chodzi. Jednak nawet wtedy sugestie te potrafią nie być trafne – zwłaszcza gdy wyszukujemy nazwy jakiejś dziwnie brzmiącej firmy (i popełnimy w jej zapisie jakiś błąd).

Nikt przecież nie powiedział, że wujek Google wie wszystko.