Co myśli sobie o nas Google, kiedy w wyszukiwarce wpiszemy niechcący „yourube” zamiast „youtube”?

Google od dziesiątek lat musi radzić sobie z codziennymi błędami – nie tylko własnymi, ale i użytkowników sieci. I to właśnie te drugie są większym wyzwaniem.

1 na 10 wyszukiwanych haseł jest błędnie wpisywanych

To całkiem interesująca statystyka. Okazuje się, że wyszukując jakieś hasła w Google, bardzo często się mylimy. Albo podajemy nieprecyzyjne zapytania, albo po prostu sadzimy literówki. W takiej sytuacji, Google najpierw musi „domyślić się”, o co nam chodzi, a później przedstawić poprawne wyniki wyszukiwania. Trudna sprawa? Oj, tak! Specjaliści na blogu Google zdradzają, że ulepszają ten proces od ponad 20 lat!

Reklama

Pomyłki we wprowadzaniu frazy są częste, gdy korzystamy z klawiatury w smartfonie, ale pojawiają się także, gdy naciskamy klawisze pełnowymiarowych klawiatur fizycznych. Bywa, że palec niechcący omsknie się nam na sąsiadujący klawisz i nieszczęście gotowe.

Przykład: Google musi brać poprawkę na to, że czasem zamiast „youtube” wpiszemy w okno wyszukiwania coś w rodzaju „7outub”, „yoitubd” czy „yourube”. Wyszukiwarka rozpoznaje ponad 10 tysięcy różnych odmian zapytań „YouTube”, a to wszystko przecież dotyczy tylko jednego hasła!

An animation of a misspelled search for "gobbledygook"

Google ma grube rozkminy, o co ci może chodzić

Niezależnie od tego, jak częste są nasze błędy, niektórzy z nas są na tyle wybitnymi jednostkami, że potrafią generować wręcz niemożliwe literówki, wykraczające poza ogólny schemat. Systemy sprawdzania pisowni Google muszą wtedy dwoić się i troić, by zorientować się, o co nam chodzi. Zwykle sugerują się one układem klawiatury. Otóż jeśli przypadkowo w jakimś słowie użyliśmy „u”, to algorytmy będą bardziej skłonne kombinować z użyciem liter „i” czy „j” niż z „s”, które znajduje się po drugiej stronie klawiatury. Choć wydaje się to dość oczywistym sposobem na rozwiązywanie „zagadek” związanych z pomyłkami, odpowiedniego stylu podejścia do problemu trzeba było maszyny nauczyć.

An animation of a misspelled search for YouTube

Dzięki coraz większym postępom w technologii, można było opracować całkiem nowy algorytm pisowni, który wykorzystuje sieci neuronowe. W ten sposób, Google znacznie lepiej uczy się i przewiduje pożądane frazy, nawet w wypadku błędów, które „widzi” po raz pierwszy. A to wszystko dzieje się błyskawicznie, bo tak złożony model, z 680 milionami parametrów, kończy pracę w czasie krótszym niż dwie milisekundy.

Skąd wiedzieli?

Być może spotkaliśmy z reakcją wyszukiwarki Google na nasze źle sformułowane zapytanie – wtedy pojawia się linijka „czy chodziło Ci o…”, ukazująca alternatywę, o którą zdaniem algorytmów nam chodzi. Jednak nawet wtedy sugestie te potrafią nie być trafne – zwłaszcza gdy wyszukujemy nazwy jakiejś dziwnie brzmiącej firmy (i popełnimy w jej zapisie jakiś błąd).

Nikt przecież nie powiedział, że wujek Google wie wszystko.