gemini-2-5-modele-ai-google-edytowane-w-gemini
źródło: Google, edytowanie obrazu w Gemini

Gemini z potężną aktualizacją. Nano Banana imponuje

Google wprowadziło nową wersję Gemini 2.5 Flash Image. To model, który znacząco podnosi możliwości edycji i generowania obrazów przez AI. Aplikacja potrafi nie tylko poprawiać zdjęcia i dodawać elementy, ale też zachować spójność wyglądu postaci. Ma jednak swoje ograniczenia.

Edycja obrazów w Gemini. Co potrafi Nano Banana?

Gemini już wcześniej pozwalało na edycję obrazów, jednak jego najnowsza aktualizacja znacząco rozszerza te możliwości. Gemini 2.5 Flash Image, znany również pod nazwą „Nano Banana”, został zaprojektowany jako narzędzie, które ma umożliwić szybkie i precyzyjne poprawki tam, gdzie wcześniej potrzebne były skomplikowane programy graficzne, takie jak np. Photoshop.

Najważniejszą nowością jest umiejętność zachowania spójności wyglądu postaci w różnych scenach i sytuacjach. Oznacza to, że użytkownik może wgrać własne zdjęcie, a następnie zobaczyć siebie w innych strojach, miejscach czy nawet w odmiennych epokach, bez obawy o to, że model „zgubi” charakterystyczne cechy twarzy. Kiedy do tej pory próbowało się to zrobić, często mogliśmy nie rozpoznać samych siebie.

Drugą kluczową zmianą jest możliwość dokonywania precyzyjnych edycji na podstawie zwykłych poleceń tekstowych. Zamiast żmudnego używania narzędzi do wymazywania czy zaznaczania fragmentów zdjęcia, wystarczy wpisać krótką instrukcję, aby usunąć osobę ze zdjęcia, rozmyć tło, dodać kolor do czarno-białej fotografii albo zmienić pozę bohatera. Dzięki temu edycja staje się dostępna także dla osób, które nigdy wcześniej nie korzystały z profesjonalnych programów graficznych.

Model oferuje także opcję łączenia obrazów, na przykład po to, by połączyć zdjęcie właściciela i jego psa w jednej scenie lub sprawdzić, jak wyglądałby salon po zmianie koloru ścian. I, choć ta funkcja brzmi imponująco, w praktyce nie zawsze działa perfekcyjnie. Gemini nadal ma trudności z realistycznym scalaniem dwóch różnych fotografii w jedno spójne ujęcie. Efekty bywają nienaturalne, proporcje mogą się nie zgadzać, a szczegóły łatwo zdradzają, że obraz został wygenerowany przez AI.

Aktualizacja pozwala też na wieloetapową pracę nad jednym zdjęciem. Można zacząć od dodania mebli do pustego pokoju, później zmienić kolor ścian, a następnie wprowadzić kolejne elementy dekoracyjne, bez ryzyka, że wcześniejsze zmiany zostaną zniekształcone. To podejście krok po kroku przypomina klasyczną pracę w Photoshopie, tyle że tu całość wykonuje się automatycznie na podstawie kilku prostych poleceń.

Warto dodać, że ten model potrafi też np rozwiązywać zadania matematyczne, czym chwali się Google we wpisie na swoim blogu.

źródło: Google

Jak sprawdzić nowy model?

Nowa wersja Gemini otwiera przed użytkownikami wiele możliwości, które jeszcze niedawno wymagały specjalistycznych umiejętności. Można z niej skorzystać bezpośrednio w przeglądarce za pomocą Google AI Studio, ale również w aplikacji Gemini na smartfony.

Poniżesz wrzucam Wam kilka próbek możliwości tego narzędzia wraz z promptami:

Tak jak widzicie możliwości Gemini są bardzo duże, wszystko jest kwestią (jak zwykle w przypadku korzystania z AI) odpowiedniego promptu i eksperymentowania. Nie jest to co prawda jeszcze poziom profesionalnego wykorzystania Photoshopa, ale dla wielu użytkowników dla domowych zastosowań w zupełności wystarczy.

Miłej zabawy!