13 maja 2024 r. OpenAI przedstawiło wiosenne nowości w ChatGPT. Poznaliśmy nowy, szybszy model GPT-4o. Poza tym OpenAI wprowadza wielkie zmiany dla użytkowników darmowej wersji ChatGPT. Co więc nowego w ChatGPT, czym się tak wszyscy zachwycają?

Nowy model ChatGPT-4o

Zespół AI przedstawił nam nowy model GPT: GPT-4o (“o” od “omni”). Jest wydajniejszy, szybszy i ma jeszcze lepsze umiejętności związane z przetwarzaniem tekstu, obrazu oraz dźwięku. Podobnie jak model GPT-4, omni może wyszukać w internecie informacje, które są potrzebne do udzielenia odpowiedzi na Twoje pytania.

Do tego nowy model ma być tańszy i bezpieczniejszy. Użytkownikom GPT Plus zwiększono pięciokrotnie limit dzienny. Nowe funkcje będą stopniowo udostępniane w kolejnych tygodniach. Cały livestream “Spring update” możesz obejrzeć tutaj, a poniżej przedstawiam Ci moim zdaniem najważniejsze zmiany.

Aktualizacja 21.05.2024.

Microsoft zaprezentował najnowsze możliwości Copilota wykorzystującego, jak wiemy model dostarczany przez OpenAI. Na prezentacji można zobaczyć np. jak Copilot uczy grać w Minecrafta oraz wiele innych ciekawostek 🙂

Jeszcze lepsze funkcje głosowe

“Żeby Cię lepiej słyszeć…”

Zaprezentowane funkcje przetwarzania mowy są jeszcze bardziej naturalne. Wszystko dzieje się w czasie rzeczywistym. Teraz możesz właściwie bez żadnych opóźnień prowadzić konwersację z czatem. W poprzednich modelach wyglądało to tak, że najpierw głos tłumaczony był na tekst, potem analizowany i przygotowana odpowiedź, a następnie tekst tłumaczony na głos. Brzmi nieco skomplikowanie, do tego chwilę trwało. Przez to tracone było wiele informacji.

Nowy model przetwarza wszystko bezpośrednio, dzięki temu potrafi analizować również ton głosu, emocje czy oddech. Na prezentacji świetnie sobie poradził z analizą oddechu i próbą uspokojenia prowadzącego.

Od teraz można będzie również przerywać modelowi. Konwersacja będzie bardziej naturalna, gdyż nie będzie już trzeba czekać aż skończy odpowiadać. (A do tego nie obraża się, gdy jej przerwiemy 🙂)

Oprócz tego, że czat rozpozna nasze emocje, sam również potrafi dostosować swój ton głosu, tempo i formę wypowiedzi do rozmowy. Właściwie to na prezentacji nawet zaśpiewał…

Rozpoznawanie i analiza obrazu

Czyli… “Żeby Cię lepiej widzieć…”

Czat może widzieć świat wokół nas. Potrafi rozpoznać obrazy, zdjęcia, selfie. Na prezentacji obejrzeliśmy jak czat pomaga rozwiązać równanie, którego zdjęcie zostało mu przekazane.

Podkreślam, że pomaga. Czyli nie podaje samego wyniku, a przeprowadza rozmówcę przez cały proces. Okazuje się, że z tego czata jest całkiem cierpliwy nauczyciel.

Zobaczyliśmy również, jak czat jest w stanie rozpoznać emocje na twarzy rozmówcy, a do tego zrozumieć ich przyczynę i odnieść się do kontekstu.

Zobaczyliśmy, że w najnowszej werji będzie możłiwe udostępnienie ekranu czatowi. Będzie można w czasie rzeczywistym rozwiązywać problemy, np. w kodzie, czy programie z którym właśnie pracujemy.

Zastosowanie takiej technologii jest niemal nieograniczone: medycyna, nauka, rozrywka. Kolejne prezentacje są coraz ciekawsze. Pozostaje nam tylko czekać aż technologia ta trafi pod strzechy.

Tłumaczenie w czasie rzeczywistym

To chyba jedna z najbardziej ekscytujących funkcji, jaka została pokazana. Dzięki przetwarzaniu głosowemu w czasie rzeczywistym zobaczyliśmy, jak AI tłumaczy rozmowę w dwóch różnych językach. Taka funkcja, jeśli stanie się powszechnie dostępna może przenieść podróżowanie czy np. międzynarodowe spotkania biznesowe na zupełnie inny poziom.

Wielkie zmiany dla użytkowników darmowej wersji ChatGPT

GPT-4o dostępny w darmowej subskrypcji

Model ChatGPT-4o ma być dostępny w ograniczony sposób w wersji darmowej. Tym samym miliony darmowych użytkowników zyskają ograniczony dostęp do analizy danych, wgrywania plików, dostępu do internetu czy korzystania z GPTs.

Od teraz odpowiedź na pytanie, czy opłaca się kupować płatną subskrypcję, będzie dużo trudniejsza. OpenAI duży nacisk kładzie na dostępność narzędzia dla jak największego grona użytkowników. Od niedawna ChatGPT dostępny bez konieczności logowania.

Porównanie funkcji ChatGPT Free i Plus

Porównanie ChatGPT-4 i ChatGPT-4o

Część funkcji znamy tylko z prezentacji. Do szerokiego użytku mają być wprowadzane na przestrzeni najbliższych tygodni. Na podstawie tego co wiemy do tej pory, przygotowałam (razem z czatem oczywiście) małe porównanie funkcji. Źródła do zestawienia: Stealth Optional, TechCrunch, Beebom.

Oto tabela przedstawiająca funkcje modeli ChatGPT-4 i ChatGPT-4o (Omni):

FunkcjaChatGPT-4ChatGPT-4o (Omni)
MultimodalnośćWykorzystywany głównie do obsługi tekstowych danych wejściowych i wyjściowych. Obsługa głosowa jest możliwa, jednak przez opóźnienia nie jest to zbyt naturalne i bywa irytujące dla użytkownika.Zaawansowane możliwości multimodalne. Może przetwarzać i generować nie tylko tekst, ale także dźwięk, obrazy i wideo. Dzięki temu jest bardziej wszechstronny i może być używany w szerszym zakresie zastosowań.
Interakcje naturalneOferuje wysokiej jakości interakcje tekstowe.Umożliwia bardziej naturalne i płynne interakcje, integrując różne formy komunikacji, takie jak mowa, obrazy i tekst. To pozwala na bardziej intuicyjną komunikację.
Zdolności rozumowania i adaptacjiPosiada zaawansowane zdolności rozumowania.Ulepszone zdolności rozumowania i adaptacji do specyficznych potrzeb użytkowników, co czyni go potężnym narzędziem do spersonalizowanych i kontekstowo świadomych interakcji.
Zrozumienie kontekstuMoże mieć trudności z utrzymaniem kontekstu w dłuższych rozmowach.Lepiej utrzymuje i integruje kontekst w dłuższych i bardziej złożonych interakcjach. Robi to niezależnie od formy danych wejściowych (tekst, dźwięk, obrazy). Oznacza to, że czat będzie mógł prowadzić z nami dłuższe rozmowy z zachowaniem kontekstu i rzadziej będzie się „gubił” w rozmowie.
Zakres zastosowańUżywany głównie do generowania tekstu i podstawowych analiz oraz generowania obrazów (DALLE-3).Dzięki możliwości obsługi różnych typów danych, nadaje się do szerszego zakresu zastosowań, od wsparcia klienta i edukacji po tworzenie treści kreatywnych i opiekę zdrowotną. Ma również duży potencjał w zastosowaniu w życiu prywatnym – nauka, wyjaśnianie różnych rzeczy, osobisty asystent czy zwykła, codzienna konwersacja.
Szybkość i wydajnośćWysokiej jakości generowanie tekstu, ale może być wolniejsze w porównaniu do nowszych modeli.Jest szybszy od GPT-4 i tańszy w użytkowaniu, co czyni go bardziej wydajnym rozwiązaniem. Dostępny będzie również w darmowej subskrypcji co sprawi, że potęga AI i najnowsze technologie będą dostępne dla milionów darmowych użytkowników.

Podsumowanie

Jeśli to się sprawdzi, to jesteśmy bardzo blisko asystentów AI, którzy będą nam towarzyszyć niemal na każdym kroku. Nauka, odrabianie prac domowych czy rynek korepetycji zmienią się zupełnie. A natychmiastowy tłumacz? Czy można wyobrazić sobie coś lepszego w dalekiej podróży? Chcesz zacząć używać ChatGPT ale nie wiesz jak się za to zabrać? A może pierwsze próby masz już za sobą ale nie jesteś zadowolny z wyników? Sprawdź koniecznie mojego e-booka „ChatGPT w jedno popołudnie”, w którym wyjaśniam jak zacząć używać czat i dzięki niemu rozwijać swój biznes.


Jestem Magda, ta z narudo.pl – entuzjastka technologii, project manager i analityk
IT. Wspieram przedsiębiorców i twórców internetowych w skutecznym wykorzystywaniu narzędzi online i sztucznej inteligencji oraz organizacji i planowaniu. Wierzę w optymalizację pracy i efektywne zarządzanie, jestem gotowa podzielić się swoim doświadczeniem i wiedzą abyśmy mogli pracować mądrzej, nie ciężej.