ChatGPT o1 potrafi rozwiązywać złożone problemy lepiej niż doktoranci. Czy to oznacza, że jest mądrzejszy od przeciętnego człowieka?

Nowy model OpenAI o1 potrafi rozwiązywać złożone problemy lepiej niż doktoranci. Czy to oznacza, że sztuczna inteligencja przewyższa przeciętny ludzki intelekt?

ChatGPT to prawdziwa rewolucja w świecie technologii. Ten sprytny program potrafi pisać teksty, odpowiadać na pytania, a nawet wymyślać kreatywne historie, co otworzyło przed nami mnóstwo nowych możliwości. To już nie tylko narzędzie, ale symbol tego, jak daleko zaszła sztuczna inteligencja i co jeszcze może nas czekać w przyszłości. Ba, dla wielu ChatGPT to po prostu synonim czatbota ze sztuczną inteligencją, tak jak kiedyś adidasy były synonimem sportowych butów.

OpenAI, twórca ChatGPT, nie spoczywa na laurach. Ich ciągłe prace nad nowymi modelami, takimi jak GPT-4 czy nadchodzący GPT-5, obiecują jeszcze większe możliwości i jeszcze bardziej zaawansowane funkcje. Czy najnowsza „truskawka” będzie przełomowa?

Oto OpenAI o1 (Strawberry)

OpenAI właśnie wprowadziło nową serię modeli AI o nazwie o1, zaprojektowanych tak, aby „myśleć” dłużej przed udzieleniem odpowiedzi. Potrafią one rozumować poprzez złożone zadania i rozwiązywać trudniejsze problemy niż poprzednie modele w dziedzinie nauki, kodowania i matematyki. Jest to pierwsza seria modeli „rozumowania” przeznaczonych do rozwiązywania trudnych problemów, która jest dostępna już teraz.

Modele te zostały przeszkolone, aby poświęcać więcej czasu na przemyślenie problemów przed udzieleniem odpowiedzi, podobnie jak robiłby to człowiek. Poprzez szkolenie uczą się one doskonalić swój proces myślowy, próbować różnych strategii i rozpoznawać swoje błędy.

This is amazing. Used chatgpt o1-preview to create an animation of a spinning donut in my terminal. I'm switching back to chatGPT from claude. This is the first try btw #ChatGPT #strawberry pic.twitter.com/P33nywISq6
— Jordan (@schtwiller) September 12, 2024

W testach OpenAI, następna aktualizacja modelu działa porównywalnie do doktorantów w trudnych zadaniach porównawczych z fizyki, chemii i biologii. Okazało się również, że doskonale radzi sobie z matematyką i kodowaniem.

ChatGPT o1-preview 試してみた。 pic.twitter.com/k8qUYePG85
— ヘブン (@heavenOSK) September 13, 2024

W egzaminie kwalifikacyjnym do Międzynarodowej Olimpiady Matematycznej (IMO), GPT-4o poprawnie rozwiązał tylko 13 proc. problemów, podczas gdy model rozumowania uzyskał wynik 83 proc. Ich zdolności kodowania zostały ocenione w konkursach i osiągnęły 89. proc. w konkursach Codeforces.

Choć o1 jest przełomowy w zakresie rozumowania, brakuje mu jeszcze funkcji takich jak przeglądanie internetu czy obsługa plików, co sprawia, że w wielu przypadkach GPT-4o jest użyteczniejszy. Mimo to, o1 reprezentuje „nowy poziom możliwości AI”, stąd jego nazwa symbolizująca nowy początek.

ChatGPT o1-preview failed this relatively simple test, and our Enterprise h2oGPTe system nails it, much faster: pic.twitter.com/sh96pfnPwo
— Arno Candel (@ArnoCandel) September 12, 2024

ChatGPT o1 nie jest idealny. Tutaj przegrywa ze starszym modelem

Aby zaoferować bardziej wydajne rozwiązanie dla programistów, OpenAI wydało również OpenAI o1-mini, szybszy i tańszy model, który jest szczególnie skuteczny w kodowaniu. Jako mniejszy model, o1-mini, ma być o 80 proc. tańszy niż o1-preview.

OpenAI opracowało nowe podejście do szkolenia w zakresie bezpieczeństwa, wykorzystujące zdolności rozumowania modeli, aby lepiej przestrzegały one wytycznych bezpieczeństwa. o1 osiąga znacznie lepsze wyniki w testach bezpieczeństwa niż GPT-4. Firma wzmocniła również swoje działania na rzecz bezpieczeństwa poprzez rygorystyczne testy, współpracę z rządem i partnerstwa z instytutami ds. bezpieczeństwa AI.

Jak skorzystać z OpenAI o1?

Użytkownicy ChatGPT Plus i Team będą mogli uzyskać dostęp do modeli o1 w ChatGPT od dzisiaj. Zarówno o1-preview, jak i o1-mini można wybrać ręcznie w selektorze modeli, a w momencie uruchomienia tygodniowe limity stawek będą wynosić 30 wiadomości dla o1-preview i 50 dla o1-mini. Użytkownicy ChatGPT Enterprise i Edu uzyskają dostęp do obu modeli od 16 września.

OpenAI planuje również zapewnić dostęp do o1-mini wszystkim użytkownikom ChatGPT Free.

AI, ChatGPT, Ciekawostki, Nowości, OpenAI, Sztuczna inteligencja

Podziel się postem:

Najnowsze:

Oprogramowanie

Microsoft znacząco rozszerza integrację AI w Windows. Copilot zyska możliwość analizy ekranu użytkownika.

Microsoft intensyfikuje prace nad implementacją sztucznej inteligencji w systemie Windows. Zgodnie z długoterminową strategią firmy (obowiązującą od 2026-27), komputery z Windowsem 11 mają stać się urządzeniami w pełni napędzanymi przez AI.

Mateusz Kalina 19 października 2025

Bezpieczeństwo

2FA ma lukę: Jak atak „Pixnapping” kradnie kody z Androida w kilka sekund i jak zbudować silniejszą obronę

W cyfrowym świecie, gdzie wycieki danych i kradzieże haseł stały się codziennością, włączenie uwierzytelniania dwuskładnikowego (2FA) jest powszechnie uznawane za jeden z najskuteczniejszych kroków w celu ochrony swojej tożsamości online. Mechanizm ten, znany również jako weryfikacja dwuetapowa, stanowi dodatkową warstwę zabezpieczeń, która wymaga od użytkownika przedstawienia dwóch różnych form dowodu tożsamości, zanim uzyska dostęp do konta.1 Zazwyczaj jest to kombinacja czegoś, co użytkownik wie (hasło lub kod PIN), z czymś, co posiada (smartfon, fizyczny klucz bezpieczeństwa) lub czymś, kim jest (odcisk palca, skan twarzy).

Mateusz Kalina 15 października 2025

Bezpieczeństwo

Łańcuch Eksploatacji w Linux: Jak Dwa Błędy w PAM i udisks Prowadzą do Pełnego Przejęcia Systemu (CVE-2025-6018 & CVE-2025-6019)

W cyfrowym świecie bezpieczeństwa, eskalacja uprawnień (privilege escalation) jest jednym z najpoważniejszych zagrożeń. Umożliwia atakującemu, który posiada jedynie podstawowe konto użytkownika, zdobycie pełnej kontroli administracyjnej (root) nad systemem. Niedawne odkrycie przez Qualys Threat Research Unit stanowi podręcznikowy przykład tego, jak dwie pozornie odizolowane podatności mogą zostać połączone w niszczycielski łańcuch ataku.

Mateusz Kalina 17 lipca 2025