ChatGPT o1 potrafi rozwiązywać złożone problemy lepiej niż doktoranci. Czy to oznacza, że jest mądrzejszy od przeciętnego człowieka?

Nowy model OpenAI o1 potrafi rozwiązywać złożone problemy lepiej niż doktoranci. Czy to oznacza, że sztuczna inteligencja przewyższa przeciętny ludzki intelekt?

ChatGPT to prawdziwa rewolucja w świecie technologii. Ten sprytny program potrafi pisać teksty, odpowiadać na pytania, a nawet wymyślać kreatywne historie, co otworzyło przed nami mnóstwo nowych możliwości. To już nie tylko narzędzie, ale symbol tego, jak daleko zaszła sztuczna inteligencja i co jeszcze może nas czekać w przyszłości. Ba, dla wielu ChatGPT to po prostu synonim czatbota ze sztuczną inteligencją, tak jak kiedyś adidasy były synonimem sportowych butów.

OpenAI, twórca ChatGPT, nie spoczywa na laurach. Ich ciągłe prace nad nowymi modelami, takimi jak GPT-4 czy nadchodzący GPT-5, obiecują jeszcze większe możliwości i jeszcze bardziej zaawansowane funkcje. Czy najnowsza „truskawka” będzie przełomowa?

Oto OpenAI o1 (Strawberry)

OpenAI właśnie wprowadziło nową serię modeli AI o nazwie o1, zaprojektowanych tak, aby „myśleć” dłużej przed udzieleniem odpowiedzi. Potrafią one rozumować poprzez złożone zadania i rozwiązywać trudniejsze problemy niż poprzednie modele w dziedzinie nauki, kodowania i matematyki. Jest to pierwsza seria modeli „rozumowania” przeznaczonych do rozwiązywania trudnych problemów, która jest dostępna już teraz.

Modele te zostały przeszkolone, aby poświęcać więcej czasu na przemyślenie problemów przed udzieleniem odpowiedzi, podobnie jak robiłby to człowiek. Poprzez szkolenie uczą się one doskonalić swój proces myślowy, próbować różnych strategii i rozpoznawać swoje błędy.

W testach OpenAI, następna aktualizacja modelu działa porównywalnie do doktorantów w trudnych zadaniach porównawczych z fizyki, chemii i biologii. Okazało się również, że doskonale radzi sobie z matematyką i kodowaniem.

W egzaminie kwalifikacyjnym do Międzynarodowej Olimpiady Matematycznej (IMO), GPT-4o poprawnie rozwiązał tylko 13 proc. problemów, podczas gdy model rozumowania uzyskał wynik 83 proc. Ich zdolności kodowania zostały ocenione w konkursach i osiągnęły 89. proc. w konkursach Codeforces.

Choć o1 jest przełomowy w zakresie rozumowania, brakuje mu jeszcze funkcji takich jak przeglądanie internetu czy obsługa plików, co sprawia, że w wielu przypadkach GPT-4o jest użyteczniejszy. Mimo to, o1 reprezentuje „nowy poziom możliwości AI”, stąd jego nazwa symbolizująca nowy początek.

ChatGPT o1 nie jest idealny. Tutaj przegrywa ze starszym modelem

Aby zaoferować bardziej wydajne rozwiązanie dla programistów, OpenAI wydało również OpenAI o1-mini, szybszy i tańszy model, który jest szczególnie skuteczny w kodowaniu. Jako mniejszy model, o1-mini, ma być o 80 proc. tańszy niż o1-preview.

OpenAI opracowało nowe podejście do szkolenia w zakresie bezpieczeństwa, wykorzystujące zdolności rozumowania modeli, aby lepiej przestrzegały one wytycznych bezpieczeństwa. o1 osiąga znacznie lepsze wyniki w testach bezpieczeństwa niż GPT-4. Firma wzmocniła również swoje działania na rzecz bezpieczeństwa poprzez rygorystyczne testy, współpracę z rządem i partnerstwa z instytutami ds. bezpieczeństwa AI.

Jak skorzystać z OpenAI o1?

Użytkownicy ChatGPT Plus i Team będą mogli uzyskać dostęp do modeli o1 w ChatGPT od dzisiaj. Zarówno o1-preview, jak i o1-mini można wybrać ręcznie w selektorze modeli, a w momencie uruchomienia tygodniowe limity stawek będą wynosić 30 wiadomości dla o1-preview i 50 dla o1-mini. Użytkownicy ChatGPT Enterprise i Edu uzyskają dostęp do obu modeli od 16 września.

OpenAI planuje również zapewnić dostęp do o1-mini wszystkim użytkownikom ChatGPT Free.

Podziel się postem:

Najnowsze:

Mobilne

Kwalifikowany podpis elektroniczny w mObywatel: Nowa, bezpłatna opcja dla użytkowników prywatnych

Aplikacja mObywatel rozszerza swoje funkcjonalności o strategiczną usługę – bezpłatny kwalifikowany podpis elektroniczny. Nowe rozwiązanie, skierowane wyłącznie do użytkowników prywatnych, umożliwia podpisanie do pięciu dokumentów miesięcznie bez ponoszenia kosztów. Jest to istotna zmiana na rynku usług cyfrowych, ponieważ dotychczas zaawansowane podpisy tego typu były dostępne wyłącznie na zasadach komercyjnych.

Bezpieczeństwo

Analiza ESET: Północnokoreańska grupa Lazarus prowadzi działania szpiegowskie przeciwko europejskiemu przemysłowi obronnemu

Firma ESET, specjalizująca się w rozwiązaniach z zakresu cyberbezpieczeństwa, opublikowała wyniki badań wskazujące na kampanię szpiegowską prowadzoną przez północnokoreańską grupę Advanced Persistent Threat (APT) o kryptonimie Lazarus. Celem ataków były przedsiębiorstwa z europejskiego sektora obronnego.

Bezpieczeństwo

Pracownicy NFZ bezprawnie przeglądali dane ubezpieczonych. Fundusz zapowiada konsekwencje i zmiany w systemie

Narodowy Fundusz Zdrowia poinformował o poważnym incydencie bezpieczeństwa. Grupa pracowników NFZ, posiadająca legalny dostęp do Centralnego Wykazu Ubezpieczonych (CWU), wykorzystała swoje uprawnienia w sposób niezgodny z prawem, przeglądając dane pacjentów bez podstawy służbowej. Sprawa została zgłoszona do Prezesa Urzędu Ochrony Danych Osobowych (UODO).

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *