ДОБРЕДОЈДЕ ЗА GPT-4o: Новиот модел на ВИ на OpenAI – побрз, позабавен, позаводлив

1100

Време зa читање: 6 минути

OpenAI го лансира GPT-4o, повторување на моделот GPT-4 што го напојува неговиот најпознат производ, ChatGPT. Ажурираниот модел „е многу побрз“ и ги подобрува „способностите преку текст, визија и аудио“, рече директорот на OpenAI, Мира Мурати, во соопштението за пренос во живо во понеделникот. Ќе биде бесплатен за сите корисници, а платените корисници ќе продолжат да „имаат до петкратно ограничување на капацитетот“ од бесплатните корисници, додаде Мурати.

Во блог-објавата од компанијата, OpenAI вели дека можностите на GPT-4o „ќе се шират итеративно“, но неговите способности за текст и слика ќе почнат да се шират денес во ChatGPT.

Извршниот директор на OpenAI, Сем Алтман, објави дека моделот е „природно мултимодален“, што значи дека моделот може да генерира содржина или да разбере команди во глас, текст или слики. Програмерите кои сакаат да се мешаат со GPT-4o ќе имаат пристап до API, што е половина од цената и двојно побрзо од GPT-4 Turbo, додаде Алтман на X.

Доаѓаат нови функции во гласовниот режим на ChatGPT како дел од новиот модел. Апликацијата ќе може да дејствува како гласовен асистент сличен на неа, одговарајќи во реално време и набљудувајќи го светот околу вас. Тековниот гласовен режим е поограничен, одговара на едно по едно барање и работи само со она што може да го слушне.

Пред напнатото, полчасовно откривање на OpenAI на својот нов модел со вештачка интелигенција GPT-4o, се ширеа гласини за тоа што би можело да биде објавено, што го натера извршниот директор на компанијата Сем Алтман да управува со очекувањата, велејќи дека тоа „не е пребарувач“, туку дека тие ќе објават „Некои нови работи за кои мислиме дека луѓето ќе ги сакаат“. По презентацијата, ентузијастите за вештачка интелигенција и технолошкиот печат беа и воодушевени и разочарани.
Објавувањето на GPT-4o – не GPT-5, како што очекуваа некои луѓе – претставуваше солидна, но постепено надградба на GPT-4.5 Turbo.

„Омнимоделот“ работи преку текст, аудио и слики и нуди подобрени вештини за кодирање, емотивен женски глас и побрзо време на генерирање. Реакциите на вестите ги ставија GPT-4o и OpenAI на врвот на глобалната листа на трендови на Твитер повеќе од еден ден.

Настанот привлече непосредни споредби со Gemini Ultra на Google, објавен во февруари. Додека многу ентузијасти за вештачка интелигенција уживаа во новиот модел на OpenAI, некои експерти за вештачка интелигенција беа помалку од импресионирани.

Емад Мостак, поранешен извршен директор на Stability AI, сподели мем што ја сумираше реакцијата на OpenAI преку IQ резултати. Поголемиот дел од вревата го достигна врвот околу дебатата за тоа дали вештачката општа интелигенција (AGI) е неизбежна, но долгата опашка на двата краја изгледа опседната со „AI waifus“ – виртуелни придружници за осамените глупаци.

Иронијата беше опиплива, бидејќи моделот Stable Diffusion на Stability AI е омилена алатка за создавање такви придружници.

OpenAI беше особено горд на живописните карактеристики на гласот што го дадоа на ChatGPT, за кој дури и Алтман се пошегуваше дека е сличен на виртуелниот придружник во научно-фантастичниот филм „Her“. Истата врска ја направи и коосновачот на OpenAI, Андреј Карпати. „Апликацијата убиец на LLM е Скарлет Јохансон. Сите мислевте дека е математика или нешто слично“, напиша тој на Твитер.

Илон Маск, мозокот зад Грок, конкурентниот чет-бот со вештачка интелигенција познат по својот „забавен режим“, беше помалку суптилен во споделувањето на својата рецензија. „Демото ме натера да се згрозам“, напиша тој, одговарајќи на корисник на Твитер кој рече дека GPT-4o само ќе ја влоши „ерата на пост-вистината“.

Критичарите го истакнаа недостатокот на единствена револуционерна карактеристика на презентацијата, која во голема мера демонстрираше работи што веќе може да се направат со тековните алатки за вештачка интелигенција.

„Јас сум истиот, но 20% побрз“, твитна Џулиен Шомонд, коосновач на Hugging Face. Главниот истражувач на вештачката интелигенција на Мета, Јан ЛеКун, не ги откри своите чувства за настанот на OpenAI, но објави смешни емотикони како одговор на објавата на Шомонд.

Ендрју Нг, ко-основачот на Coursera, го пофали зголемувањето на ефикасноста: „Кога агенциската работа која порано траеше 10 минути, сега трае 5 минути само со менување на API, тоа е голем напредок“, рече тој.

Други ја прославија потенцијалната практична примена на таков моќен модел, кој може веднаш да се тестира во други форми. Имран Чаудри, создавачот на беџот за хумана вештачка интелигенција, го демонстрираше својот уред користејќи GPT-4o за играње игра, истакнувајќи ги можностите за вид на моделот – иако се чини дека доцнењето сè уште е проблем.

Јутјуберот Арун Мајни во меѓувреме го пофали непреченото справување со преведувачките задачи на GPT-4o.

Но, некои ентузијасти, како писателот Јуан Морисон, забележаа знаци на забавување во развојот на вештачката интелигенција. „Тоа е доказ дека платото за LLM е веќе достигнато“, напиша тој на Твитер. „Отворената вештачка интелигенција прави чад и ретровизори за да се обидат да го спречат бегството на капиталот од инвеститорите“. Тој рече дека е замислен зошто OpenAI не го испорача GPT-5, за кој се шпекулираше дека ќе биде објавен оваа година.

Копајќи подлабоко, Бинду Реди, извршен директор на Abacus AI, објави резултати од репер тест што покажува дека GPT-4o работи полошо од GPT-4.5 Turbo кога ќе биде побарано со долги, сложени задачи за кодирање, веројатно поради неговата мултимодалност.

Тим Симонс од каналот YouTube Theoretically Media ја сумираше средината, велејќи: „И сум преоптоварен и презаситен“. И покрај тоа што GPT-4o има импресивни способности, тој се поткопува поради недостатокот на вистински нови карактеристики, рече тој, скокот од GPT-4 е помалку значаен од претходниот скок од GPT-3.5.

И покрај различните реакции, речиси сите страни правеа споредби помеѓу GPT-4o и познатите асистенти како „Her“ или „Jarvis“ од универзумот на суперхерои на Марвел. Деконструирајќи го резимето на своите јазични способности како нешто повеќе од „говорен превод во реално време“, Карпати го истакна значењето на OpenAI да објави природно мултимодален LLM наместо да се поврзува меѓу одделни модели.

Пред вчерашното лансирање на GPT-4o, спротивставените извештаи предвидуваа дека OpenAI најавува пребарувач со вештачка интелигенција за да им се спротивстави на Google и Perplexity, гласовен асистент вработен во GPT-4 или целосно нов и подобрен модел, GPT-5. Се разбира, OpenAI сигурно го темпираше ова лансирање непосредно пред Google I/O, конференцијата водечка на технолошкиот гигант, каде што очекуваме да видиме лансирање на различни производи за вештачка интелигенција од тимот на Gemini.