ДОБРЕДОЈДЕ ЗА GEMINI, помоќен од CHATGPT-4, како што тврди неговиот творец Google

2763

Време зa читање: 7 минути

Google официјално го покажа својот жестоко очекуван модел на вештачка интелигенција, Gemini (Близнаци) – за кој тврди дека е помоќен од големиот јазичен модел на OpenAI GPT-4 (LLM), велејќи дека може да им парира на луѓето на „експертско ниво“ во тест за интелигенција.

Моделот, кој извршниот директор Сундар Пичаи првпат го претстави за време на конференцијата I/O на компанијата во мај, ќе доаѓа во три вкуса: Nano, Pro и Ultra, а Ultra е најспособниот и оној кој наводно може да го надмине GPT-4.

„Добро подесена верзија на Gemini Pro“ веќе е интегрирана во четботот Bard на Google, се вели во официјалната објава на блогот. Ултра сè уште поминува низ „обемни проверки на доверба и безбедност“ и „фино подесување“, но на крајот ќе биде вградена и во Бард „на почетокот на следната година“.

Ова е почеток на нова ера на вештачка интелигенција во Google, изјави извршниот директор Сундар Пичаи: ерата на Близнаците. Gemini е најновиот голем јазичен модел на Google, кој Пичаи првпат го задеваше на конференцијата за развивачи на I/O во јуни и сега е претставен во јавноста. Да се слушне како Пичаи и извршниот директор на Google DeepMind Демис Хасабис го опишуваат тоа, тоа е огромен скок напред во моделот на вештачка интелигенција што на крајот ќе влијае на практично сите производи на Google. „Една од моќните работи во овој момент“, вели Пичаи, „е што можете да работите на една основна технологија и да ја подобрите и таа веднаш да се прелее низ нашите производи“.

Близнаците се повеќе од еден модел со вештачка интелигенција. Има полесна верзија наречена Gemini Nano која треба да се извршува природно и офлајн на уредите со Android. Има посилна верзија наречена Gemini Pro која наскоро ќе напојува многу услуги на Google AI и е столбот на Бард почнувајќи од денес. Има уште поспособен модел наречен Gemini Ultra, кој е најмоќниот LLM што Google досега го создал и се чини дека е претежно дизајниран за центри за податоци и деловни апликации.

Google го лансира моделот на неколку начини во моментов: Bard сега се напојува со Gemini Pro, а корисниците на Pixel 8 Pro ќе добијат неколку нови функции благодарение на Gemini Nano. (Gemini Ultra доаѓа следната година.) Програмерите и клиентите на претпријатијата ќе можат да пристапат до Gemini Pro преку Google Generative AI Studio или Vertex AI во Google Cloud почнувајќи од 13-ти декември. Близнаците засега се достапни само на англиски, а другите јазици очигледно наскоро ќе дојдат. Но, Пичаи вели дека моделот на крајот ќе биде интегриран во пребарувачот на Google, неговите рекламни производи, прелистувачот Chrome и многу повеќе низ целиот свет. Тоа е иднината на Google и не е тука прерано.

OpenAI го лансираше ChatGPT пред една година и една недела, а компанијата и производот веднаш станаа најголемите работи во вештачката интелигенција. Сега, Гугл – компанијата која создаде голем дел од основната технологија зад актуелниот бум на вештачката интелигенција, која се нарекува себеси организација „прва со вештачка интелигенција“ речиси една деценија, и која беше јасно и срамно затечена од тоа колку е добар ChatGPT и колку брзо технологијата на OpenAI ја презеде индустријата – конечно е подготвена да возврати.

Значи, да дојдеме само до важното прашање, нели? GPT-4 на OpenAI наспроти Gemini на Google: спремни, оди. Ова е многу јасно на ум на Google веќе некое време. „Направивме многу темелна анализа на системите рамо до рамо и бенчмаркингот“, вели Хасабис. Google спроведе 32 добро воспоставени репери споредувајќи ги двата модели, од широки севкупни тестови како реперот за разбирање на јазикот со повеќе задачи до оној што ја споредува способноста на два модели да генерираат код на Python. „Мислам дека значително напредуваме со 30 од 32“ од тие репери, вели Хасабис, со малку насмевка на лицето. „Некои од нив се многу тесни. Некои од нив се поголеми“.
Во тие одредници (кои навистина се главно многу блиски) најјасната предност на Близнаците доаѓа од неговата способност да разбира и да комуницира со видео и аудио. Ова е многу по дизајн: мултимодалноста е дел од планот на Близнаци од самиот почеток. Google нема обучено посебни модели за слики и глас, како што OpenAI ги создаде DALL-E и Whisper; од самиот почеток изгради еден мултисензорен модел. „Отсекогаш сме биле заинтересирани за многу, многу општи системи“, вели Хасабис. Тој е особено заинтересиран за тоа како да ги измеша сите тие режими – да собере што е можно повеќе податоци од кој било број на влезови и сетила, а потоа да дава одговори со исто толку разновидност.

Во моментов, најосновните модели на Gemini се текст во и текст, но помоќните модели како Gemini Ultra можат да работат со слики, видео и аудио. И „ќе стане уште поопшто од тоа“, вели Хасабис. „Сè уште има работи како акција и допир – повеќе како работи од типот на роботика“. Со текот на времето, вели тој, Близнаците ќе добијат повеќе сетила, ќе станат посвесни и ќе станат попрецизни и поприземни во процесот. „Овие модели на некој начин подобро разбираат за светот околу нив“. Овие модели сè уште халуцинираат, се разбира, и тие сè уште имаат предрасуди и други проблеми. Но, колку повеќе знаат, вели Хасабис, толку подобро ќе бидат.

Реперите се само репери, но, и на крајот, вистинскиот тест за способноста на Gemini ќе дојде од секојдневните корисници кои сакаат да го користат за да разберат идеи, да бараат информации, да пишуваат код и многу повеќе. Се чини дека Google го гледа кодирањето особено како убиствена апликација за Gemini; користи нов систем за генерирање код наречен AlphaCode 2 за кој вели дека има подобри резултати од 85 проценти од учесниците на натпреварот за кодирање, што е повеќе од 50 проценти за оригиналниот AlphaCode. Но, Пичаи вели дека корисниците ќе забележат подобрување во речиси сè што ќе допре моделот.

Подеднакво важно за Google е дека Близнаците очигледно се далеку поефикасен модел. Тој беше обучен на сопствените единици за обработка на тензори на Google и е и побрз и поевтин за работа од претходните модели на Google како PaLM. Заедно со новиот модел, Google лансира и нова верзија на својот TPU систем, TPU v5p, компјутерски систем дизајниран за употреба во центри за податоци за обука и водење на модели од големи размери.

Зборувајќи со Пичаи и Хасабис, јасно е дека тие го гледаат лансирањето на Gemini и како почеток на поголем проект и како чекор промена сама по себе. Близнаци е моделот што Google го чека, кон кој се гради со години, можеби дури и оној што требаше да го има подготвен пред OpenAI и ChatGPT да го преземат светот.

Гугл, кој прогласи „црвен код“ по лансирањето на ChatGPT и оттогаш се смета дека се обидува да го стаса конкурентот, обидувајќи се сè уште да се држи до својата „храбра и одговорна“ мантра. Хасабис и Пичаи и двајцата велат дека не се подготвени да се движат пребрзо само за да бидат во чекор, особено кога се приближуваме до крајниот сон за вештачка интелигенција: вештачка општа интелигенција, термин за вештачка интелигенција која само-подобрува, попаметна од луѓето и подготвен да го промени светот. „Како што се приближуваме до AGI, работите ќе бидат поинакви“, вели Хасабис. „Тоа е некако активна технологија, па мислам дека треба да му пристапиме претпазливо. Внимателно, но оптимистички“.

ДОБРЕДОЈДЕ ЗА GEMINI, помоќен од CHATGPT-4, како што тврди неговиот творец Google

слично