НА ЧЕКОР ДО ВЕШТАЧКА ИНТЕЛИГЕНЦИЈА ШТО САМОСТОЈНО РАСУДУВА: OpenAI работи на нова технологија под кодно име „Strawberry“

1271

Време зa читање: 7 минути

Производителот на ChatGPT OpenAI работи на нов пристап кон своите модели со вештачка интелигенција во проект со кодно име „Strawberry“, објави Ројтерс.

Проектот, чии детали не беа претходно пријавени, доаѓа додека стартапите поддржани од Мајкрософт се тркаат за да покажат дека типовите на модели што ги нуди се способни да испорачаат напредни способности за расудување.

Тимови во OpenAI работат на Strawberry, според копија од неодамнешниот внатрешен документ OpenAI што Ројтерс го виде во мај. Ројтерс не можеше да го утврди прецизниот датум на документот, во кој се детализира планот за тоа како OpenAI има намера да го користи Strawberry за да изврши истражување. Изворот го опиша планот за Ројтерс како работа во тек. Новинската агенција не можеше да утврди колку е блиску Strawberry да биде јавно достапен.

Како работи Strawberry е цврсто чувана тајна дури и во OpenAI, рече лицето.

Документот опишува проект кој користи модели на Strawberry со цел да и овозможи на вештачката интелигенција на компанијата не само да генерира одговори на прашања, туку и да планира доволно однапред за автономно и сигурно да се движи на интернет за да го изврши она што OpenAI го нарекува „длабоко истражување“, според изворот. Според интервјуата со повеќе од десетина истражувачи на вештачка интелигенција, ова е нешто што досега ги избегнувало моделите со вештачка интелигенција.

Запрашан за Strawberry и деталите пријавени во оваа приказна, портпаролот на компанијата OpenAI во изјава рече: „Сакаме нашите модели со вештачка интелигенција да го гледаат и разберат светот повеќе како ние. Континуираното истражување на новите способности за вештачка интелигенција е вообичаена практика во индустријата, со заедничко верување дека овие системи ќе се подобрат во расудувањето со текот на времето“.

Портпаролот не одговори директно на прашањата за Јагода.
Проектот Strawberry беше порано познат како Q*, за кој Ројтерс објави минатата година веќе се гледаше во компанијата како пробив.

Два извори го опишаа гледањето на почетокот на оваа година, она што вработените во OpenAI им рекоа дека се демо снимки Q*, способни да одговорат на незгодни прашања од областа на науката и математиката надвор од дофатот на денешните комерцијално достапни модели.

Различен извор информиран за ова прашање рече дека OpenAI ја тестирал вештачката интелигенција внатрешно која постигнала над 90% на базата на податоци MATH, репер за математичките проблеми во првенството.

Ројтерс не можеше да утврди дали ова е проектот „Јагода“.

Во вторникот на интерен состанок со сите раце, OpenAI покажа демо на истражувачки проект за кој тврдеше дека има нови вештини за расудување слични на човекот, според Блумберг, отвора ново табче. Портпаролот на OpenAI го потврди состанокот, но одби да даде детали за содржината. Ројтерс не можеше да утврди дали покажаниот проект е Strawberry.

OpenAI се надева дека иновацијата драматично ќе ги подобри способностите за расудување на моделите со вештачка интелигенција, рече лицето запознаено со неа, додавајќи дека Strawberry вклучува специјализиран начин за обработка на модел со вештачка интелигенција откако претходно ќе биде обучен за многу големи збирки податоци.
Истражувачите кои ги интервјуираше Ројтерс велат дека расудувањето е клучно за вештачката интелигенција да постигне интелигенција на човечко или на над-човечко ниво.

Додека големите јазични модели веќе можат да резимираат обемни текстови и да состават елегантна проза многу побрзо од кој било човек, технологијата честопати не успева во проблемите со здравиот разум чии решенија им изгледаат интуитивно на луѓето, како што се препознавање логички заблуди и играње „тик-так“. Кога моделот наидува на вакви проблеми, често „халуцинира“ лажни информации.

Истражувачите на вештачката интелигенција интервјуирани од Ројтерс генерално се согласуваат дека расудувањето, во контекст на вештачката интелигенција, вклучува формирање на модел кој ѝ овозможува на вештачката интелигенција да планира однапред, да рефлектира како функционира физичкиот свет и да работи преку предизвикувачки проблеми со повеќе чекори.

Подобрувањето на расудувањето во моделите со вештачка интелигенција се смета за клуч за отклучување на способноста на моделите да прават сè, од правење големи научни откритија до планирање и изградба на нови софтверски апликации.

Извршниот директор на OpenAI, Сем Алтман, рече претходно оваа година дека во вештачката интелигенција „најважните области на напредок ќе бидат околу способноста за расудување“.

Други компании како Гугл, Мета и Мајкрософт исто така експериментираат со различни техники за да го подобрат расудувањето во моделите на вештачка интелигенција, како што се повеќето академски лаборатории кои вршат истражување за вештачка интелигенција. Истражувачите, сепак, се разликуваат околу тоа дали големите јазични модели (LLM) се способни да вклучат идеи и долгорочно планирање во тоа како прават предвидувања. На пример, еден од пионерите на модерната вештачка интелигенција, Јан ЛеКун, кој работи во Мета, честопати вели дека LLM не се способни за човечко расудување.

Јагодата е клучна компонента на планот на OpenAI за надминување на тие предизвици, рече извор запознаен со ова прашање. Документот што го виде Ројтерс опишува што има за цел да овозможи Strawberry, но не и како.

Во последниве месеци, компанијата приватно им сигнализираше на програмерите и другите надворешни страни дека е на прагот на ослободување на технологија со значително понапредни способности за расудување, според четворица луѓе кои ги слушнале чекорите на компанијата. Тие одбија да бидат идентификувани бидејќи не се овластени да зборуваат за приватни работи.

Strawberry вклучува специјализиран начин на она што е познато како генеративни модели со вештачка интелигенција на OpenAI „пост-тренинг“, или прилагодување на основните модели за да се усовршат нивните перформанси на специфични начини откако тие веќе биле „обучени“ за групи генерализирани податоци, еден од изворите. кажа.
Фазата после обуката на развивање на модел вклучува методи како „фино подесување“, процес кој се користи на скоро сите јазични модели денес и кој доаѓа во многу вкусови, како на пример луѓето да даваат повратни информации за моделот врз основа на неговите одговори и да му даваат примери на добри и лоши одговори.

Strawberry има сличности со методот развиен во Стенфорд во 2022 година, наречен „Самоук расудувач“ или „STaR“, рече еден од изворите со знаење за ова прашање. STaR им овозможува на моделите со вештачка интелигенција да се „подигнат“ на повисоки нивоа на интелигенција преку итеративно создавање нивните сопствени податоци за обука и теоретски би можеле да се искористат за да се натераат јазичните модели да ја надминат интелигенцијата на човечко ниво, изјави за Ројтерс еден од неговите креатори, професорот од Стенфорд, Ноа Гудман. „Мислам дека тоа е и возбудливо и застрашувачко…ако работите продолжат да одат во таа насока, имаме сериозни работи за кои треба да размислуваме како луѓе“, рече Гудман.

Гудман не е поврзан со OpenAI и не е запознаен со Strawberry.

Меѓу можностите кон кои OpenAI цели на Strawberry е извршувањето задачи на долг хоризонт (LHT), се вели во документот, алудирајќи на сложени задачи за кои е потребен модел да планира однапред и да изврши серија активности во подолг временски период, објасни првиот извор.

За да го стори тоа, OpenAI создава, обучува и оценува модели на она што компанијата го нарекува база на податоци за „длабоко истражување“, според внатрешната документација на OpenAI. Ројтерс не беше во можност да утврди што има во таа база на податоци или колку долго би значело подолг период.

OpenAI конкретно сака неговите модели да ги користат овие способности за да спроведат истражување преку автономно прелистување на интернет со помош на „CUA“ или агент што користи компјутер, кој може да преземе активности врз основа на неговите наоди, според документот и еден од извори. OpenAI, исто така, планира да ги тестира своите способности за вршење на работата на инженерите за софтвер и машинско учење.