Тим од Универзитетот Мартин Лутер Хале-Витенберг, Универзитетот Јоханес Гутенберг во Мајнц и Универзитетот за применети науки во Мајнц открија систем за вештачка интелигенција способен да дешифрира антички текстови со клинесто писмо. Оваа нова технологија, која користи 3D модели, претставува значителен напредок во разбирањето на една од најраните форми на пишување на човештвото.
Објавено во списанието The Eurographics Association, студијата на истражувачите се фокусираше на збир на клинесто писмо од колекцијата на професорот Фрау Хилпрехт. Овие таблички првенствено потекнуваат од античка Месопотамија, историски регион во денешен Ирак. Оваа област често се нарекува лулка на цивилизацијата, каде што се развиле некои од најраните човечки општества. Овие плочи, особено, се испишани со низа симболи, знаци и клинови кои ги формираат јазиците во регионот, како сумерскиот, асирскиот и акадскиот.
Многу од нив се стари над 5.000 години и нудат поглед во древните цивилизации, покривајќи широк спектар на теми од секојдневниот живот до правни прашања.
„На нив може да се најде сè: од шопинг листи до судски пресуди“, рече Хуберт Мара, еден од авторите на студијата. „Глинените таблички даваат увид во минатото на човештвото пред неколку милениуми. Сепак, тие се силно истрошени и затоа е тешко да се дешифрираат дури и за обучени очи“.
Тимот се обрати до вештачката интелигенција за помош. Користејќи нов процес на вештачка интелигенција за декодирање на древните клинесто писмо, тие користеа софистициран модел на вештачка интелигенција заснован на архитектурата на Конволутивна невронска мрежа (R-CNN) базирана на регион, специјализиран систем дизајниран за препознавање на објекти. Студијата користела уникатна база на податоци која се состои од 3Д модели од 1.977 клинесто писмо, со детални прибелешки од 21.000 клинесто писмо и 4.700 клинови.
Методологијата на вештачката интелигенција вклучуваше два дела: првично, детектор за знаци, изграден на моделот RepPoints со столб на ResNet18, идентификуваше клинесто писмо на таблетите. Во едноставни термини, моделот RepPoints ја пробива колекцијата ResNet18 слики поврзани со месопотамиските јазици и потоа ги комбинира обрасците за да го „види“ текстот. Овој чекор беше клучен за прецизно лоцирање на знаците. Последователно, детекторот на клинови, користејќи Point R-CNN со напредни функции како Feature Pyramid Network (FPN) и RoI Align, ги класифицираше и предвиде позициите на клиновите, што ја формира основата на основните елементи на клинесто писмо, овозможувајќи ВИ, всушност, да чита.“
Овие алатки ги земаат 3D скенирањата на табличките и просејуваат низ мноштвото мерења на нештата како што е длабочината на отпечатокот направен од иглата во глината или растојанието помеѓу симболите и клиновите. Овој нијансиран пристап ѝ овозможи на вештачката интелигенција да ги надмине предизвиците што ги поставуваат традиционалните 2D фотографии, како што се неконзистентно осветлување и одвлекување на вниманието во боја, со што се обезбедува попрецизна анализа на античките текстови.
Традиционалното истражување на древните текстови користи софтвер за оптичко препознавање знаци (OCR), кој ги конвертира скенираните слики или 2Д-фотографиите на напишаното во машински читлив текст.
„OCR обично работи со фотографии или скенирања. Ова не е проблем за мастило на хартија или пергамент. Меѓутоа, во случајот со клинесто писмо, работите се потешки бидејќи светлината и аголот на гледање во голема мера влијаат на тоа колку добро може да се идентификуваат одредени ликови“, рече коавторот Ернст Штоцнер.
Древните свитоци, пергаментите и старите книги се лесни – тие се 2Д медиум преведен во друг 2Д медиум. Како и да е, клинестото писмо се 3D и целата таа длабочина влијае на толкувањето.
За да се реши ова, истражувачкиот тим го стави својот систем за вештачка интелигенција преку обемен режим на обука, користејќи тридимензионални скенирања и дополнителни податоци. Значителен дел од овие податоци беше приложен од Универзитетот за применети науки во Мајнц, кој моментално води значаен проект фокусиран на создавање 3Д модели на овие древни глинени плочи. Ова и овозможи на вештачката интелигенција да постигне извонреден успех во прецизното идентификување на симболите впишани на табличките.
Оваа технологија не само што го демократизира пристапот до овие древни записи, туку и отвора нови патишта за истражување, овозможувајќи поширока анализа и интерпретација на историските текстови. Идните подобрувања би можеле да ја прошират неговата примена и на други тридимензионални скрипти, како што се избришаните натписи пронајдени на гробиштата.