Неймовірно, але факт. Система штучного інтелекту (ШІ), розроблена в MIT, може передбачити, як розгортатимуться подальші події і дії в спостережуваної сцені, тобто, по суті, будувати картинку найближчого майбутнього.
ІІ всього лише отримує звичайне (нерухоме зображення, а алгоритми глибинного навчання створюють невелике відео, в якому показується, що могло б статися далі після цього кадру.
Наприклад, якщо ШІ отримав знімок залізничного вокзалу, то він може подати поїзд, що відходить від платформи.Або ж, скажімо, зображення пляжу може надихнути штучний інтелект на «пожвавлення» хвиль моря.
Подібна система зможе в майбутньому розпізнати, наприклад, майбутнє падіння людини або допомогти самоврядним автомобілів «передбачити» нещасний випадок. (До речі, під час неминучого ДТП автономного транспортного засобу напевно потрібно буде вибирати, кого рятувати — водія та пасажирів або пішоходів).
«Будь роботу, працює в нашому світі, все-таки необхідні деякі базові навички для передбачення майбутнього.Наприклад, якщо людина збирається сісти на стілець, то навряд чи він захоче, щоб робот витягнув стілець з-під нього», — пояснює один із розробників нової системи Карл Водрик (Carl Vondrick) з Массачусетського технологічного інституту. Зрештою, природа нагородила людину інтуїцією (і навіть прописала її в генах). Так чому б не подарувати такого роду навичками машини?
Дослідники тренували ІІ з допомогою двох мільйонів відео, розміщених на сайті Flickr. Серед них були сцени з пляжу, поля для гольфу, залізничних вокзалів і з дитячих лікарень. Все відео були без маркування — тобто вони не були позначені різними підказками, допомагають ІІ розуміти, що показано в кадрі.
Пояснимо, що така інформація — маркування — деколи необхідна системі, наприклад, для навчання безпілотних машин, яким необхідно, наприклад, навчитися не плутати сигнали світлофора.
Потім після «кіносеансу» американські дослідники надали системі контрольні фотознімки, і ИИ повинен був створити, спираючись на отримане зображення, свої власні міні-фільми, в яких показувалася наступна за отриманими кадром сцена.
Перед дослідниками також стояло завдання навчити ІІ створювати кращі ролики (сценарії найбільш ймовірного майбутнього). З цією метою фахівці використовували метод, який називається «ворогуючі мережі» (adversarial networks). В цьому випадку одна нейронна мережа створює відео, інша виступає в ролі своєрідного судді, який оцінює, чи реально пропоноване майбутнє або ж ні.
Дві мережі знаходяться в постійному конфлікті: «творець» відео намагається якомога краще обдурити іншу мережу своєю роботою, в той час як «конкурент» відточує здатність відрізняти створене відео від реального.
Щоправда, на сьогодні відео ще недостатньо якісні: вони низької якості і містять всього 32 кадру, його тривалість — трохи більше однієї секунди. Але все-таки вони досить чіткі і показують правильні рухи в сценах: наприклад, поїзд рухається вперед по прямій траєкторії, як це і повинно бути.
Зараз розробники хочуть розширити можливості системи — додати ще більше відео, які будуть дещо довший. За словами Водрика, звичайно, ІІ ніколи не зможе точно передбачити, що станеться через мить. Але штучний інтелект здатний, принаймні, представити варіанти альтернативного майбутнього.
Водрик і його колеги представлять свою роботу 5 грудня на конференції нейронних обчислень в Барселоні (ICANN 2016).
Проект «Вести.Наука» часто розповідає і про інших «таланти» ІІ: наприклад, у нього можна дізнатися найважливіші новини дня, створити портрет в обраному стилі або попросити його написати який-небудь захоплюючий роман.