Армія США сподівається, що це допоможе їй досягти переваги на полі бою. Крім того, метод може бути корисний у розвідці або при захисті важливих військових і цивільних об'єктів.

Не пропустіть У Новій Зеландії випробують першу бездротову систему передачі енергії на великі відстані

"Пошук оптимального способу наведення в режимі реального часу для цих машин – це ключова вимога для підвищення тактичної ситуаційної обізнаності бійців. Це дозволить армії США домінувати у складних обставинах", – вважає Джеміні Джордж, співробітник Командування з розвитку бойових можливостей США.

Джеміні Джордж і його колеги розробили метод управління великими скупченнями дронів на основі ієрархічного навчання з підкріпленням (HRL). Скупчення навчених безпілотних апаратів можна буде відправляти у певні області, забезпечивши їх набором інструкцій. При цьому "зграя" дронів буде автоматично підтримувати "лад" і виконувати накази. Таким чином, диспетчерам-людям не доведеться турбуватися про окремі дрони і наземні транспортні засоби – досить буде вказати групі роботів певне місце на карті. Машини, як команда, відправляться туди, куди їм накажуть, і будуть працювати разом як одна бойова одиниця.

"Використання ієрархічного навчання з підкріпленням дозволить нам контролювати скупчення безпілотних літальних і наземних транспортних засобів, щоб вони могли оптимально виконувати різні види місій", – зазначив Джеміні Джордж.

Співробітники лабораторії сподіваються, що у майбутньому автономні наземні роботи і літаючі дрони зможуть без втручання людини працювати разом і досліджувати землю й небо.

"Скупчення роботів можуть використовуватися для постійного спостереження й розвідки у густонаселеній міській місцевості, а також для захисту периметра військової бази або цінних активів", – зазначив експерт.

Цікаво Інженери створили технологію виробництва дисплеїв нового покоління

Навчання з підкріпленням

Одним із способів машинного навчання, у ході якого ШІ навчається, взаємодіючи з середовищем є навчання з підкріпленням. Ієрархічне навчання з підкріпленням дозволяє ШІ використовувати не тільки елементарні дії, але й підпослідовності, вивчені раніше, при роботі з попереднім завданням.

"У кожного агента свій власний цикл навчання з відповідною винагородою. Ми змогли значно скоротити час навчання, запустивши ці цикли навчання паралельно", – заявив Джеміні Джордж.

У лабораторії відзначають, що розраховують за допомогою нового алгоритму керувати скупченнями від десятків до сотень машин. Однак поки що команда використовувала свій метод тільки на чотирьох квадрокоптерах у межах одного приміщення, і застосовувати алгоритм в умовах реального бою ще рано.