Крупнейший в Сибири коммерческий центр обработки данных открыли в Новосибирской области

 © mashnews.ru Новый дата-центр группы компаний Key Point стал самым большим коммерческим ЦОДом в Сибирском регионе и одним из самых крупных дата-центров...

В Иннополисе открыт крупнейший в ПФО Центр обработки и хранения данных

 © strana-rosatom.ru 3 июня в татарском Иннополисе запустили первую очередь центра обработки данных (ЦОД") «Иннополис», рассчитанный на 1 тысячу серверных стоек...

Ростех запустил новый суперкомпьютер для создания цифровых двойников авиадвигателей

 © advengineering.ru Объединенная двигателестроительная корпорация создала высокопроизводительный вычислительный комплекс, предназначенный для проведения сложных инженерных расчетов. Суперкомпьютер, который способен выполнять...

Ростех представил систему противодействия кибератакам

 © mashnews.ru Система RT Protect EDR обеспечивает защиту от кибератак, направленных против организаций. В своей работе система анализирует поведения объектов в почтовом и интернет-трафике,...

Автоматизация промышленности. Как искусственный интеллект помогает предприятиям в Москве

Искусственный интеллект (ИИ) помогает существенно упростить рабочие процессы и сократить затраты на производстве. Например, столичная компания, выпускающая кабельную продукцию, внедрила...

В России появилась первая мультипроцессная аналитика

Новая опция, позволяющая более глубоко и детально анализировать бизнес-процессы, появилась в системе активной бизнес-аналитики Proceset от вендора «Инфомаксимум». “Мультипроцессная аналитика — это...

Российские операторы планируют присоединиться к сети Google напрямую

Это позволит увеличить пропускную способность трафика для более быстрой загрузки контента, главным образом YouTube. Эксперты подчеркивают, что это...

«Яндекс» вошел в двадцатку ведущих разработчиков ИИ

В период с 2010-го по 2023 год компания опубликовала 246 научных статей об искусственном интеллекте, заняв по этому...

«КАМАЗ» внедрил автоматическую систему управления и контроля кузнечного производства

В ПАО «КАМАЗ» завершено внедрение автоматической системы контроля и управления производством ПИФИ в кузнечно-прессовом корпусе кузнечного завода в Набережных Челнах.  © kamaz.ru Комплексное...

Безопасны ли пассажирские авиаперевозки спустя полтора года санкций?

В сентябре был ряд громких случаев, когда российские пассажиры сталкивались либо с продолжительной задержкой рейсов, либо с экстренной...

В Google Discover заблокировали сайты «Комсомольской правды» и «Царьграда»

Discover встроен в поиск Google и позволяет пользователям браузера Chrome на устройствах Android видеть контент, подобранный с учетом...

Вышла 11-я платформа от «Базальт СПО», это новый уровень разработки свободного ПО

«Базальт СПО», российский разработчик свободного программного обеспечения,выпустила 11-юпрограммнуюплатформу(p11), получившую название Salvia(Шалфей). Это новая стабильная ветка хранилища программных пакетов...

На ЭларСкан оцифровывают уникальные книги 16-18 веков

В Курский областной краеведческий музей поставлен отечественный комплекс планетарного сканирования ЭларСкан А1-600КС, с помощью которого планируется оцифровать десятки тысяч документов,...

ГУМРФ имени адмирала С.О. Макарова стал оператором крупнейшего ледового учебного центра в мире

В ГУМРФ имени адмирала С.О. Макарова открылся новый ледовый навигационный тренажерный комплекс по адресу Заневский проспект 5.  © morflot.gov.ru Проект реализован...

Начались продажи первых СИМ-карт c отечественной операционной системой.

СИМ карта © avatars.mds.yandex.net Нижегородская компания «Новакард» сообщила о начале продаж сим-карт, оснащенных отечественной операционной системой. Об этом сообщили в пресс-службе организации, подчеркнув,...

Россия в цифре: цифровая карта страны на основе космомониторинга

Госкорпорация «Роскосмос» завершила первый этап масштабирования проекта «Цифровая Земля» на всю территорию Российской Федерации.  © www.roscosmos.ru Результатом стала первая всеобъемлющая...

Геоскан представил всероссийский проект для школьников по космическому направлению

Геоскан представил всероссийский проект для школьников по космическому направлению © www.geoscan.ru ГК «Геоскан» и АНО «Развитие космического образования» начали реализацию масштабного...

«Газпром нефть»: облачные технологии в партнерстве с VK

«Газпром нефть» совместно с VK Cloud запустила облачную платформу для разработки новых ИТ-решений.  © www.gazprom-neft.ru В цифровом облаке развернута виртуальная инфраструктура...

Саровский ядерный центр представил «Логос ЭМИ»

«Логос ЭМИ» — новый модуль пакета программ инженерного анализа и суперкомпьютерного моделирования.  © strana-rosatom.ru Модуль предназначен для численного моделирования электромагнитных процессов....

Разработан первый российский программируемый чип для квантовых вычислений

 © tehnoomsk.ru Российские ученые разработали восьмиканальный интерферометр — программируемый многоплечевой интерферометр (чип) для квантовых вычислений. Для его воплощения в «железе»...

Российские ученые создали самый эффективный алгоритм для обучения и адаптации ИИ

Ученые из лаборатории исследований искусственного интеллекта (ИИ) Tinkoff Research создали самый эффективный среди мировых аналогов алгоритм для обучения и адаптации искусственного интеллекта.

Новый метод, названный ReBRAC (Revisited Behavior Regularized Actor Critic — пересмотренный актор-критик с контролируемым поведением), обучает ИИ в четыре раза быстрее и на 40% качественнее мировых аналогов в области обучения с подкреплением (Reinforcement Learning, RL), адаптируя его к новым условиям на ходу.

Разработка российских ученых в области повышения эффективности алгоритмов обучения ИИ может способствовать преодолению технологического и цифрового разрыва в мире между разными странами — более эффективные алгоритмы требуют меньше вычислительных ресурсов. Страны с ограниченными вычислительными мощностями смогут создавать и развивать передовые технологии, адаптировать ИИ под конкретные прикладные задачи, существенно экономя на дорогостоящих экспериментах с ИИ.

Результаты исследования были признаны мировым научным сообществом и представлены на главной научной конференции в области ИИ в мире — международной конференции по машинному обучению и нейровычислениям NeurIPS (The Conference and Workshop on Neural Information Processing Systems).


 © www.tinkoff.ru

Визуализация качества альтернативных подходов и алгоритма ReBRAC. По горизонтальной оси — качество алгоритма относительно «эксперта» (служит эталоном для обучения ИИ-агентов), где 100 — это уровень эксперта. По вертикальной оси — процент испытаний, в которых удалось превзойти выбранную отсечку качества. Чем выше линия, тем лучше. Метод, предложенный Tinkoff Research, стал первым превзошедшим эксперта более чем в половине испытаний

Суть открытия

Ученые из Tinkoff Research идентифицировали четыре компонента, которые были представлены в алгоритмах последних лет, но считались второстепенными и не подвергались детальному анализу:

  • Глубина нейронных сетей. Увеличение глубины сети помогает ей лучше понимать сложные закономерности в данных
  • Регуляризация актора и критика. В ИИ-агентах есть два компонента: «актор», который предпринимает действия, и «критик», который оценивает эти действия. Ученые использовали совместную регуляризацию обоих компонентов, чтобы актор избегал нежелательных действий, а критик более эффективно оценивал их. Ранее не было понятно, как сочетать оба подхода с наибольшей эффективностью
  • Увеличение эффективного горизонта планирования — позволяет модели балансировать между краткосрочными и долгосрочными аспектами задачи и улучшает ее способность принимать решения
  • Использование нормализации слоев (LayerNorm) — стабилизирует процесс обучения нейронных сетей

Ученые из Tinkoff Research интегрировали эти компоненты в алгоритм-предшественникBRAC (Behavior Regularized Actor Critic —актор-критикс контролируемым поведением) 2019 года и провели исследование, поочередно варьируя каждый из них. Оказалось, что правильная совокупность этих компонентов дает даже этому старому подходу самую высокую производительность среди лучших аналогов на сегодняшний день. Модифицированный алгоритм получил название ReBRAC.

Тестирование на робототехнических симуляторах показало, что алгоритм обучает ИИ в четыре раза быстрее и на 40% качественнее всех существующих в офлайн-бенчмарках. Ранее лидерство принадлежало алгоритмуSAC-RND, также созданному учеными из Tinkoff Research.


 © www.tinkoff.ru

Визуализация вариантов тестирования алгоритма: поиск цели в лабиринте (Ant), скорость бега (Halfcheetah, Hopper, Walker2d), задачи для робокистей — правильно держать ручку (Pen), открыть дверь, забить гвоздь, переместить объект

ReBRAC также эффективнее всего решает проблему дообучения искусственного интеллекта, который обычно медленно адаптируется к новым условиям. Например, робот, который был изначально обучен передвигаться по траве, упадет, если переместится на лед. ReBRAC же позволяет ИИ лучше учиться на ходу и адаптироваться.

Признание открытия мировым научным сообществом

В 2023 году рецензенты международной конференции по машинному обучению и нейровычислениям NeurIPS (The Conference and Workshop on Neural Information Processing Systems), на которой было представлено открытие ученых из Tinkoff Research, получили на рассмотрение свыше 13 тысяч статей от ученых со всего мира, из которых 3,5 тысячи были отобраны для представления на конференции. Селективность — всего 26%. Среди них сразу четыре научные статьи Tinkoff Research. Помимо алгоритма ReBRAC ученые представили две открытые библиотеки в области офлайн-обучения с подкреплением (Offline RL, ORL), благодаря которым специалистам по ИИ больше не требуется самостоятельно воспроизводить результаты наиболее весомых научных работ. Статьи уже цитируются ведущими исследовательскими лабораториями со всего мира — в их числе Стэнфордский университет, Калифорнийский университет в Беркли и научно-исследовательская лаборатория Google DeepMind.

Межтекстовые Отзывы
Посмотреть все комментарии
guest