Гетерогенный кластер | ЛИТ/ОИЯИ
 
Платформа "HybriLIT"

Экосистема для задач машинного обучения, глубокого обучения и анализа данных

Описание экосистемы ML/DL/HPC

Активное внедрение нейросетевого подхода, методов и алгоритмов машинного обучения и глубокого обучения (ML/DL) для решения широкого спектра задач обусловлено многими факторами. К основным из них можно отнести развитие вычислительных архитектур, особенно при использовании методов DL при обучение сверточных нейронных сетей, а также развитие библиотек, в которых реализованы широкое многообразие алгоритмов, и фрейворков, позволяющих быстро строить различные модели нейросетей. Для обеспечения всех этих возможностей как по разработке математических моделей и алгоритмов, так и для проведения ресурсоемких расчетов, в том числе на графических ускорителях, позволяющих существенно сокращать время вычислений, для пользователей платформы HybriLIT создана и активно развивается экосистема для задач ML/DL и анализа данных.


Видео «Знакомство с ML/DL/HPC Экосистемой»

Полезные ссылки:

Рассказывает Оксана Стрельцова, заместитель руководителя группы по гетерогенным вычислениям, ЛИТ ОИЯИ

Видеоматериалы подготовлены А.С. Воронцовым


Экосистема ML/DL/HPC для задач и анализа данных

Экосистема имеет следующие компоненты (Рисунок 1):

  1. Component for educational purposes — предназначена для разработки моделей и алгоритмов на базе JupyterHub – многопользовательской среде для работы с Jupyter Notebook (известный как IPython приложение c возможностью работы в web-браузере):
    • сервер для обучения студентов studhub1.jinr.ru.
    • серверы для проведения математического практикума в рамках научных мероприятий ОИЯИ studhub2.jinr.ru, studhub3.jinr.ru.
  2. Component for computational tasks — предназначена для проведения ресурсоемких, массивно-параллельных расчетов, например, для обучения нейронных сетей с использованием графических ускорителей NVIDIA Volta — серверы jhub1.jinr.ru, jhub2.jinr.ru.
  3. Component for scientific projects — предназначена для задач проекта BioHlit, а также для разработки нейросетевых моделей и web-приложений.

Технические параметры серверов для всех компонент представлены на Рисунке 1.

  • Вторая компонента содержит по 4 графических ускорителя NVIDIA Volta V100 32 GB в серверах jhub1и jhub2.
  • Третья компонента содержит по 8 графических ускорителя NVIDIA Ampere A100 80 GB в серверах ampere03 и ampere05.

РИСУНОК. 1. Компоненты экосистемы ML/DL/HPC.

Основные библиотеки и инструменты, установленные на компонентах, для решения задач ML/DL и анализа данных приведены на Рисунке 2.

pic.2.
РИСУНОК. 2. Основные библиотеки и инструменты.


Состав экосистемы ML/DL/HPC

Компонента для разработки моделей и алгоритмов

(без использования графических ускорителей)

Компонента для проведения ресурсоемких расчетов

(с использованием графических ускорителей NVIDIA Volta V100)

Компонента для высокопроизводительных вычислений для научных проектов

(с использованием графических ускорителей NVIDIA Ampere A100) 

Студенческие серверы

studhub1.jinr.ru — для обучения студентов

studhub2.jinr.ru, studhub3.jinr.ru — для проведения математического практикума в рамках научных мероприятий ОИЯИ 

Пользовательские серверы 

(для пользователей гетерогенной платформы HybriLIT)

jhub1.jinr.rujhub2.jinr.ru

Биопроект BioHlit

ampere03.jinr.ru — для задач проекта BioHlit и для задач, использующих нейросетевые модели:

  • cell.jinr.ruдля разработки алгоритмов,
  • mostlit.jinr.ruдля web-приложений с использование Mercury.

Квантовый полигон (подробнее)

ampere05.jinr.ru

Jupyter Notebook

После авторизации открывается интерактивная среда JupyterLab:

Для пользователей доступны домашние директории, размещённые на сетевой файловой системе Lustre.

Начало работы в Jupyter Notebook

Создать директорию:

Переименовать директорию:

— правой кнопкой мыши нажать на папку, выбрать из выпадающего меню «Rename» или выбрать папку и нажать «F2». Имя папки не должно содержать пробелов!

Создать файл Python3:

— нажать на иконку «Python3»

Добавить новую вкладку (New Launcher):

MATLAB в среде JupyterHub:

— нажать на иконку «MATLAB», далее следовать инструкции

Подробнее о работе в среде Jupyter Notebook