- Описание экосистемы ML/DL/HPC
- Видео «Знакомство с ML/DL/HPC Экосистемой»
- Экосистема ML/DL/HPC для задач и анализа данных
- Cостав экосистемы ML/DL/HPC
Описание экосистемы ML/DL/HPC
Активное внедрение нейросетевого подхода, методов и алгоритмов машинного обучения и глубокого обучения (ML/DL) для решения широкого спектра задач обусловлено многими факторами. К основным из них можно отнести развитие вычислительных архитектур, особенно при использовании методов DL при обучение сверточных нейронных сетей, а также развитие библиотек, в которых реализованы широкое многообразие алгоритмов, и фрейворков, позволяющих быстро строить различные модели нейросетей. Для обеспечения всех этих возможностей как по разработке математических моделей и алгоритмов, так и для проведения ресурсоемких расчетов, в том числе на графических ускорителях, позволяющих существенно сокращать время вычислений, для пользователей платформы HybriLIT создана и активно развивается экосистема для задач ML/DL и анализа данных.
Видео «Знакомство с ML/DL/HPC Экосистемой»
Полезные ссылки:
Рассказывает Оксана Стрельцова, заместитель руководителя группы по гетерогенным вычислениям, ЛИТ ОИЯИ
Видеоматериалы подготовлены А.С. Воронцовым
Экосистема ML/DL/HPC для задач и анализа данных
Экосистема имеет следующие компоненты (Рисунок 1):
- Component for educational purposes — предназначена для разработки моделей и алгоритмов на базе JupyterHub – многопользовательской среде для работы с Jupyter Notebook (известный как IPython приложение c возможностью работы в web-браузере):
- сервер для обучения студентов studhub1.jinr.ru.
- серверы для проведения математического практикума в рамках научных мероприятий ОИЯИ studhub2.jinr.ru, studhub3.jinr.ru.
- Component for computational tasks — предназначена для проведения ресурсоемких, массивно-параллельных расчетов, например, для обучения нейронных сетей с использованием графических ускорителей NVIDIA Volta — серверы jhub1.jinr.ru, jhub2.jinr.ru.
- Component for scientific projects — предназначена для задач проекта BioHlit, а также для разработки нейросетевых моделей и web-приложений.
Технические параметры серверов для всех компонент представлены на Рисунке 1.
- Вторая компонента содержит по 4 графических ускорителя NVIDIA Volta V100 32 GB в серверах jhub1и jhub2.
- Третья компонента содержит по 8 графических ускорителя NVIDIA Ampere A100 80 GB в серверах ampere03 и ampere05.
РИСУНОК. 1. Компоненты экосистемы ML/DL/HPC.
Основные библиотеки и инструменты, установленные на компонентах, для решения задач ML/DL и анализа данных приведены на Рисунке 2.
![pic.2.](/wp-content/uploads/2019/06/ML_DL_pic2-1024x581.png)
Состав экосистемы ML/DL/HPC
Компонента для разработки моделей и алгоритмов (без использования графических ускорителей) |
Компонента для проведения ресурсоемких расчетов (с использованием графических ускорителей NVIDIA Volta V100) |
Компонента для высокопроизводительных вычислений для научных проектов (с использованием графических ускорителей NVIDIA Ampere A100) |
Студенческие серверы studhub1.jinr.ru — для обучения студентов studhub2.jinr.ru, studhub3.jinr.ru — для проведения математического практикума в рамках научных мероприятий ОИЯИ |
Пользовательские серверы (для пользователей гетерогенной платформы HybriLIT) |
Биопроект BioHlit ampere03.jinr.ru — для задач проекта BioHlit и для задач, использующих нейросетевые модели:
Квантовый полигон (подробнее) |
Jupyter Notebook
После авторизации открывается интерактивная среда JupyterLab:
Для пользователей доступны домашние директории, размещённые на сетевой файловой системе Lustre.
Начало работы в Jupyter Notebook
Создать директорию:
Переименовать директорию:
— правой кнопкой мыши нажать на папку, выбрать из выпадающего меню «Rename» или выбрать папку и нажать «F2». Имя папки не должно содержать пробелов!
Создать файл Python3:
— нажать на иконку «Python3»
Добавить новую вкладку (New Launcher):
MATLAB в среде JupyterHub:
— нажать на иконку «MATLAB», далее следовать инструкции