Гетерогенный кластер | ЛИТ/ОИЯИ
 
Платформа "HybriLIT"

Алгоритм на основе глубокого обучения для автоматического анализа фокусов репарации ДНК

Шадмехри Сара¹, Бежанян Татевик¹, Стрельцова Оксана¹, Зуев Максим¹, Бондарев Максим²
¹ ЛИТ ОИЯИ
² Государственный университет «Дубна»

При действии ионизирующих излучений на ДНК, одним из наиболее сложных повреждений для восстановления это двунитевые разрывы ДНК (ДР ДНК). Для визуализации ДР ДНК используется метод иммунофлуоресцентного окрашивания, который основан на выявлении специфических белков-маркеров, вовлеченных в процесс репарации ДР ДНК, при котором белки накапливаются в сайтах возникновения ДР ДНК, формируя радиационно-индуцированные фокусы (РИФ). Дальнейший визуальный анализ, осуществляемый работой нескольких операторов, является широко распространенным подходом к оценке количества РИФ. Однако человеческий фактор и большие трудозатраты требуют нового метода анализа РИФ.
Для автоматизированного анализа радиационно-индуцированных фокусов в ядрах клеток был разработан алгоритм на базе глубокого обучения. Основные шаги алгоритма представлены на Рис.1. Разработанный алгоритм на основе нейросетевого подхода состоит из двух этапов:

  • Этап 1.
    Детекция ядер клеток. Алгоритм основан на использования нейросетевой архитектуры SAM 2 (Segment Anything Model), с дальнейшим отбором клеток по размеру, и исключения граничных клеток.
  • Этап 2.
    Детекция радиационно-индуцированных фокусов. Разработан алгоритм на основе нейросетовой модели архитектуры YOLOv5 (You Only Look Once), который в каждой отдельной клетке детектирует РИФ.

Заранее, для 2го этапа (обучение модели YOLOv5) на платформе CVAT (Computer Vision Annotation Tool), который развернут на платформе HybriLIT, было проаннотировано группа изображений на два класса (клетки и фокусы).

Рис.1 Схематическая диаграмма двухэтапного алгоритма основанного на подходе глубокого обучения (a) этап 1: детектирование ядер клеток (по синему каналу), создание набора изображений клеток и создание набора изображений с детектированными клетками для второго этапа, (б) этап 2: схема работы алгоритма для детекции фокусов.

Разработанный двухэтапный алгоритм предоставляет возможность на флуоресцентных изображениях детектировать все ядра клеток, одновременно автоматически удаляя граничные и перекрывающиеся ядра клеток, и РИФ в красном и зеленом каналах соответственно. Результаты работы алгоритма представлены на Рис. 2

Рис. 2. Результат работы двухэтапного алгоритма. Исходное флуоресцентное изображение (а), релевантные ядра клеток с РИФ в зеленом канале (б) и в красном канале (в)

Двухэтапный алгоритм разработан на базе экосистемы ML/DL/HPC Гетерогенной вычислительной платформы HybriLIT. Работа проводилась в рамках совместного сотрудничества между ЛИТ, ЛРБ ОИЯИ и ФГБУ ГНЦ ФМБЦ им. А.И. Бурназяна ФМБА России.

  1. “A deep learning model for automated quantification of DNA repair foci in somatic mam-malian cells”
    S. Shadmehri, T. Bezhanyan, M. Bondarev, O. Streltsova, M. Zuev, A. Chigasova, A. Osipov, N. Vorobytea, A.N. Osipov
    Mathematical Modeling and Computational Physics (MMCP2024), 21–25 october 2024, https://indico.jinr.ru/event/4467/contributions/28828/
  2. “A deep learning model for automated quantification of DNA repair foci in somatic mam-malian cells”
    S. Shadmehri, T. Bezhanyan, M. Bondarev, O. Streltsova, M. Zuev, A. Chigasova, A. Osipov, N. Vorobytea, A.N. Osipov. Accepted for publication in “Physics of Particles and Nuclei (PEPAN)”, vol. 56, no. 6, 2025.