Студенты ИТМО оптимизировали алгоритм, который находит рак легких
День борьбы с раком легких отмечается 1 августа. Это важная дата: от заболевания ежегодно умирают два миллиона человек. Чтобы повысить шансы пациентов на выздоровление, важно находить болезнь на ранней стадии. Для этого врачи используют разнообразные методы, в том числе технологии машинного зрения. Одну из таких программ уже несколько лет оптимизируют студенты Университета ИТМО. Она помогает быстрее и точнее находить опухоли на снимках.
Врачи диагностируют заболевания легких несколькими способами. Флюорографию используют для быстрого скрининга большого числа людей. Более информативные снимки получаются при рентгеновском исследовании. Чтобы обнаружить болезнь на ранних стадиях, используют компьютерную томографию (КТ). Во время этого исследования врач получает послойные изображения тканей. На них можно распознать новообразования, даже если человек еще не испытывает явных симптомов.
Бывает, что обнаружить рак на КТ-снимках сложно даже опытным врачам. Чтобы обработка данных стала быстрее, специалисты предлагают использовать методы машинного зрения. Они автоматически обрабатывают и анализируют изображения с помощью обученных алгоритмов. Эти технологии не заменяют врача, но помогают оптимизировать и ускорить процесс.
В 2020 году студенты ИТМО разработали программу, которая обнаруживает опухоли легких на КТ-снимках. Она работает по алгоритму сверточной нейронной сети (CNN), которую предварительно обучили на снимках. Изображения состоят из пикселей, которые содержат данные. Сетку пикселей можно представить в виде матрицы. С помощью специальных математических функций (суммирования или фильтрации) она сворачивается. Из-за этого число данных постепенно уменьшается, и остается только информация, которая отвечает за отличительные признаки. По этим участкам нейронная сеть сверяет изображения и распознает легкие. Программа работает в два этапа: сначала определяет полости легких, а потом, используя специальный классификатор, ищет в них новообразования. Одно изображение обрабатывается 2,15 секунды, точность анализа — почти стопроцентная. Однако есть и недостатки: из-за многоэтапности анализ снимков происходит медленно, а обучать алгоритм сложно.
Недавно студенты Высшей школы цифровой культуры ИТМО улучшили программу и ускорили процесс обработки изображений. Теперь он занимает 0,38 секунды, а точность по-прежнему высока. Для этого исследователи обучили модель на основе технологии U-Net. Она обрабатывает биомедицинские изображения, а потом точнее и быстрее выделяет нужные сегменты. Два этапа превратились в один: теперь после свертывания алгоритм не находит легкие и опухоли по отдельности, а сразу определяет все заданные области.
Иллюстратор: Анжелика Василенко
Иллюстрация на обложке: unsplash.com
