Фальшивки для науки

Почему исследователи используют искусственный интеллект для "подделки" медицинских данных
Ученые использовали генеративно-состязательные сети для создания DeepFake-изображений, чтобы собрать информацию для тренировки алгоритма выявления заболеваний, не нарушая политику конфиденциальности в отношении данных пациентов.
Deepfake - производное от слов «глубинное обучение» (англ. Deep learning) и «подделка» (англ. Fake) - методика синтеза изображений, основанная на искусственном интеллекте.
Для эффективного обучения, современным системам искусственного интеллекта необходим большой массив данных. Конечно, если вам нужен алгоритм для распознавания породы котиков в видео - вы идете на YouTube за информацией и учите машину. Но не любые данные можно добыть так просто.

Исследователи, чей целью является раннее выявление заболеваний с помощью искусственного интеллекта, постоянно сталкиваются с барьерами конфиденциальности данных пациентов и редкими случаями заболеваний, изображений по которым катастрофически мало.

Но с подключением генеративно-состязательных сетей, создающих реалистичные медицинские изображения, искусственный интеллект сможет справиться и с этими барьерами.
Генеративно-состязательная сеть (ГСС) - алгоритм машинного обучения без "учителя", построенный на комбинации из двух нейронных сетей, одна из которых генерирует образцы, а другая старается отличить подлинные образцы от неподлинных.

Так как сети G и D имеют противоположные цели — создать образцы и отбраковать их — между ними возникает антагонистическая игра.

Генеративно-состязательную сеть описал Ян Гудфеллоу из компании Google в 2014 году.
Использование этой техники позволяет в частности генерировать фотографии, которые человеческим глазом воспринимаются как натуральные изображения. Например, известна попытка синтезировать фотографии кошек, которые вводят в заблуждение эксперта, считающего её естественными фото. Кроме того GAN может использоваться для улучшения качества нечётких или частично испорченных фотографий.

В исследовании NVIDIA, проведенном совместно с MGH & BWH Center for Clinical Data Science и Mayo Clinic, ученые показали, как они использовали генеративно-состязательные сети, которые учатся и улучшают себя, для создания синтетических МРТ-изображений, на которых изображены вариации опухоли мозга.
Изображение мозга реального пациента на МРТ и искусственное изображение, созданное с помощью генеративно-состязательной сети.
[Image: courtesy Shin et al.]
Для тренировки сети, исследователи использовали два открытых набора МРТ-изображений мозга: на одном были зафиксированы проявления болезни Альцгеймера, на втором - опухоли мозга. Получившиеся изображения были настолько неотличимы от реальных, что использование только 10% данных пациентов и 90% - искусственных было так же эффективно, как и на реальных изображениях.

У использования технологии генеративно-состязательных сетей есть и ограничения. Так, ГСС не могут создавать изображения с деталями, которых нет в их базе, а так как биология возникновения заболеваний мозга не изучена на 100%, создание изображений с нуля тоже не кажется ученым приемлемым вариантом. Тем не менее, ГСС способны дополнять МРТ-изображения опухолями разного размера и перемещать их в исследуемом поле так, как это происходит в реальной жизни.
Другое исследование в области применения генеративно-состязательных сетей в медицине показывает эффективность ГСС в области дерматологии - создает реалистичные изображения повреждений кожи, а также области классификации поражений печени.
Майкл Абрамофф, профессор офтальмологии в Университете Айовы и президент компании IDx, которая создала систему искусственного интеллекта для диагностики заболеваний глаз, вызванных диабетом, считает, что ГСС потенциально полезен для медицинских исследований, но в своей технологии они не используют синтетические изображения. Майкл считает, что технология не изучена настолько, чтобы использовать ее в клинических условиях
Подписывайтесь на наш блог
Чтобы быть в курсе новостей о Биомис
Нажимая на кнопку, вы даете согласие на обработку персональных данных и соглашаетесь c политикой конфиденциальности
Александра Митрошкина
Глава отдела маркетинга Биомис
Опубликовано 18 декабря 2018 года.
В материале использованы данные исследования.