Нейросеть поможет врачам понять глухих пациентов

Людям с нарушениями слуха обычно трудно объяснить врачу, на что они жалуются. Иногда им помогает сурдопереводчик, но, как правило, приходится брать на прием знакомых. Это создает дополнительные трудности. К тому же не все хотят, чтобы об их болезнях знал кто-то, кроме доктора. Как раз для них — разработка российских ученых.

В Санкт-Петербургском федеральном исследовательском центре разработали программу, которая распознает язык жестов и преобразовывает его в текст. Прежде всего, электронный сурдопереводчик нужен для первичной консультации у терапевта в поликлинике.

Принцип работы прост: видеокамера фиксирует жесты, программа их считывает, переводит в текст и выводит его на экран перед врачом. Точность системы превышает 90 %, пишут разработчики в статье, вышедшей в журнале «Научно-технический вестник информационных технологий, механики и оптики». Сейчас они сосредоточены на создании удобного интерфейса для приложения.

Сколько в мире языков жестов?

Известно бо­лее чем о 100 языках жестов, ис­поль­зуе­мых в раз­ных странах. При этом есть и уни­вер­саль­ные. В середине прошлого века был раз­ра­бо­тан международный язык — жес­ту­но (Gestuno). На нем, например, об­щаются слабослышащие уча­ст­ни­ки кон­фе­рен­ций, со­рев­но­ва­ний и других подобных мероприятий.

Струк­тур­но языки жестов не­за­ви­си­мы от разговорных зву­ко­вых. Их родственные свя­зи не сов­па­да­ют с аналогичными свя­зя­ми национальных язы­ков. Так, жестовый язык российских глу­хих и некоторых стран СНГ род­ст­венен аналогичному во Франции. 

В мире существует более 100 жестовых языков Фото: © Elnur / Shutterstock / FOTODOM

Существует два типа жестовой речи: разговорная и калькирующая. Первая — это самобытная лингвистическая система со своими законами. Вторая просто повторяет построение предложений по правилам русского или любого другого языка, а жесты выступают эквивалентами слов, которые проговаривает человек. При вербальном общении со слышащими людьми глухие читают по губам — это называется «маусинг» (от англ. mouthing). Но если рта говорящего не видно, как в случае с врачом в медицинской маске, такое общение будет невозможно.

Большинство баз данных для автоматического распознавания русского языка жестов основаны на калькирующей речи. Петербургские ученые пошли дальше и внесли в свою разработку слитные высказывания и элементы разговорной. Для этого они записали на видео 85 жестовых высказываний, сделанных 12 дикторами в пяти вариантах. Чтобы программе было легче их распознать, съемка проводилась с разных ракурсов. Оказалось, что некоторые элементы жестового языка зависят от пола и возраста. Эту особенность учли. На основе собранной информации ученые и обучили нейросеть.  

Оцените статью
Поделись знанием