Система распознавания COVID по голосу в Serverspace
Студент Университета ИТМО создал программу, позволяющую определять зараженного COVID-19 по аудиоданным. Система анализирует аудио, чтобы определить, есть ли у человека признаки заболевания. Точность прогнозирования – 91,7%. В облаке Serverspace будет развернут Telegram-бот, определяющий заболевание по загруженным голосовым данным.
Владимир Шилоносов – студент Санкт-Петербургского Национального Исследовательского Университета ИТМО, обучающийся по направлению Нейротехнологии и программная инженерия. Он работает над проектом системы, способной распознавать COVID по аудиоданным. Для достижения этой цели было применено разнообразие методов классического ML, среди которых выбирался оптимальный. В процессе оценки были использованы методы: k-ближайших соседей, логистическая регрессия, случайный лес и дерево принятия решений.
Все модели были обучены с использованием k-fold cross-validation и различными комбинациями параметров. Это позволило оценить их точность на валидационных данных и выбрать наиболее эффективную модель. В результате дерево принятия решений продемонстрировало самые точные результаты среди всех рассмотренных моделей.
В результате анализа предоставленных данных, был проведен отбор важных признаков, которые используют различные характеристики звуковых колебаний. Используя собранные данные, модель учится прогнозировать вероятность наличия признаков COVID-19 у человека.
Владимир собирается сделать этот проект доступным для широкого круга пользователей и протестировать его на реальных людях. Поэтому он разрабатывает Telegram-бот, который будет размещен в Serverspace. С помощью бота можно будет делать аудиозаписи и отправлять их для распознавания признаков и предсказания наличия заболевания. Результаты будут выдаваться в числовом формате: 0 – здоровый человек, нет признаков COVID, 1 – есть признаки COVID. Реализация подобного проекта открывает возможности для людей быстро получать информацию о своем здоровье и предпринимать необходимые меры по защите.