Биостатистика: где ее применяют и преподают
Что такое биостатистика и почему студентам — медикам и биологам — важно в ней разбираться? Расскажем, где этому учат и как применяют такие знания.
Методы биостатистики
Биостатистика — это научная дисциплина, которая занимается разработкой и применением статистических методов для анализа данных в биологии, медицине и смежных областях. Она позволяет выявлять закономерности, проверять гипотезы и делать прогнозы.
Несколько последних столетий врачи искали закономерности в данных о заболеваемости и смертности. Прорыв произошел в прошлом веке благодаря трудам британских статистиков Рональда Фишера, Карла Пирсона и Уильяма Госсета — появились методы, которые легли в основу современной биостатистики. Сегодня эта наука связана не только с медициной — ее подходы находят применение в генетике, экологии, сельском хозяйстве и других областях. Развитие вычислительной техники позволило анализировать огромные массивы данных и использовать сложные математические модели.
«В эпоху так называемой информационной перегрузки, доказательной медицины и персонализации терапии возрастает необходимость разбираться в статистике, в том числе у исследователей в области медицины и биологии. Понимание ее основ требуется для метаанализа и систематических обзоров, для того чтобы результаты исследований стали частью общего массива знаний, для принятия решений на основе анализа информации, а также для оптимизации разрабатываемых предиктивных моделей», — объясняет руководитель отдела биостатистики компании «ОСТ» доктор биологических наук Ирина Бондарева.
Биостатистика включает многочисленные методы, которые можно разделить на две большие группы:
- Описательная статистика: расчет статистических характеристик выборки, например, среднего значения, стандартного отклонения, медианы, квартилей и всего того, что позволяет описательно представить имеющиеся данные.
- Инференциальная статистика: предполагает использование выборки для оценки характеристик генеральной совокупности или целевой популяции, а также для тестирования гипотез в отношении этой популяции. Методы теории вероятностей и статистические модели здесь применяются для вероятностной оценки определенных исходов, для тестирования гипотез, прогнозов и выводов. Результаты обычно представляются в терминах р-значений, доверительных интервалов для отражения неопределенности и размера эффекта. Инференциальная статистика — мощный инструмент, но нужно вдумчиво выбирать методы анализа с учетом предположений, лежащих в их основе, с учетом дизайна исследования, смысла и качества тестируемых данных.
Оба подхода во-многом схожи и подразумевают анализ выборки для получения значимой информации. Описательная статистика предполагает обобщение для описания характеристик набора данных, а инференциальная статистика использует его для формирования выводов или прогнозов для большой популяции. Хотя сами методы могут различаться, и тот и другой подходы основаны на использовании статистических методов для анализа данных. При этом описательная статистика обычно оценивает главную тенденцию, разброс и распределение данных выборки, графические методы также помогают в представлении распределения анализируемой информации. В то время как инференциальная статистика позволяет обобщать результаты, делать статистические выводы и разрабатывать статистические модели для прогнозирования в популяции.
Где используют биостатистику
Одно из применений биостатистики — клинические исследования. Благодаря математическим методам разрабатываются лекарства, оцениваются их эффективность и безопасность.
В генетике биостатистика помогает анализировать геномные данные. С ее помощью находят связи между генетическими вариациями и риском заболеваний. Например, анализ ассоциаций всего генома (GWAS) выявляет гены, связанные с наследственными заболеваниями.
В экологии биостатистика используется для мониторинга биоразнообразия, оценки последствий загрязнения, а также для прогнозирования изменений климата. Например, статистический анализ помогает понять, как меняющаяся температура влияет на популяции животных и растений.
Эпидемиологи используют биостатистику для анализа распространения инфекционных заболеваний, моделирования эпидемий и оценки эффективности профилактических мер. Так, во время пандемии COVID-19 биостатистика сыграла ключевую роль в разработке вакцин и того, как будет развиваться вирус.
Главный вызов современной биостатистики связан с необходимостью анализа гигантских массивов данных. Возможно, эту проблему решат с помощью квантовых компьютеров. Ключевой задачей также стала интеграция в этот процесс искусственного интеллекта.
Обучение биостатистике
Биостатистик должен знать: основы статистики, математики, биологии и медицины, а еще хотя бы один язык программирования (в биостатистике чаще всего используют R, Python и SAS). Сейчас все больше вузов предлагают студентам обучение по этому направлению. Не исключение и Научно-технологический университет «Сириус». Там совместно с компанией «ОСТ» провели интенсивный курс «Базовые методы математической статистики в биологии и медицине». Он стал частью передовой программы магистратуры «Молекулярная медицина».
«Цель нашего курса — дать базовые знания об основных современных методах планирования, статистического анализа и представления результатов медико-биологических исследований. Мы познакомили слушателей с назначением и сущностью наиболее актуальных математико-статистических методов планирования эксперимента, расчетом необходимого размера выборки, описанием и анализом медико-биологических данных, способами корректной интерпретации результатов статистического анализа, современными требованиями к представлению результатов статистического анализа в публикациях. Хотелось сформировать у магистрантов „статистическое мышление“, предполагающее обоснованный выбор дизайна исследования, правильную формулировку его цели и соответствующих гипотез», — отмечает Ирина Бондарева.
В будущем курс по биостатистике планируют тиражировать и на другие магистерские программы Университета «Сириус».