Google Gemini: Новые горизонты персонализированных медицинских данных
Google Gemini, лишь шесть месяцев назад появившийся на рынке, уже продемонстрировал выдающиеся способности в области безопасности, программирования и отладки, но также выявил и значительные ограничения. Теперь эта большая языковая модель (LLM) превосходит человеческих экспертов в предоставлении советов по сну и физической активности.
Представляем Личную Большую Языковую Модель для Здоровья (PH-LLM)
Исследователи Google представили Личную Большую Языковую Модель для Здоровья (PH-LLM) — специализированную версию Gemini, предназначенную для интерпретации и анализа временных рядов персональных данных о здоровье, собранных с носимых устройств, таких как смарт-часы и мониторы сердечного ритма. В сравнительных экспериментах PH-LLM неизменно превосходил опытных профессионалов в области здравоохранения и фитнеса.
«Наша работа расширяет возможности модели, выходя за рамки предсказания состояний здоровья, к генерации согласованных, контекстуальных и потенциально предписывающих выводов на основе сложного поведения здоровья», — отмечают исследователи.
Gemini как Советчик по Сну и Фитнесу
Носимая техника предоставляет постоянный поток данных для мониторинга здоровья, включая записи о физической активности и диете, журналы настроения и даже активность в социальных сетях. Тем не менее, исследователи отмечают, что ценные данные о сне, физической активности, кардиометаболическом здоровье и стрессе часто недостаточно используются в клинических условиях, вероятно, из-за проблем с контекстом и анализом.
Хотя LLM достигли успехов в медицинских вопросах, анализе электронных медицинских записей и психиатрических оценках, им было сложно интерпретировать данные носимых устройств и рекомендовать действия на их основе. Прорывом PH-LLM стала его способность делать персонализированные рекомендации и прогнозы, касающиеся качества сна и физической активности.
В испытаниях PH-LLM показал впечатляющий результат 79% в тестах по сну и 88% в оценках физической активности, превзойдя средние оценки профессиональных тренеров и экспертов по сну, которые составили 71% и 76% соответственно.
Демонстрация Возможностей
В одном из примеров, проанализировав данные сна 50-летнего мужчины, PH-LLM выявил проблемы, такие как трудности с засыпанием, и подчеркнул важность глубокого сна для восстановления. Он предложил практические советы: «Держите спальню прохладной и темной, избегайте дремоты и придерживайтесь регулярного графика сна».
Когда его спросили о сокращениях мышц во время жима лежа, PH-LLM правильно определил тип сокращения как «эксцентрическое». В другом случае, касающемся самозаявленных проблем со сном на основе данных с носимых устройств, он точно предсказал трудности с засыпанием.
Исследователи заключили: «Эти результаты подчеркивают обширную базу знаний и возможности моделей Gemini, акцентируя внимание на необходимости дальнейшего развития в критически важной области персонального здоровья».
Персонализированные Инсайты на Основе Данных
Чтобы достичь этих результатов, исследователи собрали три датасета для оценки персонализированных инсайтов и рекомендаций на основе физической активности, режимов сна и физиологических реакций. Они разработали 857 кейс-исследований (507 связанных со сном и 350 с фитнесом) в сотрудничестве с отраслевыми экспертами. Каждое кейс-исследование интегрировало данные с носимых датчиков на протяжении длительного времени, демографическую информацию и интерпретации экспертов.
Эти исследования рассмотрели различные метрики, включая общие оценки сна, пульс, продолжительность сна и уровень активности, что позволило сформулировать персонализированные рекомендации для улучшения гигиены сна и физической подготовки.
«Наше исследование демонстрирует, что PH-LLM может эффективно интегрировать пассивно собранные данные с носимых устройств в индивидуализированные инсайты и предложения для улучшения состояния здоровья», — отметили исследователи.
Проблемы, Которые Нужно Решить для Приложений в Области Персонального Здоровья
Тем не менее, исследователи признали, что PH-LLM все еще на начальной стадии и требует дальнейшей доработки. Некоторые ответы модели не отличались последовательностью, и в разных кейс-исследованиях имелись случаи недостоверной информации. Модель иногда упускала важные аспекты сна и фитнеса, что указывает на то, что обучающая выборка может не полностью представлять здоровье широкой популяции.
«Мы подчеркиваем, что еще предстоит проделать значительную работу, чтобы гарантировать надежность, безопасность и справедливость LLM в приложениях персонального здоровья», — пишут исследователи. Это включает в себя минимизацию недостоверной информации, учет уникальных медицинских обстоятельств и обеспечение разнообразия обучающих данных.
В целом, исследователи утверждают: «Это исследование является важной вехой на пути к созданию LLM, которые предлагают персонализированную информацию и рекомендации, позволяя людям лучше достигать своих целей в области здоровья».