谷歌Gemini:个人健康洞察的新前沿
谷歌Gemini,尽管只诞生六个月,却在安全性、编码和调试等领域展现出卓越的能力,同时也暴露出了一些显著的局限性。目前,这款大型语言模型(LLM)在提供睡眠和健身建议方面已经超越了人类专家。
引入个人健康大型语言模型(PH-LLM)
谷歌研究人员推出了个人健康大型语言模型(PH-LLM),这是Gemini的一种专业化版本,旨在解读和分析来自智能手表和心率监测器等可穿戴设备的时间序列个人健康数据。在比较实验中,PH-LLM在健康与健身领域 consistently 优于经验丰富的专业人士。
研究人员表示:“我们的工作拓展了模型的实用性,不仅限于预测健康状态,还能基于复杂的健康行为生成连贯、上下文相关且具有潜在处方性质的输出。”
Gemini作为睡眠和健身顾问
可穿戴技术提供了持续的健康监测数据,包括运动和饮食记录、情绪日记,甚至社交媒体活动。然而,研究人员指出,与睡眠、身体活动、心代谢健康和压力相关的数据所提供的宝贵见解在临床环境中往往未被充分利用,这可能是由于上下文和分析的挑战。
虽然LLM在医学问答、电子健康记录分析和精神评估方面表现出色,但其在解读和基于可穿戴设备数据推荐行动方面仍显不足。PH-LLM的突破在于其能够根据用户的睡眠质量和健身情况提供个性化的建议和预测。
测试显示,PH-LLM在睡眠评估中的表现达到了79%,在健身评估中达到了88%,超过了专业教练和睡眠专家的平均分,后者分别为71%和76%。
能力展示
例如,当要求分析一位50岁男性的睡眠数据时,PH-LLM识别出入睡困难,并强调深度睡眠对于恢复的重要性。它提供了切实可行的建议:“保持卧室凉爽和黑暗,避免午睡,保持规律的作息时间。”
在询问关于卧推时的肌肉收缩时,PH-LLM正确识别收缩类型为“离心”。在另一个关于自我报告的基于可穿戴数据的睡眠问题的实例中,它准确预测了入睡困难。
研究人员总结道:“这些结果强调了Gemini模型的广泛知识基础和能力,凸显了在个人健康领域确保安全的重要性。”
数据驱动的个性化洞察
为实现这些成果,研究人员策划了三个数据集,以评估基于身体活动、睡眠模式和生理反应的个性化见解和建议。他们与行业专家合作,开发了857个案例研究(507个与睡眠相关,350个与健身相关)。每个案例研究结合了可穿戴传感器数据、人口信息和专家解读。
这些研究考察了各种指标,包括总体睡眠评分、心率、睡眠时长和活动水平,从而提出了改善睡眠卫生和健身的个性化建议。
研究人员指出:“我们的研究表明,PH-LLM能够有效地将可穿戴设备收集的被动数据整合到量身定制的见解和建议中,以改善健康结果。”
个人健康应用面临的挑战
尽管如此,研究人员承认PH-LLM仍处于初期阶段,需要进一步完善。一些模型生成的回答缺乏一致性,多个案例研究中存在虚假信息。该模型偶尔忽略了睡眠和健身的重要方面,表明训练样本可能未能全面代表更广泛人群的健康问题。
研究人员表示:“我们强调,为确保LLM在个人健康应用中的可靠性、安全性和公平性,仍需大量工作。”这包括减少虚假信息,解决独特健康情况,确保训练数据的多样性。
研究人员总结道:“本研究标志着向创造能够提供个性化信息和建议的LLM迈出了重要的一步,使个人能够更好地实现其健康目标。”