Google Gemini:個人健康洞察的新前沿
雖然 Google Gemini 只問世六個月,但已在安全性、編碼和除錯等領域顯示出非凡的能力,同時也暴露出一些顯著的局限性。現在,這款大型語言模型(LLM)在提供睡眠和健身建議方面超越了人類專家。
推出個人健康大型語言模型 (PH-LLM)
Google 的研究團隊揭示了專為解讀和分析來自可穿戴設備(如智能手錶和心率監測器)的時間序列個人健康數據而設計的個人健康大型語言模型 (PH-LLM)。在比較實驗中,PH-LLM 的表現始終超越了健康與健身領域的資深專業人士。研究人員表示:「我們的工作擴展了模型的實用性,不僅限於預測健康狀態,還能基於複雜的健康行為生成連貫、有上下文的潛在處方結果。」
Gemini 作為睡眠與健身顧問
可穿戴技術提供了持續的健康監測數據流,包括運動和飲食日誌、情緒日記,甚至社交媒體活動。然而,研究人員指出,來自睡眠、身體活動、心血管代謝健康和壓力的數據所產生的有價值洞察在臨床環境中往往未能得到充分利用,這主要是由於上下文和分析的挑戰。儘管 LLM 在醫療問答、電子健康記錄分析和精神評估方面表現出色,但在針對可穿戴數據進行解釋和推薦行動時卻遇到困難。PH-LLM 的突破在於其能夠針對睡眠質量和健身提供個性化建議和預測。
在測試中,PH-LLM 在睡眠考試中獲得驚人的79%和健身評估中的88%,超越了專業教練和睡眠專家平均的71%和76%。
展示其能力
在一個例子中,當被要求分析一位50歲男性的睡眠數據時,PH-LLM 識別出入睡困難等問題,並強調深度睡眠對恢復的重要性。它提供了可行的建議:「保持臥室涼爽和黑暗,避免午睡,並保持一致的睡眠時間表。」在詢問關於臥推過程中的肌肉收縮時,PH-LLM 正確地識別出收縮類型為「離心收縮」。在另一個涉及可穿戴數據的自報睡眠問題的實例中,它準確預測了入睡困難。
研究人員總結道:「這些結果突顯了 Gemini 模型的廣泛知識基礎和能力,強調在安全關鍵的個人健康領域進一步發展的必要性。」
由數據驅動的個性化洞察
為了達到這些結果,研究人員策劃了三個數據集,評估基於身體活動、睡眠模式和生理反應的個性化洞察和建議。他們與行業專家合作開發了857個案例研究(507個與睡眠相關,350個與健身相關)。每個案例研究整合了長時間的可穿戴傳感器數據、人口統計信息和專家解讀。
這些研究檢查了多種指標,包括總睡眠得分、心率、睡眠時長和活躍程度,並針對改善睡眠衛生和健身提供了個性化建議。研究人員指出:「我們的研究顯示,PH-LLM 能有效整合從可穿戴設備被動收集的數據,提供量身定制的洞察和建議,以改善健康結果。」
個人健康應用面臨挑戰
儘管如此,研究人員承認,PH-LLM 仍處於起步階段,需要進一步完善。有些模型生成的回答缺乏一致性,且在各個案例研究中存在聯想虛構的情況。模型偶爾忽略了睡眠和健身的重要方面,顯示出訓練樣本可能未充分代表更廣泛的人群健康問題。「我們強調,仍需大量工作以確保 LLM 在個人健康應用中的可靠性、安全性和公平性,」研究人員寫道。這包括減少聯想虛構、關注特殊健康情況以及確保多樣化的訓練數據。
總的來說,研究人員主張:「這項研究標誌著邁向創建提供個性化資訊和建議的 LLM 的重要里程碑,賦予個人更好地實現健康目標的能力。」