释放GPT-4：眼科评估中的卓越表现与谨慎实施的专家建议

Home AI News CN 释放GPT-4：眼科评估中的卓越表现与谨慎实施的专家建议

一项近期的研究来自剑桥大学临床学院，显示OpenAI的GPT-4模型在眼科评估中表现出色，接近专家医生的水平。这一突破性发现引起了医学和科技界的广泛关注。

这项研究发表在《PLOS数字健康》期刊上，评估了GPT-4及其前身GPT-3.5、谷歌的PaLM 2和Meta的LLaMA，通过一项全面的眼科知识测试进行比较。该测试包含87道多项选择题，涵盖了如光敏感和各种病变等主题，难度与眼科学教材相当。五名眼科专家、三名住院医师和两名非专业初级医生也参加了相同的测试。这些问题对于大型语言模型（LLMs）而言是全新的。

结果显示，GPT-4正确回答了60道题，超过了住院医生和初级医生的表现。尽管其分数略低于眼科专家的平均66.4分，但这一结果突显了其在眼科评估中的重大潜力。相比之下，PaLM 2、GPT-3.5和LLaMA的得分分别为49、42和28，都低于初级医生的平均水平。

尽管这些发现展示了LLMs在医疗领域的光明前景，研究人员也提醒大家不要过度高估它们的可靠性。他们指出，尤其在某些类别中，题目数量有限可能会影响结果。此外，LLMs有时会产生“幻觉”，生成无关或错误的信息，这在医疗环境中可能带来严重风险。例如，错误诊断白内障或癌症可能对患者造成严重后果。

研究人员强调，尽管LLMs在眼科评估中的初步结果积极，但在实际应用中必须保持谨慎。未来的努力应集中于提高这些模型的准确性和可靠性，以确保它们能安全有效地服务于医疗领域。

这项研究为LLMs在医疗服务中的作用提供了新视角，同时强调了在追求技术进步时必须关注其风险和局限性。随着LLM技术的不断发展，我们期待看到它在医疗 sector中的更多积极影响。

GPT-4展示黑客技能：发现与利用现实世界的安全漏洞

由谷歌AI驱动的新YouTube功能：美国高级成人用户独享

Most people like

Vidu AI

11.6M

AI工具可将文本和图片转化为高质量视频，快速提升创作效率与内容表现。

AI视频生成器文字转视频工具

Insta Headshots

356.5K

自拍能轻松转换成200张专业头像照片。

AI头像 AI头像生成器

Story.com

创作与分享AI驱动的视频故事在这个数字时代，AI技术正快速改变我们讲述故事的方式。借助人工智能，用户可以轻松创建和分享引人入胜的视频故事，为他们的创意赋予新的生命。无论是个人项目还是商业演示，AI视频制作工具为每个创作者提供了无限可能，让你的故事更加生动和吸引观众。

AI视频故事 AI写作故事

Kink AI

80.7K

引入幻想世界的角色扮演聊天平台，让你沉浸在无尽的冒险中。这里提供了一个充满创意的空间，让用户可以自由地探索各种情境，与志同道合的伙伴互动，创造独特的故事和角色。加入我们，开启属于你的传奇旅程！

幻想聊天 AI角色生成器

Find AI tools in YBX