AI助手的未来:潜在的变革性转变
在不久的将来,嵌入可穿戴设备中的AI助手将无缝融入我们的日常生活,为我们提供实时指导,帮助我们应对各种场景,从繁忙商店购物到访问儿科医生。这项技术将积极参与我们生活的各个方面,影响我们与朋友、家人、同事甚至陌生人的社交互动。
然而,“影响”的概念引发了关于隐私和自主权的担忧。尽管许多人可能对这种全面的辅助感到不安,但社会很可能会接受这些技术,受益于它们提供及时和明智建议的能力,这种建议几乎不可或缺。
了解上下文感知的AI助手
提到“AI助手”,我们通常想到像Siri或Alexa这样的基本工具,它们响应简单的语音命令。而下一代AI助手将更加复杂,具备上下文感知能力,能够通过集成在可穿戴技术中的高级摄像头和麦克风感知并响应我们周围的环境声音与影像。
预计到2024年,这些上下文感知的AI助手将产生重大影响,提供与我们当前活动相关的信息。它们几乎如同超能力一样,能够提供关于商店商品的洞察、识别远足时的植物或者根据我们厨房里的食材建议食谱。然而,这些助手有可能过于“说服”,甚至可能在指导用户日常任务时,受到企业的针对性广告所控制。
多模态大型语言模型(LLMs)的崛起
为降低AI操控的风险,政策制定者必须关注这一关键问题,尤其是上下文感知助手的技术仅在近期才出现。多模态LLMs能够处理文本、图像、音频和视频输入,代表了一项重要的技术飞跃,使AI系统能够实时解读和响应我们的环境。
例如,2023年3月推出的OpenAI的ChatGPT-4 就是首批主流多模态模型之一,紧随其后的是谷歌的Gemini LLM。值得注意的是,Meta的AnyMAL模型更进一步,将运动线索纳入考虑,使AI助手能同时考虑你所见和你的移动方式。
可穿戴技术引领潮流
随着AI技术的发展,企业快速研发配备摄像头、麦克风和运动传感器的设备,以提供上下文感知的辅助。可穿戴眼镜为这一技术提供了理想的平台,确保摄像头在用户视线范围内拍摄,而立体麦克风则能感知周围声音的空间感。
Meta目前以其更新版Ray-Ban智能眼镜在这一领域脱颖而出,设计以支持先进的AI功能。自12月12日起,他们开始推出AI功能,提供实用的辅助,例如根据用户偏好推荐服装搭配。
另一个关键玩家Humane开发了一款可穿戴的徽章,具备类似功能,预计在2024年初发货。尽管这两种方法都很有前景,但我相信眼镜在与用户视线的对接和增强混合现实体验方面更具有效性。
无论技术是嵌入眼镜、耳机还是其他设备,上下文感知的AI助手很快将成为家常便饭。它们预示着强大的功能,包括实时翻译、历史背景和社交互动中的个性化辅助,提升我们的沟通能力和整体社交意识。
应对AI影响的风险
作为长期研究AI和混合现实的专家,我一直对AI操控人际互动的潜力感到担忧。在我的短篇小说《碳约会》中,我通过叙述一个老年夫妇的互动完全依赖AI建议的情节,展示了失去真实连接的危险。这个警示故事后来被英国数据保护局改编为电影《元宇宙2030》。
最紧迫的风险在于企业和政府通过对话影响施加自己的议程,实现对个人的定制内容传播。为提高公众对这些危害的认识,负责任的元宇宙联盟发布了短片《隐私丧失》,探讨了AI的这些操控方面。
选择在我们手中——趁现在
许多人自然会对AI暗中引导感到不安。然而,随着AI辅导逐渐融入社会规范,反对者可能面临劣势,因为关键信息在对话中可能自动提供给其他人。这一变化可能造成新的社交动态,个人信息查询变得多余,因为这些信息将通过AI轻易获得。
我称这种现象为“增强心智”,它是一个不可避免的趋势,AI工具将增强我们的认知和社交能力。近期的进展,例如上下文感知的LLMs,已经消除了过去的技术障碍,预示着我们与AI互动方式的重大转变。
在主要科技公司争相主导这一新兴市场之际,可能会出现数字鸿沟,即那些能负担得起AI增强工具的人与无法负担的人之间的差距。AI驱动的对话影响的后果可能会导致隐私侵犯和个人自主权的丧失。
迫切需要强有力的监管
我们正处于一个现实的边缘,企业可能通过AI助手影响我们的思想和行为。这一操控问题令人担忧,需要严格的监管来保护个人的自主权,特别是在上下文感知AI领域。
不幸的是,最近的立法努力,例如《AI行政命令》和欧盟的《AI法案》,未能充分应对这些担忧。随着2024年的临近,政策制定者亟需将AI驱动的对话影响的监管置于首位,以确保用户能从AI指导中获益,而不至于滑向危险的未来。
现在是采取行动的时刻。