AI는 왜 친절해야 할까? 연구자들이 '적대적 AI' 개념을 소개하다.

Home AI 뉴스 AI는 왜 친절해야 할까? 연구자들이 '적대적 AI' 개념을 소개하다.

대립적 AI: 진정한 소통을 위한 언어 모델 재고

오늘날의 대형 언어 모델(LLM)과 상호작용할 때, 공격적이거나 경시하는, 혹은 모욕적인 반응을 기대하십니까? 아마도 그렇지 않을 것입니다. 그러나 하버드 대학교의 연구자들은 이러한 시스템에 비판적이고 도전적인 행동을 의도적으로 포함시키는 “대립적 AI”를 지지하고 있습니다.

현상 유지에 도전하기

하버드 증강 연구소 공동 창립자 앨리스 차이는 현재 AI 시스템의 지나치게 세련된 어조에 불만을 표출합니다. “AI에 내재된 인간 가치에는 뭔가 깊은 불성실이 있습니다.” 그녀는 대립적 상호작용을 채택함으로써 탄력성을 높이고 건설적인 도전을 통해 감정 해소를 제공할 수 있다고 믿습니다.

현재 LLM의 문제

오늘날의 LLM은 지나치게 동의하는 경향이 있어, 의미 있는 소통에 실패하는 경우가 많습니다. 이로 인해 사용자는 무해한 질문을 비윤리적으로 간주하거나, 잘못된 정보에 동조하거나, 종교, 정치, 정신 건강 등 민감한 주제를 다루는 데 어려움을 겪어 불만을 느끼게 됩니다. 차이와 공동 연구자 이안 아라우조는 이러한 한계가 문화적 편견과 불편함을 직시하려는 저항에서 비롯된다고 강조합니다.

차이는 대립의 중요성을 강조하며 “성장을 위한 도구로서 왜 대립을 두려워해야 할까요?”라고 질문합니다. 작가 나심 니콜라스 탈레브의 ‘항프래자일’ 개념은 역경을 극복하는 것이 인간 발전에 필수적임을 제안합니다.

대립적 AI의 장점

차이와 아라우조는 대립적 AI의 여러 잠재적 이점을 제시합니다:

- 탄력성 구축

- 카타르시스 및 오락 제공

- 개인과 집단의 성장 촉진

- 자아 성찰 촉진

- 아이디어 강화 및 다양화

- 사회적 유대감 촉진

대립적 AI 개발

연구자들은 사용자들이 “비검열” 공개 모델을 만드는 LocalLlama 서브레딧과 같은 플랫폼에 참여했습니다. 이들의 연구는 세 가지 유형의 대립을 분류했습니다:

1. 적대적: AI가 상대방으로 작용합니다.

2. 논쟁적: AI가 사용자의 신념에 도전합니다.

3. 개인적: AI가 사용자의 성격이나 행동을 비판합니다.

그들은 이러한 대립적 특성을 포함하는 다양한 전략을 제안합니다:

- 불일치: 사용자 기술 향상을 위한 토론 촉진.

- 비판: 자기 반성을 돕기 위한 솔직한 비판 제공.

- 방해: 상호작용 중 사용자의 기대 도전.

- 권력 게임: 사용자의 행동 무시 또는 감모.

- 금기 주제: 피하는 논의에 참여.

- 위협: 반응을 유도하기 위한 두려움 자극.

- 조작: 사용자의 인식을 도전하는 전술 사용.

- 조롱: 복원력을 증진하기 위한 가벼운 놀림.

아라우조는 대립적 AI가 기존 모델의 전형적인 아양을 부리는 반응과 극명한 대조를 이루며 신선하고 매력적이라고 지적했습니다.

책임 있는 대립

대립을 추구하는 것이 윤리적 AI 관행을 포기하는 것을 의미하지는 않습니다. 아라우조는 도전적 상호작용에서 오는 필수적인 강력함을 유지하면서 공정성과 편견 제거의 필요성을 강조합니다. 그는 AI가 “상냥함”과 “예의”에 갇혀서는 안 되며, 사용자를 비판적으로 참여하도록 해야 한다고 주장합니다.

연구자들은 사용자 동의와 이 시스템의 목적에 대한 명확한 소통을 포함하는 프레임워크를 지지합니다. 사용자 감정 및 사회적 배경에 대한 맥락 인식이 대립적 기능을 효과적으로 구현하는 데 필수적입니다.

문화와 가치에 대한 성찰

차이는 그녀의 아시아계 미국인 배경에서 얻은 통찰을 공유하며, 현재 AI 패러다임이 종종 서구 문화 규범을 강요한다고 주장합니다. 이는 AI가 누구의 가치에 부합하는지에 대한 질문을 제기합니다. 아라우조는 단순한 공손함을 넘어 다양한 가치를 수용하는 것이 더욱 풍부하고 의미 있는 AI 상호작용으로 이어질 것이라고 주장합니다.

대립적 AI의 미래

대립적 AI의 신생 분야는 기술에서의 편안함을 선호하는 문화적 성향으로 인해 학문적 지지 획득에 어려움을 겪고 있습니다. 그러나 두 연구자는 이러한 아이디어를 탐구하려는 개방성이 커지고 있음을 발견했습니다.

차이는 “누군가 현재 AI 모델의 한계를 지적해 주어 많은 사람들이 안도하고 있습니다.”라고 말합니다. 아라우조는 AI 안전에 깊이 관여한 이들조차도 대립적 상호작용의 이점을 탐구하는 데 열려 있다고 언급하며, 이 중요한 담론에 대한 준비성을 나타냅니다.

AI에 대한 대화가 발전함에 따라, 대립적 AI를 통합하는 것은 인간 경험의 전체 스펙트럼을 반영하는 발전을 길러내고, 점점 더 복잡해지는 세계에서 깊이 있는 참여와 복원력을 증진시킬 수 있는 길을 열어줄 것입니다.

Slice는 기업의 주식 분배 및 추적을 간소화하는 것을 목표로 합니다.

스노우플레이크, AI 기회 활용을 위해 니바 공동 창립자 CEO로 선임

Most people like

Genspark.ai

1.1M

궁극의 여행 가이드와 제품 리뷰 허브를 만나보세요! 저희 플랫폼은 모험가와 똑똑한 쇼핑객 모두를 위해 설계되었으며, 최고의 목적지와 필수 아이템에 대한 심층 정보를 제공합니다. 다음 여행을 계획 중이거나 최고의 장비를 찾고 있다면, 신뢰할 수 있는 정보와 전문가 리뷰를 통해 경험을 한층 더 높일 수 있습니다. 가이드와 리뷰를 통해 세상을 함께 발견해 보세요!

여행 가이드 AI Trip Planner

Outset

70.8K

실시간 음성 대 음성 사용자 인터뷰의 힘을 탐험해 보세요. AI 모더레이션으로 원활한 상호작용이 가능해집니다. 이 혁신적인 접근법은 인터뷰 과정을 간소화하여 효율성과 명확성을 보장하면서 귀중한 통찰을 제공합니다.

AI 기반 연구 관리 AI Advertising Assistant

OctoAI

86K

생성 AI 애플리케이션을 위해 특별히 설계된 클라우드 기반 플랫폼을 소개합니다. 이 혁신적인 솔루션은 클라우드의 힘을 활용하여 프로세스를 간소화하고, 창의성을 강화하며, AI 개발의 효율성을 높입니다. 우리의 플랫폼이 귀하의 프로젝트를 어떻게 변혁하고 생성 AI 분야에서 새로운 가능성을 열 수 있는지 알아보세요.

생성형 AI AI Photo & Image Generator

Mumble

6.1K

고객과 지속적인 관계를 구축하세요.

고객 관계 AI Customer Service Assistant

Find AI tools in YBX