OpenAI는 AI 모델 훈련을 위한 데이터 수집을 목적으로 공공 참여를 요청합니다.

OpenAI는 AI 모델의 향상을 위해 독창적인 도메인 특화 데이터를 적극적으로 찾고 있으며, 다양한 주제와 맥락에 대한 더 정교한 이해를 목표로 하고 있습니다. 이를 위해 OpenAI 데이터 파트너십 프로그램을 도입하여, GPT-4와 새로 출시된 GPT-4 Turbo와 같은 고급 모델 훈련에 필수적인 공공 및 민간 데이터셋을 수집하는 데에 대중의 참여를 초대하고 있습니다.

OpenAI는 특히 온라인에서 쉽게 얻을 수 없는 방식으로 인류 사회를 잘 포괄하는 대규모 데이터셋의 선별에 주력하고 있습니다. 이 이니셔티브는 텍스트, 이미지, 오디오 및 비디오 등 다양한 매체를 포함하고 있으며, 파편화된 데이터 포인트가 아닌, 인간의 의도를 표현하는 긴 형식의 글쓰기나 포괄적인 대화를 담은 데이터셋을 찾고 있습니다.

현재 OpenAI는 언어 능력을 향상하기 위해 여러 기관과 협력하고 있습니다. 예를 들어, 아이슬란드 정부 및 Miðeind ehf.와 협력하여 아이슬란드어에 특화된 데이터셋을 개발하고 있으며, Free Law Project와의 파트너십을 통해 방대한 법률 문서 컬렉션을 활용하여 AI 훈련을 풍부하게 하고, 법률 지식에 대한 접근을 민주화하는 데 기여하고 있습니다.

데이터 파트너십 프로그램의 목표는 더 많은 조직이 AI 기술 개발에 영향을 미칠 수 있도록 하여, 기여한 콘텐츠에 기반해 보다 관련성 있고 유용한 AI를 만드는 것입니다. 이 협력 노력은 인간 경험과 사회적 요구의 복잡성을 반영하는 다양한 데이터셋과의 참여의 중요성을 강조합니다.

그러나 OpenAI는 데이터 수집의 윤리적 관행을 지키기 위해 최선을 다하고 있습니다. 조직은 민감한 개인 정보나 제3자 소유의 데이터를 데이터셋에 포함할 의도가 없음을 분명히 했습니다. 대신, 더 넓은 AI 커뮤니티가 활용할 수 있는 오픈 소스 데이터셋을 만드는 데 중점을 두고 있으며, 특정 용도를 위한 민간 데이터셋도 준비할 가능성을 염두에 두고 있습니다.

OpenAI의 CEO인 샘 올트먼은 최근 기업 고객과 협력하여 맞춤형 AI 모델을 개발할 계획을 발표했습니다. 그는 이 서비스가 초기에는 많은 기업에 부담이 될 수 있다고 언급했지만, 맞춤형 솔루션에 투자할 의향이 있는 이들에게는 획기적인 발전의 잠재력을 강조했습니다. 올트먼은 새로운 모델과 업데이트 발표 이후 관심이 급증했으며, 그로 인해 수요가 증가하고 플랫폼에서 일부 서비스의 변동성이 발생하고 있다고 밝혔습니다.

관련된 발전으로, OpenAI는 ChatGPT가 DDoS 공격을 받았던 사실을 확인했으며, 2일 만에 완전한 기능을 복원했습니다. 이 사건은 AI 기술에 대한 관심과 활용이 증가하고 있음을 보여주며, 이러한 빠른 성장과 관심에 따른 도전 과제를 강조합니다.

Most people like

Find AI tools in YBX