애플, AI 훈련에 유튜브 자막 사용 논란 해명
7월 18일, 애플과 엔비디아와 같은 기술 대기업이 유튜브 자막을 사용해 인공지능 모델을 훈련시켰다는 보고서가 공개되면서 큰 논란이 일었습니다. 애플은 이후 데이터 사용의 의도와 성격을 명확히 하며 이에 응답했습니다.
애플은 올해 4월에 출시된 오픈소스 OpenELM 모델을 훈련하기 위해 유튜브 데이터셋을 사용했다고 확인했습니다. 하지만 애플은 OpenELM이 "Apple Intelligence" 서비스 등 자사의 AI 또는 머신러닝 기능을 지원하는 데 사용되지 않음을 강조했습니다. 이 모델은 주로 기술 연구를 발전시키고 오픈소스 대형 언어 모델의 성장을 촉진하기 위해 개발되었습니다. 애플 연구원들은 OpenELM을 "최첨단 오픈소스 언어 모델"이라고 언급했습니다.
애플의 발표에 따르면, OpenELM의 개발은 전적으로 연구 목적으로 이루어졌으며, 이는 오픈소스로 공개되어 연구자들에게 널리 접근 가능하다고 합니다. OpenELM은 애플의 AI 서비스와 분리되어 있기 때문에, 유튜브 자막 데이터는 해당 서비스의 훈련에는 활용되지 않았습니다.
또한 애플은 자사의 AI 서비스 모델이 특정 기능을 강화하기 위해 선정된 라이센스 데이터와 웹 크롤러를 통해 수집된 공개 데이터를 사용하여 훈련된다고 밝혔습니다. 현재 OpenELM 모델의 새로운 버전을 개발할 계획은 없다고 덧붙였습니다.