인공지능 분야에서 중요한 발전이 이루어졌습니다. Apple이 최근 클라우드 서버에 의존하지 않고 직접 장치에서 실행할 수 있는 일련의 오픈소스 대형 언어 모델(OpenELM)을 출시했습니다. 이 혁신은 Apple의 AI 리더십을 강화할 뿐만 아니라 자연어 처리 연구 및 응용 분야에 혁신적인 변화를 가져옵니다.
OpenELM의 출시로 Hugging Face 플랫폼에서 AI 자원이 향상되어 전 세계 연구자와 개발자가 협력하고 혁신할 수 있는 공간이 제공됩니다. 이 시리즈에는 CoreNet 라이브러리를 사용하여 사전 훈련된 네 가지 모델과 특정 응용 시나리오를 위해 미세 조정된 네 가지 모델이 포함되어 있습니다.
Apple은 OpenELM 개발 시 층별 스케일링 전략을 채택하여 트랜스포머 모델의 각 층에 매개변수를 효과적으로 분산시키고 정확도를 크게 향상시켰습니다. 약 10억 개의 매개변수를 가진 OpenELM은 OLMo 모델의 정확도를 2.36% 개선하고 필요한 사전 훈련 데이터량을 절반으로 줄였습니다.
중요하게도, OpenELM 출시와 함께 Apple은 모델의 소스 코드, 사전 훈련된 가중치, 포괄적인 훈련 로그, 여러 체크포인트, 사전 훈련 구성 등을 공개했습니다. 이러한 오픈 접근 방식은 연구자와 개발자가 모델을 재현하고 최적화할 수 있도록 해 자연어 처리 분야의 발전을 가속화합니다.
Apple은 OpenELM을 출시한 목적이 최첨단 언어 모델을 통해 "오픈 연구 커뮤니티를 강화하고 풍요롭게 하는 것"이라고 밝히며, 연구자들이 리스크, 데이터 및 모델 편향을 탐구할 방법을 제공한다고 전했습니다. 개발자와 기업은 다양한 실용적인 응용을 위해 모델을 직접 사용하거나 수정할 수 있습니다.
또한, 오픈소스 이니셔티브를 통해 Apple은 최고의 엔지니어, 과학자 및 전문가를 유치할 기회를 마련했습니다. 투명한 정보 공유 정책은 연구자들에게 논문을 발표할 기회를 제공합니다. 이는 Apple의 이전 비밀주의적 관행에서는 제한된 특권이었습니다.
Apple은 아직 자사의 AI 기능을 기기에 완전히 통합하지 않았지만, iOS 18에 여러 새로운 AI 기능이 포함될 것이라는 기대가 큽니다. 루머에 따르면, Apple은 향상된 사용자 개인정보 보호를 위해 자사의 대형 언어 모델을 직접 장치에서 실행할 계획을 가지고 있습니다. 궁극적으로 더 매끄럽고 안전한 경험을 제공할 것입니다.
OpenELM의 출시는 Apple의 인공지능 분야 발전을 위한 튼튼한 기반을 확립한 것이 분명합니다. 더 많은 기업과 연구 기관이 이 오픈소스 프로젝트에 참여함에 따라 자연어 처리 분야는 더 많은 혁신과 돌파구를 경험할 것입니다. 오픈소스 이니셔티브를 수용함으로써 Apple은 기술 발전과 협력적 혁신을 촉진하는 데 대한 약속을 보여줍니다.