MLPerf 4.0 교육 결과: AI 성능 향상 최대 80% 증가 발견

기계 학습과 AI 교육 혁신 가속화

기계 학습(ML)과 인공지능(AI) 교육의 발전이 빠르게 진화하고 있으며, 특히 더 정교한 생성 AI 작업의 출현으로 더욱 두드러지고 있습니다. 오늘 MLCommons는 MLPerf 4.0 교육 벤치마크를 공개하며 기록적인 성능 수준을 선보였습니다. 이 공급업체 중립 표준은 업계에서 널리 인정받으며, 17개 조직과 205건 이상의 결과가 포함되어 있습니다. 이번 발표는 2023년 11월 3.1 버전 이후 MLPerf 교육의 첫 업데이트입니다.

MLPerf 4.0 벤치마크에는 스테이블 디퓨전을 이용한 이미지 생성과 GPT-3를 위한 대형 언어 모델(LLM) 교육 등 주요 발전이 포함되어 있습니다. 최초로 소개된 새로운 LoRA 벤치마크는 문서 요약을 위해 Llama 2 70B 언어 모델을 효율적 매개변수 조정으로 세부 조정합니다. 지난 사이클과 비교했을 때 성과는 놀랍습니다.

MLCommons의 창립자이자 전무 이사인 데이비드 칸터는 기자 회견에서 “6개월 전과 비교했을 때 일부 벤치마크는 거의 2배의 성능 향상을 보였습니다. 특히 스테이블 디퓨전에서 그러합니다. 이는 단 6개월 만에 이룬 인상적인 성과입니다.”라고 언급했습니다. 특히 스테이블 디퓨전 교육은 2023년 11월 대비 1.8배 빨라졌으며, GPT-3 교육은 최대 1.2배 빨라졌습니다.

AI 교육 성능: 하드웨어를 넘어서

AI 모델 교육에서 하드웨어는 중요한 역할을 하지만, 클러스터 내 소프트웨어와 네트워크 연결도 마찬가지로 중요합니다. 칸터는 “AI 교육 성능은 효율성을 향상시키는 다양한 요소에 의존합니다.”라고 밝혔습니다. “작업 분배와 여러 프로세서 또는 가속기 간의 통신이 필수적입니다.”

공급업체들은 뛰어난 실리콘을 활용하는 것뿐만 아니라, 고급 알고리즘 및 확장을 통해 시간이 지남에 따라 성능을 향상시키고 있습니다.

홉퍼 아키텍처로 교육에서의 엔비디아 리더십

엔비디아는 MLPerf 4.0 벤치마크에서 눈에 띄게 우수한 성과를 거두며 아홉 개의 테스트 워크로드 중 다섯 개에서 새로운 성능 기록을 세웠습니다. 인상적으로도 이 벤치마크는 2023년 6월과 동일한 핵심 하드웨어 플랫폼을 사용하여 설정되었습니다.

엔비디아 AI 디렉터인 데이비드 살바토르는 H100 홉퍼 아키텍처의 지속적인 가치를 강조했습니다. “엔비디아의 역사에서 우리는 제품 생애 주기 동안 소프트웨어 혁신 덕분에 일반적으로 2배에서 2.5배의 성능 향상을 달성합니다.”라고 그는 말했습니다.

엔비디아는 MLPerf 4.0의 성능을 높이기 위해 전체 스택 최적화, 세밀하게 조정된 FP8 커널 및 최적화된 cuDNN FlashAttention 등의 다양한 전략을 사용했습니다.

기업을 위한 MLPerf 교육 벤치마크의 중요성

MLPerf 벤치마크는 조직에 교육 성능에 대한 표준화된 지표를 제공하지만 그 가치는 단순한 숫자에 그치지 않습니다. 살바토르는 기존 하드웨어로 성능 향상을 이루어낸 사례를 강조하며, 엔비디아가 확립된 아키텍처에서 지속적인 이점을 끌어낼 수 있음을 증명했습니다. 기업이 신규 배치를 계획할 때, 특히 온프레미스 환경에서 초기 투자 이후 지속적인 개선 가능성은 매우 중요합니다.

“성능의 중요성 측면에서 간단한 대답은 이것이 기업의 투자 수익을 유도한다는 것입니다.”라고 그는 결론지었습니다.

Most people like

Find AI tools in YBX