티스토리 뷰

728x170

엔비디아, 구글과 협력해 AI 개발용 언어모델 '젬마' 최적화

엔비디아가 23일 구글과의 협력을 통해 모든 엔비디아 인공지능(AI) 플랫폼에서 AI 개발용 언어모델 ’젬마(Gemma)’를 위한 최적화를 실시했다고 밝혔습니다. 젬마는 구글의 새로운 경량 오픈 언어 모델로, 20억 파라미터와 70억 파라미터 크기로 제공됩니다.

 

젬마의 특징

  • 구글의 멀티모달 모델인 제미나이(Gemini) 개발에 사용된 연구와 기술을 기반으로 구축됨
  • 엔비디아 텐서RT-거대언어모델(LLM)로 성능 가속화
  • 엔비디아 RTX GPU를 활용한 고성능 AI PC에서 실행 가능

젬마는 구글의 제미나이(Gemini) 모델 개발에 사용된 연구와 기술을 기반으로 구축되었습니다. 엔비디아는 구글과의 협력을 통해 젬마를 위한 최적화를 실시하고, 엔비디아 텐서RT-거대언어모델(LLM)로 젬마의 성능을 가속화했습니다. 이를 통해 개발자들은 전 세계 고성능 AI PC에서 1억 개 이상의 엔비디아 RTX GPU를 활용하여 젬마를 실행할 수 있습니다.

구글 클라우드 A3인스턴스

클라우드 상에서도 젬마를 실행할 수 있는데, 이에는 구글 클라우드 A3인스턴스가 포함됩니다. 구글은 엔비디아 H200 텐서 코어 GPU를 기반으로 하는 클라우드 A3인스턴스를 올해 안에 배포할 예정입니다.

 

엔비디아 AI 엔터프라이즈와 텐서RT-LLM

  • 네모 프레임워크 적용
  • 광범위한 도구 제공
  • 텐서RT-LLM으로 최적화된 모델 지원

엔비디아는 엔비디아 AI 엔터프라이즈와 텐서RT-LLM을 통해 개발자들에게 광범위한 도구를 제공하고, 이들을 활용해 젬마를 미세 조정하고 최적화된 모델을 프로덕션 애플리케이션에 배포할 수 있습니다. 또한 텐서RT-LLM으로 최적화된 모델들이 제공됩니다.

엔비디아 AI 플레이그라운드

엔비디아 AI 플레이그라운드를 통해 브라우저에서 직접 젬마 2B와 젬마 7B를 체험할 수 있습니다.

 

챗 위드 RTX

엔비디아 기술 데모인 챗 위드 RTX에도 젬마가 추가로 지원될 예정입니다. 챗 위드 RTX는 로컬 PC에서 사용자에게 생성형 AI 기능을 제공하는 기술로, 사용자 데이터가 로컬에 유지되므로 개인 정보 보호에 유리합니다.

2024.02.22 - [게임잇(iT)] - 구글, 초경량화 새 오픈 AI모델 '젬마' 공개

 

구글, 초경량화 새 오픈 AI모델 '젬마' 공개

구글, 초경량화 새 오픈 AI모델 '젬마' 공개 젬마 소개 구글이 최근 인공지능(AI) 개발자와 연구자를 위한 새로운 초경량화 오픈 모델 '젬마(Gemma)'를 공개했습니다. 이 모델은 개인 노트북과 데스

sosikjangyi.com

 

그리드형