생성형 AI 애플리케이션 구축 및 데이터 제어 지원

 DBRX는 언어 이해, 프로그래밍 및 수학 벤치마크에서 오픈소스 모델보다 성능이 높다.
DBRX는 언어 이해, 프로그래밍 및 수학 벤치마크에서 오픈소스 모델보다 성능이 높다.

[아이티데일리] 데이터브릭스는 표준 벤치마크에서 오픈소스 모델을 능가하는 범용 대형언어모델(LLM) ‘DBRX’를 출시했다고 28일 밝혔다.

DBRX는 모든 기업을 위해 맞춤형 고성능 LLM의 학습과 튜닝을 보편화한다. 조직은 DBRX를 통해 더 이상 소수의 폐쇄형 모델에 의존하지 않아도 된다. 전 세계 조직은 이를 활용해 비용 효율적으로 자체 맞춤형 LLM을 구축, 교육 및 서비스할 수 있다.

DBRX는 언어 이해, 프로그래밍, 수학 및 논리와 같은 표준 업계 벤치마크에서 오픈소스 모델들의 벤치마크를 능가했다. ‘라마 2(Llama 2)’ 70B 및 ‘믹스트랄-8x(Mixtral-8x)’ 7B와 같은 기존 오픈소스 LLM보다 성능이 높았다.

 DBRX는 GPT 3.5보다 뛰어난 성능을 제공한다.
DBRX는 GPT 3.5보다 뛰어난 성능을 제공한다.

데이터브릭스는 효율성을 위해 메가블록스(MegaBlocks) 오픈소스 프로젝트에 기반한 전문가 혼합(MoE, mixture-of-experts) 아키텍처로 DBRX를 최적화했다. 이로 인해 DBRX는 다른 주요 LLM 대비 최대 2배 높은 컴퓨팅 효율 등 최고의 성능을 갖추고 있다. 또한 DBRX는 주어진 시간에 360억 개의 매개변수만 사용한다. 하지만 모델 자체는 1,320억 개 파라미터이므로 속도(토큰/초) 대 성능(품질) 측면에서 두 마리 토끼를 모두 잡을 수 있다.

또한 DBRX는 모든 기업이 커스터마이징할 수 있는 투명한 생성형 AI다. 최근 미국 VC 기업 안드레센 호로위츠가 발표한 조사 결과에 따르면 AI 리더의 약 60% 가 오픈소스 사용을 늘리거나 미세 조정된 오픈소스 모델이 폐쇄형 모델의 성능과 거의 일치할 경우, 오픈소스로 전환하는데 관심을 보이는 것으로 나타났다. 2024년 이후에는 상당수의 기업이 폐쇄형에서 오픈소스로 전환할 것으로 예상되며, 데이터브릭스는 DBRX가 이러한 추세를 더욱 가속화할 수 있을 것이라고 확신한다.

DBRX는 데이터브릭스 모자이크 AI의 통합 툴링과 결합돼 고객이 데이터와 지적 재산에 대한 제어권을 유지하면서도 안전하고 정확하며 관리 가능한 생산 품질의 생성형 AI 애플리케이션을 신속하게 구축 및 배포할 수 있도록 지원한다. 고객은 데이터 관리, 거버넌스, 리니지 및 모니터링 기능이 내장된 데이터브릭스의 데이터 인텔리전스 플랫폼의 다양한 이점을 누릴 수 있다.

DBRX는 깃허브(GitHub)와 허깅 페이스(Hugging Face)에서 연구 및 상업적 용도로 무료로 사용 가능하다. 기업은 이제 데이터브릭스 플랫폼에서 DBRX와 상호 작용하고, 검색 증강 생성(RAG) 시스템에서 긴 문장(context) 기능을 활용하며, 자체 고유 데이터에서 맞춤형 DBRX 모델을 구축할 수 있다. 또한, AWS와 구글 클라우드(Google Cloud)뿐만 아니라, 애저 데이터브릭스(Azure Databricks)를 통해 마이크로소프트 애저(Microsoft Azure)에서도 직접 사용할 수 있다.

데이터브릭스 알리 고드시(Ali Ghodsi) 공동창립자 겸 CEO는 “데이터브릭스는 데이터와 AI를 보편화하겠다는 사명 아래 모든 기업에 데이터 인텔리전스를 제공해 그들이 보유 중인 데이터를 이해하고 이를 활용해 자체적인 AI 시스템을 구축할 수 있도록 지원하고 있다. 이번 DBRX 출시는 이러한 노력의 결과물”이라며 “새롭게 선보인 DBRX는 최신 업계 벤치마크에서 오픈소스 모델을 능가하고, 대부분의 벤치마크에서 GPT-3.5를 뛰어넘는 수준으로, 우리는 독점 모델을 오픈소스 모델로 대체하는 추세가 고객 기반 전반에 걸쳐 가속화될 것으로 기대하고 있다. DBRX는 전문가 혼합 아키텍처를 사용하기 때문에 초당 토큰 전송 속도가 매우 빠르며 비용 효율적이다. 이러한 점에서 DBRX는 오픈소스 LLM의 새로운 기준을 제시하며, 기업이 자체 데이터를 기반으로 맞춤형 추론 기능을 구축할 수 있는 플랫폼을 제공해 준다”고 말했다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지