LG, 국내 최초 '추론 AI' 오픈소스 공개… 글로벌 AI 경쟁 본격화
2025.03.19
LG AI연구원이 국내 최초의 추론 AI 모델인 ‘엑사원 딥(EXAONE Deep)’을 오픈 소스로 공개했다. 이는 오픈AI, 구글, 중국의 딥시크와 경쟁할 수 있는 모델로, 기존 지식형 AI를 넘어 스스로 가설을 세우고 검증하는 능동적인 AI(에이전틱 AI) 기술을 구현하는 것이 특징이다.
LG AI연구원은 미국 캘리포니아에서 열리는 엔비디아 GTC에서 ‘엑사원 딥’을 공개하며, 이를 통해 글로벌 AI 생태계에서 입지를 강화하고자 한다. ‘엑사원 딥-32B’ 모델은 320억 개의 매개변수를 사용하며, 딥시크 R1 모델(6,710억 개 매개변수)의 5% 규모임에도 성능이 경쟁력을 갖춘 것으로 평가된다.
이 모델은 글로벌 오픈소스 AI 플랫폼인 허깅페이스(Hugging Face)에서 다양한 논리적 사고력 및 문제 해결 능력 평가 결과를 공개했으며, LG전자·LG유플러스 등과 협력하여 더욱 고도화할 계획이다.
AI 모델 데이터 소스
📌 엑사원(EXAONE)의 데이터 기반
- 논문 및 특허 데이터: 과학, 기술, 공학 분야의 연구 논문 및 등록 특허
- 기업 및 산업 데이터: LG그룹 내 전자, 화학, 생명과학 분야의 전문 데이터
- 일반 텍스트 데이터: 웹 문서, 백과사전 등에서 수집된 텍스트
- 코딩 및 수식 데이터: 프로그래밍 코드 및 수학적 공식
특히, "추론 AI" 라는 개념을 도입하면서, 기존 대규모 언어 모델(LLM)보다 한 단계 높은 논리적 사고 및 가설 검증 능력을 강화했다.
📌 구글 제미니(Gemini)의 데이터 소스
- 구글 포털(검색 엔진) 및 크롤링된 웹 데이터
- 구글 학술 데이터(Google Scholar), 유튜브, Gmail, 구글 문서 등
- 코드 데이터(GitHub 등)
- 구글의 자체 비공개 학습 데이터
제미니는 구글이 직접 보유한 방대한 데이터베이스를 학습 데이터로 활용하는 것이 강점이다.
📌 OpenAI GPT (ChatGPT)의 데이터 소스
- 인터넷 크롤링된 대규모 공개 웹 데이터
- 책, 위키백과, 논문 및 뉴스 기사
- 코드 저장소(예: GitHub, Stack Overflow 등)
- 특정 도메인의 학습 데이터 (비공개 기업 파트너십 활용 가능)
GPT 모델은 인터넷의 광범위한 공개 데이터를 바탕으로 학습했으며, OpenAI 내부에서 특정 데이터를 필터링하여 정제한 후 모델을 훈련한다.
🔹 LG의 엑사원은 특정 산업 지식에 강하고, 구글 제미니는 방대한 검색 데이터, GPT는 광범위한 공개 데이터에 기반한다는 차이점이 있다.

💡 추론(Inference) AI란?
AI가 기존의 지식을 바탕으로 새로운 결론을 도출하거나 가설을 세우고 검증하는 능력을 갖춘 것을 의미한다.
일반적인 대규모 언어 모델(LLM)은 "지식형 AI"에 가깝지만, "Inference AI"는 단순히 학습된 정보를 제공하는 것이 아니라 논리적 사고를 통해 새로운 판단을 내릴 수 있는 AI 이다.
LG의 엑사원 딥(EXAONE Deep)이 강조하는 에이전틱(Agentic) AI 개념도 이러한 추론 AI(Inference AI)의 연장선상에 있다.
'IT 생활' 카테고리의 다른 글
빅데이터와 AI를 활용한 부동산 투자 전략의 새로운 패러다임 (1) | 2025.04.11 |
---|---|
AI가 당신의 일을 뺏는 게 아니라, 도와주는 이유 AI와의 협업 능력(AI Literacy) (1) | 2025.03.21 |
2025년 제1차정보시스템 감리 기본교육 수료 과정 교육일정 교육과정 (0) | 2025.03.11 |
2025년, 우리는 이미 매트릭스에 살고 있다: AI 시대의 통제와 자유의 경계 (0) | 2025.03.11 |
ChatGPT vs Google Bard vs 네이버 CLOVA X의 비교 (1) | 2025.02.26 |