News

KT, 한국어 특화 LLM ‘Llama K’ 출시

▶ Meta의 오픈소스 Llama-3.3 기반, 한국어 지시 이행 및 추론 성능 대폭 향상

▶ 모델 경량화 기술로 효율적 추론과 비용 절감 가능… 비즈니스 활용성 강화

▶ ‘믿:음 K’부터 ‘Llama K’, ‘SOTA K’까지 한국적 AI 라인업 확장, 고객 선택권 확대


[KT사진자료]312.jpg


  KT(대표이사 김영섭)가 Meta의 오픈소스 모델 Llama-3.3을 기반으로 한국어 성능을 획기적으로 강화한 언어모델 ‘Llama K’를 출시했다고 30일 밝혔다.


  이번에 선보인 Llama K 74B는 740억 파라미터 규모의 언어모델로 기존 Llama 모델에서 공식 지원하지 않았던 한국어 기능을 대폭 강화한 것이 특징이다. 특히 한국어 지시 이행(Instruction Following) 능력과 추론(Reasoning) 능력이 크게 개선돼 복잡한 한국어 명령어도 정확하게 이해하고 실행할 수 있다. 


  KT는 이를 위해 독자적으로 개발한 한국어 리워드 모델 기반의 학습 기법을 도입, 한국어 고유의 문맥과 뉘앙스를 정밀하게 반영했다. 그 결과 코딩과 수학 등 한국어 기반의 복잡한 논리적 추론이 가능해져 AI 에이전트 환경에서의 활용성이 크게 높아졌다. 


  추론 비용 최적화를 위해 기본 BF16 모델 외에도 FP8, INT4 등 다양한 양자화 모델(Quantization Model)을 함께 제공한다. 이를 통해 사용자는 GPU 자원과 성능 요구에 따라 최적의 모델을 선택할 수 있으며, 제한된 하드웨어 환경에서도 고품질의 AI 서비스를 경제적으로 구현할 수 있다.


  Llama K는 KT의 Responsible AI(RAI, 책임감 있는 AI) 원칙을 철저히 반영했다. 개인정보 보호와 유해 표현 제거, 환각현상(Hallucination) 감소를 위해 데이터 수집부터 학습·응답 생성까지 엄격한 품질 관리 프로세스를 적용했다. 이로써 신뢰성과 안전성을 동시에 확보했다.


  KT는 환경 친화적 AI 개발을 위한 Green AI 실현에도 주력했다. 모델 병합(Model Merge), 챗 벡터(Chat Vector) 등 GPU 연산 부담을 줄이는 기법을 도입해 학습 과정의 에너지 소비를 크게 절감했다. 이를 통해 고성능과 친환경을 동시에 달성하는 지속가능한 AI 개발의 가능성도 제시했다.


  Llama K는 KT의 ‘한국적 AI’ 철학을 반영하여 한국어·문화·사회 맥락을 세밀하게 내재화했다. 오픈 벤치마크 및 KT 한국적 AI 평가결과에 따르면, Llama-3.3 모델 대비 한국어 이해, 사회문화, 전문지식의 전 영역에서 우월한 성능을 확인했고, 한국어 지시이행과 추론 영역에서는 원본 모델 뿐만 아니라 초거대 언어모델인 GPT-4o와도 대등하거나 더 높은 성능을 보였다.


  이번 출시는 국내 AI 기술 주권 확보와 글로벌 AI 생태계 발전에 기여하겠다는 KT의 의지를 보여준다. 한국적 AI 기술 선도 기업으로서 KT의 이와 같은 전략은 국내 AI 산업 발전과 디지털 전환 가속화에 핵심적 역할을 수행할 것으로 기대된다.


  KT Agentic AI Lab장 윤경아 상무는 “이번 출시로 독자모델인 ‘믿:음 K’부터 중대형 ‘Llama K’, 초대형 ‘SOTA K’까지 KT의 한국적 AI 라인업을 확장해 공공과 민간 전반에서 고객에게 더 다양한 선택지를 제공하게 되었다”며, “특히 한국어 지시 이행은 단순 명령 처리에 그치지 않고, 높임말과 종결어미를 정확히 구사하며 공공문서 포맷까지 충실히 반영해 실무에서 바로 활용할 수 있는 AI 서비스를 구현했다”고 강조했다.


※ 보충설명

○ 양자화 모델(Quantization Model): LLM 모델의 추론 연산에 사용되는 파라미터를 원래의 고정밀도(BF16:bfloat16)에서 더 낮은 정밀도(FP8:float8, Int4:Integer4)로 낮춘 모델로 최대한 성능은 유지하면서, 더 적은 GPU 자원으로 추론이 가능하다.

이전 글
KT, 한국어 특화 LLM ‘Llama K’ 출시 - kode