IT 및 AI

마이크로소프트의 새로운 AI 모델, 파이-4 시리즈가 주목받는 이유

푸른강아지 2025. 5. 7. 21:50
반응형

최근 마이크로소프트가 공개한 '파이-4(Phi-4)' 시리즈가 AI 업계에서 큰 관심을 받고 있어요. 이 시리즈는 복잡한 추론 능력을 가진 AI 모델로, 단순한 질문에 답하는 수준을 넘어 고난도의 수학 문제나 과학적 사고를 요하는 문제까지 다룰 수 있도록 개발되었어요. 특히 다양한 환경과 목적에 맞춰 세 가지 모델로 출시된 점이 인상적인데요. 각각 어떤 특징이 있는지 함께 살펴볼까요?

 

파이-4-추론 모델은 대형 AI 모델과도 맞먹는 수준이에요

가장 먼저 소개할 모델은 '파이-4-추론'이에요. 이 모델은 14억 개의 파라미터를 가지고 있어요. 숫자만 보면 엄청나게 크진 않지만, 놀라운 건 그 성능이에요. OpenAI의 o3-mini에서 파생된 체인 오브 싱킹(Chain-of-Thought) 데이터를 활용해서 훈련됐기 때문에, 복잡한 사고 과정을 요하는 문제를 매우 잘 해결하죠. 실제로는 700억 개 파라미터를 가진 모델들과도 견줄 수 있는 성능을 보이니, '작지만 강한 모델'이라는 말이 딱 어울려요.

 

파이-4-추론-플러스는 더 똑똑해졌어요

다음은 '파이-4-추론-플러스'입니다. 기본 모델에 강화 학습을 더해 정교한 사고 능력을 강화했어요. 그 결과, 평균적으로 50% 더 많은 토큰을 생성할 수 있어요. 토큰이 많다는 건 그만큼 더 자세하고 정밀한 답변을 할 수 있다는 뜻이죠. AIME 2025라는 테스트에서 DeepSeek-R1 모델과 유사한 성능을 보인 것으로도 확인됐어요. 이 모델은 복잡한 논리적 문제나 과학적 추론이 필요한 상황에서 특히 강점을 보입니다.

 

파이-4-미니-추론은 작지만 똑똑한 모델이에요

세 번째는 '파이-4-미니-추론'이에요. 이 모델은 컴퓨팅 자원이 제한된 환경에서도 뛰어난 성능을 보여주는 경량형 모델입니다. 파라미터 수는 3.8억 개로, 다른 모델들에 비해 확연히 적지만 성능은 기대 이상이에요. DeepSeek-R1이 만든 합성 수학 데이터를 학습했으며, 수학 전문 벤치마크인 Math-500에서 기존의 Qwen-7B보다 높은 점수를 받았다는 점도 주목할 만해요. 소형 AI가 꼭 성능이 낮을 필요는 없다는 걸 보여주는 대표 사례라고 할 수 있어요.

 

파이-4 시리즈, AI의 고급화와 대중화를 이끌 수 있을까요?

이번 파이-4 시리즈는 마이크로소프트가 AI의 고급화와 대중화를 동시에 노린 전략으로 보입니다. 복잡한 추론이 가능한 모델이 대형 모델만의 전유물이 아니라는 걸 보여주면서도, 다양한 용도에 맞게 선택할 수 있도록 옵션을 제공하고 있거든요. 앞으로 이 모델들이 교육, 연구, 산업 현장에서 어떻게 활용될지 지켜보면 정말 흥미로울 것 같아요.

반응형