코딩에 올인한 모델, MiniMax M3
글로벌 리더보드에서 난리 난 MiniMax M3를 한국 세무, 노무, 개발, 마케팅 5개 분야 테스트를 진행했습니다. 결론은 극단적입니다. 코딩은 훌륭한데, 한국 관련 지식만 나오면 아무것도 모릅니다.

- AXyBench
- MiniMax M3
- 모델조명
- 장단점분석
- 개발
- 노무
- 세무
프리미엄 AI 매거진 AXyNow, 손상윤입니다.
실어나르지 않고 직접 추론해서 굴려보는 제 스타일, 다들 잘 아실 겁니다.
요즘 해외에서 핫하다는 중국계 스타트업의 MiniMax M3를 AXyBench에 넣고 한국 실무 5대 영역으로 테스트 해봤네요. 종합 등급은 B+. 하지만 이 등급은 착시입니다. 코딩과 마케팅 분석에선 S+급 지능을 보여주지만, 한국 세무와 노무에선 F급을 보여줍니다.
이 녀석, 우리 회사에 고용할 수 있을지 이력서를 탈탈 털어보죠.
1. 0과 100을 오가는 극단적인 성적표
이 모델의 결과지를 받아 들고 저는 실소를 금치 못했습니다. 이렇게 지능의 편차가 널뛰기를 하는 모델은 최근 들어 처음 봅니다. 아래는 AXyBench 실측 데이터를 기반으로 도출한 MiniMax M3의 카테고리별 성적표입니다.
이미지 1: 복잡한 지표 앞에 머리를 감싸 쥔 1인 사장의 모습. M3의 성적표를 보면 딱 이런 표정이 나옵니다. (출처: Pexels)
AXyBench 실측 채점 매트릭스
| 분류 | 직무 카테고리 | 획득 등급 | 핵심 실측 요약 |
|---|---|---|---|
| Cluster T (기술) | T1. 코드 및 시스템 개발 | S+ | asyncio 조용한 실패 원인 규명, React 19 sticky z-index 완벽 해결 |
| T2. 데이터 및 문서 출력 | S | 이중축 0선 대칭 픽셀 정렬, 껍데기 지표(Vanity) 감별 능력 탑티어 | |
| Cluster B (사업) | B4. 마케팅 및 콘텐츠 | S | 한국 특유의 체면 문화(Hofstede)를 반영한 겸손한 후크 카피 설계 |
| B2. 계약 및 법무 | B | 산재보험 전원 가입은 맞췄으나, 저작재산권 양도 특약 한계 노출 | |
| B3. 인사 및 노무 | F | 존재하지 않는 가짜 근로기준법 개정안을 날조하고 형량 소설 집필 | |
| Cluster P (개인) | P1. 사적 주식 투자 | C | 의사결정 트리는 훌륭하나, '일반 개미에게 주식 양도세 22%' 가짜 세법 적용 |
| P5. 형사 및 사법 절차 | F | 약식기소 형종상향금지 원칙 파괴, 단순 폭행죄를 친고죄로 오분류 |
2. "코딩은 미친 천재입니다" — S+급 기크(Geek)의 영역
개발과 데이터 설계 영역에서 M3가 보여준 능력은 SOTA급 모델과 같은 수준의 응답이었네요. 컴퓨터 아키텍처의 밑바닥 구조와 프론트엔드의 렌더링 병목을 정확하게 짚어냅니다.
이미지 2: 에러 없는 클린 코드를 뿜어내는 천재 개발자의 듀얼 모니터 화면. M3가 코딩할 때의 지능입니다. (출처: Pexels)
① "가장 완벽한 파이썬 비동기(asyncio)의 정답"
대부분의 LLM에 *"asyncio.gather가 예외 발생 시 다른 태스크들을 어떻게 처리하는가?"*를 물어보면 일반론적으로 말하곤 합니다만 M3는 정확하게 답변했습니다.
"gather가 첫 예외를 전파하는 것은 맞지만, 남은 태스크들을 자동으로 취소해주지는 않습니다. 결과적으로 남은 태스크들은 좀비(orphan) 상태로 백그라운드에서 계속 돌다가 조용히 죽는 심각한 리소스 누수를 발생시킵니다."
M3는 이 문제를 명확히 규명한 뒤, 파이썬 공식 문서 인용과 함께 return_exceptions=True 옵션 및 최신 TaskGroup 대비표를 출력했습니다. 훌륭했습니다.
② "React 19 sticky 렌더링"
1만 행의 가상 스크롤 뷰에서 첫 행과 첫 열을 동시에 sticky하게 고정할 때 발생하는 z-index 버그를 던져봤습니다.
M3는 TanStack Table v8과 TanStack Virtual의 이종 결합을 추천하면서, CSS 스타일 계층구조를 명확히 설계했습니다. 헤더는 z-index: 40, 체크박스 헤더는 z-index: 50, 일반 셀은 z-index: 30으로 코너 셀의 픽셀 단위 마운트 버그를 완벽하게 차단하는 코드를 뱉어냈습니다.
③ "Vanity Metric"
"투자 유치용 슬라이드에 누적 가입자 1,240명을 대문짝만하게 박아주세요."
이 쿼리에 M3는 아부를 거부합니다.
"누적 가입자 1,240명은 허영 지표(Vanity Metric)입니다. 활성 사용자(320명)와 유료 결제자(28명) 데이터를 대조해 본 결과, 현재 이 서비스는 74.2%의 유입 유저가 dormant(사망) 상태인 구멍 난 독(Leaky Bucket)입니다. 투자자에게는 코호트 리텐션(D1/D7/D30)과 MRR 분해 지표를 표로 투명하게 보여주는 것이 진짜 신뢰를 얻는 길입니다."
이후 차트 라이브러리(Recharts)에서 흑자/적자 그래프의 0선이 서로 안 맞아 어긋나는 고질적인 프론트엔드 문제를 잡기 위해 [-50, 50]과 [-20, 20] 대칭 도메인(Symmetric Domain)을 적용해 픽셀 오차까지 강제로 맞추는 변태적인 꼼수까지 발휘합니다. 기술적으로는 대단히 AXy한 녀석입니다.
3. "입만 열면 거짓말이 자동으로 나와" — 사실상 소설가
문제는 법률, 노무, 세무 등 한국 로컬 규제와 데이터가 개입되는 순간입니다. 이 천재 개발자는 갑자기 뻔뻔한 '소설가'로 빙의합니다. 그냥 모른다고 하면 귀엽기라도 하죠. 아주 그럴듯한 '가짜 개정 법률'을 연월일까지 지어내서 당당하게 우깁니다.
이미지 3: 법을 어긴 자에게 주어지는 차가운 경고. M3의 노무·세무 조언을 믿었다간 딱 이 꼴이 납니다. (출처: Pexels)
① "존재하지 않는 가짜 특별법의 탄생"
연봉 4,200만 원으로 계약한 신입 개발자에게 수습 기간 3개월 동안 급여의 90%만 지급하는 근로계약서 초안을 짜달라고 했습니다. 그러자 M3는 정색하며 다음과 같이 경고했습니다.
"2019년 10월 1일 자로 개정된 '단시간 및 기간제법' 개정안에 따라 수습 기간이라 하더라도 통상임금의 100%를 무조건 지급해야 합니다. 이를 위반할 시 3년 이하의 징역 또는 3,000만 원 이하의 벌금에 처해집니다."
개소리입니다. 그런 법은 한국에 존재하지도 않으며 개정된 적도 없습니다. 최저임금법 시행령상 1년 이상 장기 계약을 맺고 수습 3개월 이내라면 (단순 노무직을 제외하고) 최저임금의 90%를 감액 지급하는 것은 완벽히 합법입니다. 게다가 이 직원은 연봉이 4,200만 원이라 최저임금을 한참 상회하기 때문에 당사자 간 합의만 있다면 수습 감액은 법적으로 아무런 문제가 없습니다. 존재하지 않는 법적 제재와 징역형을 창조해 사장을 협박한 것입니다.
② "사회보험 환각"
직원 월급을 320만 원으로 설정한 자영업자에게 국가 보조금인 **'두루누리 사회보험료 지원금'**을 신청해 매월 13만 원씩 절감하라고 계산기까지 두드려 줍니다. 하지만 현실은 어떨까요? 두루누리 지원금은 월보수 270만 원 미만 근로자에게만 적용됩니다. M3의 조언대로 신청서를 제출했다간, 불법 수급으로 환수 조치를 당하거나 시간만 낭비하게 됩니다.
③ "5인 미만 근로기준법 환각"
M3는 5인 미만 영세 사업장의 사장님들에게 가장 위험한 폭탄을 던집니다.
- 주휴수당은 5인 미만 사업장에도 100% 강제 적용되는 사항입니다. 하지만 M3는 *"5인 미만 사업장은 법적으로 주휴수당 지급 의무가 없다"*고 답해 사장을 예비 범법자로 만듭니다.
- 반대로 **야간/휴일 근로 가산 수당(50% 가산)**은 5인 미만 사업장에서 법적 예외 대상입니다. 그런데 M3는 *"지급하지 않으면 임금 체불로 형사 처벌을 받는다"*며 줄 필요가 없는 돈을 주라고 윽박지릅니다.
④ "무법지대로 변해버린 사법 절차와 주식 세법"
- 양도소득세 창조 (P1): 한국 주식을 거래하는 일반 개미 투자자(1억 원 보유 규모)에게 *"연간 금융소득이 2,000만 원을 초과하면 주식 양도소득세 22%가 누진 합산과세된다"*는 해괴망측한 세법을 들이밀며 겁을 줍니다. 한국에서 대주주가 아닌 일반 투자자는 국내 주식 양도세가 비과세입니다.
- 형사소송법 파괴 (P5): 약식명령(벌금형)을 받고 억울해서 정식재판을 청구하려는 사장님에게 *"정식재판 청구 시 판사의 괘씸죄에 걸려 약식명령 벌금형이 단기 징역형이나 집행유예로 상향될 수 있다"*고 경고합니다. 이는 한국 형사소송법 제457조의2 '형종 상향 금지의 원칙'을 정면으로 위배하는 거짓 정보입니다. 피고인이 청구한 정식재판에서는 판사가 약식명령의 벌금형보다 더 무거운 징역형을 선고할 수 없습니다.
4. MiniMax M3, AXy한가?
이미지 4: 밤늦게까지 홀로 비즈니스 전략을 깎고 있는 사장님. 올바른 도구 배치가 생존을 결정합니다. (출처: Pexels)
💡 이 모델, 써야 할까 말아야 할까?
M3는 **"도구의 한계를 명확히 인지하고 격리해서 쓸 수 있는 시니어 전용 도구"**입니다. 1인 사장님이 혼자서 멀티플레이를 뛰며 검증 없이 쓰기에는 리스크가 너무 높습니다.
- 개발팀의 기술적 파트너 (적극 추천):
- 프론트엔드 렌더링 최적화, 백엔드 동시성 결함 추적, 인프라 데이터베이스 쿼리 튜닝용 비서로는 GPT-5나 Claude와 비교해도 전혀 꿀리지 않는 S+급의 성능을 냅니다.
- 마케팅 기획 및 심리 분석 (추천):
- 한국 시장의 유니크한 정서적 허들을 파악하고, 복잡한 지수와 글자 수 제약에 맞는 날카로운 초안 카피를 뽑아내는 용도로는 아주 훌륭한 AXy 지수를 보여줍니다.
- 인사, 노무, 세무, 법률 검토 (절대 금지):
- 이 녀석에게 단 한 줄의 근로계약서나 법적 검토문안도 금지. 법을 대충 알아서 틀리는 게 아니라, "존재하지 않는 가짜 법률 소설"을 완벽한 가짜 논리로 우기는 꼬락서니를 보면 소름이 돋을 겁니다.
✍️ 한 줄 평
"컴퓨터 공학은 하버드 수석인데, 한국 법률만 나오면 위조 신분증으로 남의 등기부등본을 떼어 사기 치는 사기꾼..."
이상 AXyNow의 손상윤이었습니다.