Z.ai·z-ai/glm-5.2·3/13 측정 · 평균 78.7
GLM 5.2
Z.ai GLM 5.2 (2026-06-16). 753B 총/40B 액티브 MoE, 1M 컨텍스트, MIT 오픈웨이트. 코딩 SWE-bench Pro 62.1로 GPT-5.5 추월·가격 1/6. 한국어 검증 대상(미측정).
vs Field
강·약 카테고리
이 모델 점수 − 다른 모델 평균. 측정된 카테고리만 비교.
↑ 강점
- 78.2인사·노무35모델 중 18위·평균 대비 +9.3
- 85.8마케팅·콘텐츠35모델 중 7위·평균 대비 +8.2
- 72.2세무·회계35모델 중 19위·평균 대비 +5.4
↓ 상대적 약점
- 72.2세무·회계35모델 중 19위·평균 대비 +5.4
- 85.8마케팅·콘텐츠35모델 중 7위·평균 대비 +8.2
- 78.2인사·노무35모델 중 18위·평균 대비 +9.3
External · Artificial Analysis
AA 외부 벤치
이 모델은 AA 카탈로그에 매칭되지 않음 (Phase 3 모델 풀 확장 시 재시도)
문항별 답변 · 채점
3/13 측정 · 문항당 1회이 모델이 카테고리별 문항에 한 답변과 채점 근거. 문항을 펼치면 답변 원문·채점 근거·교차 검증·핵심 인용을 봅니다.
B1세무·회계72.2
카테고리 전체 비교 →문항
정확성의도 파악신중함한국 맥락짜임새avg
B3인사·노무78.2
카테고리 전체 비교 →문항
정확성의도 파악신중함한국 맥락짜임새avg
B4마케팅·콘텐츠85.8
카테고리 전체 비교 →문항
정확성의도 파악신중함한국 맥락짜임새avg