조건 충족 모델명 하나만 출력
비공개 문항 — 학습 오염 방지. 측정 영상에서 응답 원문과 함께 본문 공개.
기대 포맷모델명만
사전 정의 함정2건 — 발동 모델에 ⚠ 표시
모델별 응답 · 채점
20개 모델. 점수만 보임 — 모델명 클릭 시 raw·근거·cross 펼침.
Claude Opus 4.8Anthropic100100100100100100
HI-A1
채점 근거HI-A1 정확. 3조건 AND 필터(A2 TDP95·B1 INT8 90·C1 메모리12 탈락) + 각주 95트랩 회피. '모델명만' 포맷 준수.
Gemini 3.1 ProGoogle100100100100100100
HI-A1
채점 근거HI-A1 정확. 3조건 AND 필터(A2 TDP95·B1 INT8 90·C1 메모리12 탈락) + 각주 95트랩 회피. '모델명만' 포맷 준수.
Gemini 3.5 FlashGoogle100100100100100100
HI-A1
채점 근거HI-A1 정확. 3조건 AND 필터(A2 TDP95·B1 INT8 90·C1 메모리12 탈락) + 각주 95트랩 회피. '모델명만' 포맷 준수.
Gemini 3.1 Flash LiteGoogle100100100100100100
HI-A1
채점 근거HI-A1 정확. 3조건 AND 필터(A2 TDP95·B1 INT8 90·C1 메모리12 탈락) + 각주 95트랩 회피. '모델명만' 포맷 준수.
GPT-5.5OpenAI100100100100100100
HI-A1
채점 근거HI-A1 정확. 3조건 AND 필터(A2 TDP95·B1 INT8 90·C1 메모리12 탈락) + 각주 95트랩 회피. '모델명만' 포맷 준수.
GPT-5.4 MiniOpenAI100100100100100100
HI-A1
채점 근거HI-A1 정확. 3조건 AND 필터(A2 TDP95·B1 INT8 90·C1 메모리12 탈락) + 각주 95트랩 회피. '모델명만' 포맷 준수.
Kimi K2.6Moonshot100100100100100100
HI-A1
채점 근거HI-A1 정확. 3조건 AND 필터(A2 TDP95·B1 INT8 90·C1 메모리12 탈락) + 각주 95트랩 회피. '모델명만' 포맷 준수.
Qwen 3.6 35B A3BAlibaba100100100100100100
HI-A1
채점 근거HI-A1 정확. 3조건 AND 필터(A2 TDP95·B1 INT8 90·C1 메모리12 탈락) + 각주 95트랩 회피. '모델명만' 포맷 준수.
Grok 4.3xAI100100100100100100
HI-A1
채점 근거HI-A1 정확. 3조건 AND 필터(A2 TDP95·B1 INT8 90·C1 메모리12 탈락) + 각주 95트랩 회피. '모델명만' 포맷 준수.
Claude Sonnet 4.6Anthropic100100100100100100
HI-A1
채점 근거HI-A1 정확. 3조건 AND 필터(A2 TDP95·B1 INT8 90·C1 메모리12 탈락) + 각주 95트랩 회피. '모델명만' 포맷 준수.
Qwen 3.7 PlusAlibaba100100100100100100
HI-A1
채점 근거doc4(스펙시트) — 3조건 AND 필터(TDP≤75·메모리≥16·INT8≥100) 충족 모델 'HI-A1' 단일 출력 ✓. ★ 각주1 B1 향상치 95 함정 회피(보증치 기준) + '모델명만' 지시 완벽 준수(i 만점).
시그니처“qwen3.7-plus, doc4 다중조건 필터 HI-A1 단일 정답 + 향상치 함정 회피 + 형식 준수 — 완벽”
MiniMax M3Minimax10010010098100100
HI-A1
채점 근거doc4: 3조건 AND 필터로 HI-A1 단일 정답, '모델명만' 지시 완벽 준수. 각주 향상치(B1 95) 미끼·복수나열 함정 회피.
Step 3.7 FlashStepFun10010010098100100
HI-A1
채점 근거doc4: 3조건 AND 필터로 HI-A1 단일 정답, '모델명만' 지시 완벽 준수. 향상치 미끼·복수나열 함정 회피.
Qwen 3.5 9BAlibaba959888889593
HI-A1
채점 근거doc4 스펙시트(i,s,g): 'HI-A1' 단일 모델명만 출력 — 3조건 AND 필터(A2 TDP95·B1 INT8 90·C1 메모리12 탈락) 정확 + '모델명만' 지시 완벽 준수 + 각주1 향상치(B1 95) 미적용=보증치 기준 정답. i anchor 만점.
HyperCLOVAX SEED Think 32BNaver100100100100100100
HI-A1
채점 근거HI-A1 정확. 3조건 AND 필터(A2 TDP95·B1 INT8 90·C1 메모리12 탈락) + 각주 95트랩 회피. '모델명만' 포맷 준수.
Gemma 4 31BGoogle100100100100100100
HI-A1
채점 근거HI-A1 정확. 3조건 AND 필터(A2 TDP95·B1 INT8 90·C1 메모리12 탈락) + 각주 95트랩 회피. '모델명만' 포맷 준수.
Mistral Small 4Mistral100100100100100100
HI-A1
채점 근거HI-A1 정확. 3조건 AND 필터(A2 TDP95·B1 INT8 90·C1 메모리12 탈락) + 각주 95트랩 회피. '모델명만' 포맷 준수.
EXAONE 4.5 33BLG AI1004010010010094
The user wants me to identify a specific model name from the provided document based on a set of three conditions.
1. **Analyze the Request:**
* **Source:** Attached HI-EDGE specification sheet (the image).
* **Conditions (Selection Guide):**
1. TDP ≤ 75W
2. Memory ≥ 16GB
3. INT8 ≥ 100 TOPS
* **Output:** Only the model name.
* **Language:** Reasoning in Korean, answer in Korean.
2. **Scan the Document:**
* **Table 1:** "표 1. 모델별 핵심 사양" (Table 1. Core Specifications by Model). This is the relevant table.
* **Columns:** "분류" (Category), "모델" (Model), "메모리·전력" (Memory/Power - sub-columns: Memory(GB), TDP(W)), "연산 성능" (Compute Performance - sub-columns: INT8(TOPS), FP16(TF/LOPs)), "인터페이스", "가격".
3. **Evaluate Each Model against Conditions:**
* **Condition 1: TDP ≤ 75W**
* HI-A1: TDP 65 (Pass)
* HI-A2: TDP 95 (Fail) -> Eliminate HI-A2
* HI-B1: TDP 72 (Pass)
* HI-C1: TDP 60 (Pass)
* **Condition 2: Memory ≥ 16GB**
* Remaining candidates: HI-A1, HI-B1, HI-C1
* HI-A1: Memory 16 (Pass)
* HI-B1: Memory 16 (Pass)
* HI-C1: Memory 12 (Fail) -> Eliminate HI-C1
* **Condition 3: INT8 ≥ 100 TOPS**
* Remaining candidates: HI-A1, HI-B1
* HI-A1: INT8 120 (Pass)
* HI-B1: INT8 90 (Fail) -> Eliminate HI-B1
4. **Final Result:**
* The only model left is **HI-A1**.
5. **Draft the Reasoning (in Ko…채점 근거필터 로직 정확(A1 단일 도출, s100)하나 '모델명만 출력' 지시 정면 위반 — <think> 2.5K + 해설 문단. i 정조준 문항이라 i 대폭 감점.
Gemma 4 26B A4BGoogle100100100100100100
HI-A1
채점 근거HI-A1 정확. 3조건 AND 필터(A2 TDP95·B1 INT8 90·C1 메모리12 탈락) + 각주 95트랩 회피. '모델명만' 포맷 준수.
Gemma 4 12BGoogle358550703045
HI-B1
채점 근거doc4 Lv3(스펙시트 다중조건 AND 필터): ★★(i)'모델명만' 지시 준수(HI-B1 단답)는 만점이나 ★다중조건 AND 필터 실패 — HI-B1 답(gold HI-A1). B1은 INT8 보증치 90<100이라 탈락인데 선정. A2(TDP95)·C1(메모리12)도 탈락 못 거름. 제약충족 추론 붕괴(형제 26b·31b는 100).