AI한테 40만 번 일을 시켜본 결과
앤트로픽이 클로드 코드 세션 40만 건을 까봤더니, 전문성이 깊을수록 같은 AI를 두 배 넘게 부려먹었고, 비전문가와의 격차는 오히려 더 벌어졌습니다.

- AXyNow
- AI도입
- 전문성
- 일자리
- AXyBench
프리미엄 AI 매거진 AXyNow, 손상윤입니다.
"AI가 나오면 누구나 전문가가 된다." 요즘 유튜브에서 너도나도 하는 말이죠. 코딩 못 해도 앱 만들고, 세무 몰라도 절세하고, 그래서 진입장벽이 무너진다는 겁니다. 근데 과연 그거 맞는 말일까요?
앤트로픽이 클로드 코드 세션 40만 건, 사용자 23만 5천 명의 6개월치 사용 기록을 통째로 까봤습니다. 결론은 정반대였어요. AI는 모두를 평등하게 만들지 않았습니다. 아는 사람과 모르는 사람의 격차를 오히려 더 벌려놨습니다.
누가 무엇을 하는가: AI는 '실력'이 아니라 '행위'를 대신했다
먼저 AI와 사람이 일을 어떻게 나눠 가졌는지부터 봅시다. 숫자가 깔끔하게 갈립니다.
| 누가 | 무엇을 | 비중 |
|---|---|---|
| 사람 | "무엇을 만들지" 결정 | 약 70% |
| AI | "어떻게 만들지" 실행 | 약 80% |
출처: Anthropic "Agentic coding and persistent returns to expertise"(클로드 코드 세션 약 40만 건, 2025년 10월부터 2026년 4월). 조회 2026-06-21.
한 번 시키면 AI가 평균 10가지 행동을 알아서 합니다. 사람은 네 번 정도 주고받으며 방향만 잡고요. 즉 AI가 가져간 건 "어떻게"라는 실행이고, 사람이 쥐고 있는 건 "무엇을, 왜"라는 판단입니다. AI가 대신해준 건 실력이 아니라 '행위'였던 거죠. 이게 첫 번째 반전입니다.
진짜 변수는 코딩 실력이 아니다
그럼 같은 AI를 쥐여줬을 때, 누구는 성과를 내고 누구는 못 낼까요? 앤트로픽이 가른 변수는 놀랍게도 코딩 실력이 아니었습니다. 해당 분야를 얼마나 깊이 아느냐, 그것 하나였어요.
보고서에 이런 예가 나옵니다. 시니어 개발자라도 처음 만지는 언어 앞에서는 초보입니다. 반대로 파이썬 한 줄 못 짜는 회계사라도, 월말 결산에서 어떤 규칙이 어긋나는지 정확히 짚고 AI가 놓친 예외를 잡아낸다면 그 일에서는 전문가고요. 실제로 직업별 성공률을 봤더니, 상위 10개 직군이 전부 소프트웨어 엔지니어와 7%포인트 안쪽에 몰려 있었습니다. 관리직은 오히려 개발자보다 살짝 높았고요. 코딩 배경은 거의 무관했다는 뜻입니다.
즉, 싸움을 잘해야 조폭 두목(?)이 될 수 있었던 과거와는 달리, 이제는 어느 거점(?)을 어떻게 먹어야 하는지, 지역민들과의 유착(?)은 어떻게 해야하는지, 싸워야 할 전장과 시기에 대한 전문성과 전략, 이런 것들이 가장 중요했다는 겁니다.
결국 차이를 만든 건 전문성이라는 거죠.
| 초보 | 전문가 | |
|---|---|---|
| 프롬프트당 AI가 한 행동 | 약 5개 | 약 12개 |
| 검증된 성공률 | 15% | 약 두 배 |
| 막혔다가 살아난 비율 | 4% | 15% |
같은 AI인데 전문가는 두 배 넘게 부려먹고, 막혀도 빠져나옵니다. 초보는 다섯 번 중 한 번꼴로 그냥 포기하고요. AI는 빈 그릇을 채워주는 도구가 아니라, 이미 든 걸 몇 배로 키우는 증폭기에 가깝습니다. 전문성이 없는 사람이 아무리 비싼 Opus 모델로 코딩을 해봤자, 정말 밸류있는 프로덕트로 나오지 못한다는 겁니다.

증폭은 평등이 아니라 격차다
"AI가 전문성을 증폭한다"를 반대로 말하면, 가진 사람은 더 멀리 가고, 없는 사람은 제자리입니다. 증폭기는 0에 아무리 곱해도 0이거든요. 그러니 "AI가 진입장벽을 낮춰 누구나 전문가가 된다"는 통념은, 적어도 이 데이터 안에서는 거짓입니다. AI는 평등을 나눠주는 기계가 아니라, 이미 벌어진 격차를 증폭하는 기계였습니다.
회의적인 분은 이렇게 물으실 겁니다. "그럼 초보는 영영 못 따라잡나?" 그건 아닙니다. 핵심은 그 전문성이 직업이 아니라 과제 단위라는 점이에요. 개발자라는 직함이 아니라, 지금 푸는 그 문제를 아느냐가 전부입니다. 회계사가 자기 결산 자동화에서는 시니어 개발자를 이긴 게 그 증거고요. 그러니 못 따라잡는 게 아니라, 따라잡으려면 "AI 잘 쓰는 법"이 아니라 "그 분야를 깊이 아는 것"부터 쌓아야 한다는 겁니다. 순서가 반대였던 거죠.
AXyBench가 매일 보는 장면도 똑같다
사실 저는 이 결론을 데이터로 보기 전부터 현장에서 매일 봅니다. 저희가 한국 실무로 모델을 직접 채점하는 AXyBench에서요.
벤치 종합 1등 모델조차 한국 사실 앞에서는 자신있게 틀립니다. 예금자보호 한도 같은, 한국 사람이 매일 부딪히는 질문에서 보란 듯이 헛다리를 짚거든요. 그런데 그 오답을 잡아내는 건 누구일까요? 모델이 아닙니다. 그 분야를 아는 사람입니다. 세무를 아는 사람만 모델의 세무 오답을 잡고, 한국 부동산을 아는 사람만 모델의 부동산 헛소리를 거릅니다.

앤트로픽 데이터와 저희 채점이 같은 곳을 가리킵니다. AI가 똑똑해질수록 사람이 빠지는 게 아니라, 그 분야를 아는 사람이 더 중요해진다는 거예요. 모델이 80%를 실행해줄수록, 남은 20%의 "이건 틀렸다"를 짚는 판단의 값어치가 올라갑니다. AI 시대에 안전한 건 코딩 스킬이 아니라 도메인의 깊이입니다.
그래서 당신은 뭘 결정해야 하나
이걸 의사결정 언어로 바꾸면 이렇습니다.
하나, 쌓을 자산을 바꾸세요. "AI 활용법 100가지"를 외우는 데 쓸 시간을, 한 분야를 남보다 깊이 아는 데 쓰는 게 낫습니다. 증폭기는 살 수 있어도, 증폭당할 실력은 못 삽니다. 그 실력이 곧 AI를 부려먹는 한계치니까요.
둘, AI를 손으로 쓰지 말고 판단으로 쓰세요. 실행("어떻게")은 넘기되, "무엇을, 왜, 이게 맞나"는 끝까지 쥐고 있어야 합니다. 그 판단을 놓는 순간, AI가 자신있게 틀린 걸 그대로 받아 안게 됩니다.
물론 반론도 있습니다. 모델이 더 좋아지면 전문성의 프리미엄이 줄지 않겠냐는 거죠. 앤트로픽도 그 가능성은 열어뒀습니다. 다만 지금까지의 6개월 데이터에서는, 모델이 좋아질수록 오히려 전문가가 시키는 일의 가치가 더 커졌습니다. 증폭기가 세질수록 원본의 차이가 더 벌어진 셈입니다. 기계 제조 사업을 잘하기 위해 '용접과 가공기술'을 잘 알아야만 가능했던 시대가 아니라, "무엇을, 왜, 그리고 누구에게 얼마에 공급할 것인가"를 제대로 아는 사람이어야 한다는 겁니다.
누구나 바이브 코딩을 할 수 있다면, 더이상 코딩을 잘하는 것은 해자가 아닙니다.
결국 코딩도 비즈니스 모델을 위한 도구이자 수단일 뿐이니까요.