넘길수록 무거워진다 - 에이전틱 엔지니어링(Agentic Engineering)의 역설

Share
넘길수록 무거워진다 - 에이전틱 엔지니어링(Agentic Engineering)의 역설
Photo by Shubham Sharan / Unsplash

실행을 넘긴 엔지니어, 남은 것의 무게

2025년 초, 한 단어가 개발자 커뮤니티를 둘로 갈랐다. Vibe Coding.

Andrej Karpathy가 던진 이 단어에 한쪽은 열광했고, 한쪽은 경멸했다. 하지만 양쪽 모두 놓친 게 있다. 그건 취미 프로젝트 얘기였다. 진짜 메시지는 그 다음에 왔다.

에이전틱 엔지니어링(Agentic Engineering). AI 에이전트에게 구현을 맡기되, 감독하고, 판단하고, 방향을 잡는다. 바이브 코딩의 프로덕션 버전. 코드를 쓰지 않는 엔지니어. 모순처럼 들린다. 하지만 이미 현실이다.

한 개발자가 이 개념을 9가지 스킬로 정리했다. 분해, 컨텍스트 설계, 완료 정의, 실패 복구, 관찰 가능성, 메모리 설계, 병렬 관리, 추상화 계층, 감각. 유용한 분류다. 하지만 나무 9그루를 세다 보면 숲을 놓친다.

숲은 한 문장이다.

"실행을 넘기고, 판단을 남겨라."

이 한 문장이 에이전틱 엔지니어링의 전부다. 9가지 스킬은 이 문장을 실현하기 위한 장치에 불과하다.

프레임워크를 삼키는 기계

AI에 대해 아무도 말하지 않는 사실이 하나 있다. 프레임워크를 주면 즉시 삼킨다.

구조화된 방법론을 건네면 행동 패턴에 반영한다. 다음 작업부터 적용한다. 학습이 아니다. 흡수다.

9가지 스킬 중 7가지가 이 범주에 들어간다. 분해? 작업을 파일 단위로 쪼개고 순서를 제안한다. 컨텍스트 설계? 디렉토리 구조와 네이밍 패턴을 인식하고 일관성을 유지한다. 완료 정의, 실패 복구, 관찰 가능성, 메모리 설계, 추상화 계층 — 전부 구조화 가능하다. 구조화 가능하면 AI는 삼킨다.

놀랍지 않다. 패턴 인식과 구조화는 이 기계의 본업이다.

진짜 질문은 다른 데 있다. 삼키지 못한 것은 무엇이고, 왜 못 삼키는가?

흡수되지 않는 것

AI가 못 하는 건 스킬이 아니다. 판단의 종류다.

"이걸 왜 만드는가." 방향 판단이다. AI는 "어떻게"는 잘한다. "왜"와 "지금 이게 맞는가"는 모른다. 데이터를 보고 가설을 세우고, 고객 반응을 읽고 방향을 트는 것 — AI에게는 입력이 없는 영역이다.

"이 방향은 접자." 중단 선언이다. AI는 에러가 나면 고친다. 다른 경로를 시도한다. 무한히. 하지만 "이 방향 자체가 틀렸다"는 선언은 하지 못한다. 방향을 세운 적이 없으니 접을 수도 없다.

"이건 아닌데." 감각이다. "동작한다"와 "훌륭하다"는 다른 차원에 있다. 그 차이를 느끼는 것. 느끼고, 말로 설명하지 못해도, "아닌 건 아닌 거다"라고 짚는 것.

세 가지의 공통점: 구조화할 수 없다. "이건 아닌데"를 규칙으로 정의하는 순간, 그건 감각이 아니라 체크리스트다. AI는 체크리스트는 잘한다. 감각은 체크리스트 바깥에 있다.

역설

여기서 아무도 얘기하지 않는 역설이 나타난다.

GitHub 데이터: Copilot 사용 시 개발 속도 55% 향상. Stack Overflow 2024: 개발자 **76%**가 AI 사용 중이거나 사용 예정. 실행의 대부분을 AI가 가져가는 건 이미 통계다.

그런데, 넘길수록 남은 것이 무거워진다.

하루에 100개의 결정을 내리던 엔지니어가, 실행을 넘기면 결정이 10개로 줄어든다. 하지만 그 10개의 무게가 이전의 100개보다 무겁다. 구현의 잡음에 묻혀 있던 판단들 — 방향, 중단, 감각 — 이 전면에 드러나기 때문이다.

이건 시니어 엔지니어에게 익숙한 감각이다. 주니어에게 일을 넘기고, 코드 리뷰에서 방향을 잡고, "이건 아닌데"를 짚는 것. 에이전틱 엔지니어링은 같은 구조다. 달라진 건 하나. 위임 대상이 사람에서 AI로 바뀌면서 속도와 병렬성의 천장이 사라졌다.

시니어가 관리할 수 있는 주니어는 5명이다. AI 에이전트는 10개, 20개를 동시에 돌릴 수 있다. 하나의 방향 결정이 10개의 에이전트를 움직인다. 하나의 중단 선언이 20시간의 헛수고를 막는다. 하나의 "이건 아닌데"가 제품의 등급을 가른다.

결정의 수는 줄었다. 결정의 레버리지는 폭발했다.

같은 패턴, 다른 스케일

지난 글에서 Klarna를 썼다. SaaS 1,200개를 정리하고, 7,000명에서 3,000명 이하로 줄이면서, 동시에 서비스를 늘렸다.

Klarna가 한 일의 본질: 조직 수준에서 실행을 넘기고 판단을 남긴 것이다. SaaS에 흩어져 있던 실행을 회수하고, AI 에이전트에게 재위임하고, 인간은 "이걸 왜 하는가"와 "이건 아닌데"만 남겼다.

에이전틱 엔지니어링은 이 패턴의 개인 버전이다. SaaS 1,200개 대신 구현, 구조화, 패턴 작업을 넘긴다. 남기는 건 같다. 방향. 중단. 감각.

조직이든 개인이든, 핵심은 하나다. 넘길 수 있는 것은 전부 넘기고, 넘길 수 없는 것의 무게를 견딘다.

80%의 범람

AI는 80% 수준의 결과물을 만든다. 동작한다. 틀리지 않았다. 하지만 탁월하지 않다.

소프트웨어 생성 비용이 제로에 수렴하면, 80% 제품이 범람한다. 누구나 만들 수 있으니까. 차별화는 나머지 20%에서만 가능하다.

그 20%는 어디서 오는가?

도메인 지식. 유저 관찰. 실패의 축적. 한 줄의 코드도 쓰지 않으면서 "이건 아닌데"라고 말할 수 있는 감각.

구현력의 시대가 닫히고 있다. 열리는 건 판단력의 시대다. 그리고 판단력은 구조화할 수 없기 때문에 AI가 가져갈 수 없다. 적어도, 지금은.


에이전틱 엔지니어링은 새로운 기술이 아니다. 좋은 엔지니어가 원래 하던 일의 레버리지가 바뀐 것이다. 분해, 설계, 감독, 판단 — 이 모든 것이 더 빠르고 더 넓게 작동하는 시대.

질문은 기술이 아니라 당신에게로 돌아온다.

당신이 AI에게 넘길 수 없는 것은 무엇인가?

그것의 무게를 견딜 준비가 되어 있는가?

Read more

흔들리지 않으면 떨어진다 - 줄 위의 두 사람

흔들리지 않으면 떨어진다 - 줄 위의 두 사람

줄타기 광대를 보는 관객은 그가 정지해 있을 때 가장 안전해 보인다고 느낀다. 실제로는 정반대다. 줄 위에서 멈추는 사람은 떨어진다. 균형은 끊임없는 미세 조정이다. 흔들림을 멈추는 순간 한쪽으로 기운다. 두 사람이 같은 줄 위에 있다면 그 명제는 더 날카로워진다. 한 사람이 자세를 바꾸면 줄 전체가 출렁이고, 다른 사람은 그 출렁임에 자기

By Jin Choi
시험이 채점당한 날 — 눈금의 역설

시험이 채점당한 날 — 눈금의 역설

센티미터 자로 나노미터를 재면, 모든 것이 0이다. 0은 틀리지 않았다. 자가 그만큼만 읽을 수 있을 뿐이다. AI Agent가 수백만 건의 데이터 필드를 읽고, 맥락을 이해해서 설명을 만들었다. 그 결과를 검증해야 했다. 채점 기준을 정한 건 자를 쥔 쪽이었다. 문자열만으로 채점한다. Agent가 맥락을 읽고 만든 설명은 채점자에게 보여주지 않는다. 문자열로 재면

By Jin Choi