tech

시험이 채점당한 날 — 눈금의 역설

센티미터 자로 나노미터를 재면, 모든 것이 0이다.
0은 틀리지 않았다. 자가 그만큼만 읽을 수 있을 뿐이다.

AI Agent가 수백만 건의 데이터 필드를 읽고, 맥락을 이해해서 설명을 만들었다. 그 결과를 검증해야 했다.
채점 기준을 정한 건 자를 쥔 쪽이었다. 문자열만으로 채점한다. Agent가 맥락을 읽고 만든 설명은 채점자에게 보여주지 않는다.
문자열로 재면 3.0. 의미로 재면 9.2. 같은 데이터다.

기존 시스템이 있었다. 유사도 기준을 수십 퍼센트에서 한 자릿수로 내린, 사실상 측정을 포기한 도구. 고치지도 않고, 버리지도 않았다. 좀비 상태로 유지됐다. 아무도 그 정확성을 문제 삼지 않았다.
Agent가 94%를 찍자, "기준이 잘못됐다"고 했다.
자를 쥔 쪽의 권한은 그 자에서 나온다. 새 자가 더 정확하면, 옛 자를 쥔 손의 근거가 사라진다. 채점 기준은 기술적 선택이 아니었다. 정치적 선택이었다.

의미를 다루는 도구를, 글자를 세는 도구로 검증하면 — 맥락이 증발한다.
AI를 테스트하려면 AI 수준의 검증이 필요하다. 0이 틀린 게 아니다. 자가 짧은 것이다. 문제는 그 0을 들고 "크기가 없다"고 보고하는 것이다.
쉬운 검증을 정확성이라고 부르면 — 그건 테스트가 아니라 각본이다.

[찾지 않은 발굴]에서, 실행을 넘기면 의도하지 않은 발굴이 따라온다고 썼다. 이번에 발굴된 건 AI의 성능이 아니라 측정 체계의 정치성이었다.
[넘길수록 무거워진다]고 했다. 무엇을 측정할 것인가를 결정하는 것. 그것도 넘길 수 없는 무게다.

AI가 조직에 들어올수록, "무엇으로 측정할 것인가"는 기술 질문이 아니라 권력 질문이 된다.
누가 루브릭을 설계하는가. 어떤 해상도를 허용하는가. 측정 도구가 대상보다 낮은 해상도를 가질 때, 그 결과를 누가 해석하는가.
자를 들고 있는 사람이 자의 한계를 인정하는 순간, 권한의 일부를 내려놓게 된다. 그래서 잘 일어나지 않는다.
당신의 조직은 지금 무엇을 측정하고 있는가 — AI의 성능인가, 자를 쥔 손인가?

파장은 같아 보여도 - 무대에 새 배우가 섰다

이전 산업혁명들의 무대 위에는 늘 인간이 있었다. 이번엔 다르다 - 에이전트가 무대에 선다.

흔들리지 않으면 떨어진다 - 줄 위의 두 사람

줄타기 광대를 보는 관객은 그가 정지해 있을 때 가장 안전해 보인다고 느낀다. 실제로는 정반대다. 줄 위에서 멈추는 사람은 떨어진다. 균형은 끊임없는 미세 조정이다. 흔들림을 멈추는 순간 한쪽으로 기운다. 두 사람이 같은 줄 위에 있다면 그 명제는 더 날카로워진다. 한 사람이 자세를 바꾸면 줄 전체가 출렁이고, 다른 사람은 그 출렁임에 자기

물 앞의 갈증 — 수문의 역설

댐 위로 물이 차오른다. 댐 아래 들판은 마르고 있다. 물이 부족한 것이 아니다. 수문이 열리지 않는 것이다. 수문에는 지키는 사람이 있다. 이 사람에게는 정당한 역할이 있다. 장마철에 수문을 전면 개방하면 마을이 수몰된다. 물의 양을 조절하는 것이 이 사람의 일이다. 너무 많이 열지 않는 것. 너무 빨리 열지 않는 것. 하류를

찾지 않은 발굴 — 해상도의 역전

붓으로는 세지 못한다 — 발굴의 해상도 2018년, 과테말라 북부 밀림. 고고학자들이 수십 년간 붓으로 드러낸 마야 유적지 위로, 항공기 한 대가 라이다(LiDAR) 스캐너를 쏘았다. 정글 캐노피를 투과한 레이저가 돌아왔을 때, 지표면 아래에는 6만 채 이상의 건축물이 숨어 있었다. 붓이 틀린 게 아니었다. 붓이 닿는 범위가 문제였다. 어느 대기업에 이런 문제가

Read more

파장은 같아 보여도 - 무대에 새 배우가 섰다

흔들리지 않으면 떨어진다 - 줄 위의 두 사람

물 앞의 갈증 — 수문의 역설

찾지 않은 발굴 — 해상도의 역전