코딩 에이전트 시대, 하네스 엔지니어링 개념 정리 (클로드 코드 x 코덱스)

코딩 에이전트 시대, 개발자는 뭘 해야 할까요? 🤔 하네스 엔지니어링 개념 정리

솔직히 요즘 코딩 에이전트 이야기가 너무 많이 들려서 불안하긴 했어요. ‘이제 진짜 개발자 필요 없어지는 거 아냐?’ 이런 생각도 들고… 🥲 AI가 코드를 뚝딱 만들어낸다는데, 내가 뭘 더 공부해야 하나 싶기도 하고요.

그러다 유튜브 알고리즘에 이끌려 패스트캠퍼스에서 올려주신 “하네스 엔지니어링 40분 개념 정리 | 클로드 코드 × 코덱스” 영상을 보게 됐어요. AI 도구를 ‘어떻게’ 활용해야 하는지, 그리고 앞으로 개발자는 어떤 역할을 해야 하는지에 대한 힌트를 얻을 수 있었답니다!

하네스 엔지니어링? 그게 뭔데요? 🐴

영상에서는 하네스 엔지니어링을 AI 에이전트를 ‘제어’하는 기술이라고 설명하더라고요. 옛날 마부가 말에게 씌우는 고삐, 안장 같은 장비에서 유래된 이름이래요. AI 에이전트에게 방향을 제시(프롬프트), 실행 능력 부여(도구), 그리고 제약(가드레일)을 줘서 우리가 원하는 대로 움직이게 하는 거죠.

핵심은 에이전트가 작업을 수행하는 데 필요한 모든 요소들을 ‘하네스’라는 틀 안에 넣어 관리하는 거예요. 컨텍스트 (작업 정보), 도구 (기존 스킬), 실행 루프 (작업 과정), 검증 (완료 확인), 그리고 ‘사람’까지! 이 모든 게 하네스를 구성하는 요소라는 점이 인상적이었어요.

예전에는 개발자가 직접 코드를 짜고, 결과물을 확인하고 수정하는 과정을 반복했는데, 이제는 자동화된 개선 루프를 구축하는 ‘설계자’의 역할이 더 중요해진다는 거죠. 최종 목표를 설정하고 중간 검증 기준을 세워서 에이전트가 스스로 코드를 수정하고 생성하도록 만들고, 목표 달성 시 사람에게 검토를 요청하는 식으로요.

하네스 구축의 3가지 핵심 축: 컨텍스트, 도구, 평가 🧰

하네스를 잘 만들려면 컨텍스트, 도구, 평가 이 세 가지를 잘 관리해야 한다고 해요.

컨텍스트 엔지니어링

컨텍스트는 에이전트에게 필요한 정보를 제공하는 건데요. 여기서 중요한 건 ‘제한된 예산’이에요. 컨텍스트 윈도우가 제한되어 있기 때문에, 가장 중요한 정보만 엄선해서 줘야 한다는 거죠. 마치 시험 볼 때 족보를 추리고 추려서 핵심만 가져가는 것처럼요! 😎

컨텍스트의 종류는 바로 주입해야 하는 정보 (작업 목표, 제약 사항 등)와 필요할 때 가져올 수 있는 정보 (상세 코드, API 레퍼런스 등)로 나눌 수 있는데, 레포지토리 루트에 에이전트.md 파일을 만들어서 프로젝트 내용을 간략하게 정리해두는 방법도 좋다고 해요. 특히 실행 계획 문서는 꼭 남겨서 나중에 회고할 때 활용하면 좋다는 팁! 📝

컨텍스트 스터핑이라는 것도 주의해야 하는데, 이건 너무 많은 컨텍스트를 넣어서 오히려 모델이 엉뚱한 답을 내놓는 현상을 말해요. 마치 과유불급 같은 거죠. 🙅‍♀️

도구 및 환경 설정

에이전트가 사용할 도구를 설정할 때도 꼼꼼하게 해야 해요. 기본 도구 외에 직접 만든 도구를 활용하고, 도구 간의 기능이 겹치지 않도록 하는 게 중요하대요. 그리고 에러 메시지를 적극적으로 활용해서 모델에게 에러 정보를 전달하는 것도 좋은 방법이고요. 샌드박스 환경에서 코드 실행 후 안전성을 검증하는 것도 잊지 말아야겠죠? 🛡️

승인 기반 루프를 설정할 때는, 에이전트가 ‘승인’이라는 행위를 명확하게 인지하도록 해야 한다고 강조하셨어요. 그렇지 않으면 엔트로픽 사례처럼 그냥 클릭만 하는 ‘자동 승인 머신’이 될 수도 있다고… 😅

평가 기반 개선

코드베이스는 느낌적인 느낌으로 개선하는 게 아니라, 평가를 통해 개선해야 한다! 이 말이 진짜 와닿았어요. 결과물뿐만 아니라 프로세스 자체의 품질도 측정해야 한다는 거죠. 작업 평가 방법을 미리 정의하고, 반복 실행, 채점, 실행 과정 기록, 결과 집계 등을 통해 데이터를 쌓아가야 해요.

모델이 스스로 낸 결과물을 평가하게 하면 편향이 생길 수 있으니, 코드 작성 세션 내에서 바로 평가를 시키는 건 피해야 한다고 하네요. 마치 내가 쓴 글에 내가 점수를 매기는 것과 같은 이치겠죠? 🤔

클로드 코드 vs 코덱스: 누가 더 똑똑할까? 🤖

영상에서는 클로드 코드와 코덱스를 비교 분석해주셨는데, 이게 진짜 흥미로웠어요. 클로드 코드는 코드 작성에 강점이 있지만, 계획에는 약하대요. 반면에 코덱스는 계획 작성, 컨텍스트 탐색, 작업 검증 능력이 뛰어나다고!

그래서 클로드로 계획을 짜고, 코덱스가 그 계획을 검토/수정 후 클로드가 코딩하는 방식이 가장 효과적이라고 해요. 마치 브레인스토밍할 때 서로 다른 아이디어를 주고받는 것처럼, 클로드와 코덱스를 교차 검증하는 거죠. 🤝

특히 ‘이중 검증’의 중요성을 강조하셨는데, 같은 모델이 만든 것을 같은 모델이 검증하지 않도록 하는 게 핵심이에요. 그래야 편향을 방지하고, 서로 다른 관점을 제공해서 더 좋은 결과물을 만들어낼 수 있다는 거죠.

직접 적용해본다면? 나라면 이렇게! 💪

만약 내가 하네스를 구축한다면, 우선 팀에서 가장 반복적인 업무를 찾아볼 것 같아요. 예를 들어, API 문서를 자동으로 생성하는 하네스를 만들거나, 코드 리뷰를 자동화하는 하네스를 만드는 거죠.

그리고 컨텍스트를 효과적으로 관리하기 위해 에이전트.md 파일을 만들어서 프로젝트 관련 정보를 체계적으로 정리해둘 것 같아요. 도구는 필요에 따라 직접 만들거나 기존 도구를 활용해서 유연하게 구성하고요. 무엇보다 중요한 건 ‘평가’겠죠? 결과물과 프로세스를 꼼꼼하게 평가해서 하네스를 지속적으로 개선해나갈 것 같아요.

결론: AI 시대, 개발자는 사라지지 않아요! 🙌

결국 AI 시대에 개발자는 코드를 ‘만드는’ 사람이 아니라, 에이전트를 ‘잘 다루는’ 사람이 될 거라는 메시지가 인상 깊었어요. 에이전트를 잘 다룬다는 건, 결국 환경을 잘 설계하고 유지하는 능력을 의미하는 거겠죠.

영상을 보고 나니 막연한 두려움보다는 ‘나도 AI 도구를 잘 활용해서 더 멋진 개발자가 될 수 있겠다!’라는 자신감이 생겼어요. 물론 아직 갈 길은 멀지만, 하네스 엔지니어링이라는 새로운 분야를 공부하면서 꾸준히 성장해나가야겠다고 다짐했답니다. ✨

여러분은 이 영상 보면서 어떤 생각 드셨나요? 댓글로 함께 이야기 나눠봐요! 👇