1년 후의 공동 지능 Part 2: 2026 상반기에 새로 드러난 것들

이 글은 Claude Opus 4.7 (1M context) 을 이용해 초안이 작성되었으며, 이후 퇴고를 거쳤습니다.

들어가며#

Part 1 에서는 에단 몰릭의 4가지 규칙이 1년 후 어떻게 다시 읽히는지를 다뤘습니다. 이 글은 같은 1년 동안 원래 규칙에는 없었지만 지금은 핵심이 된 다섯 가지 주제를 정리합니다.

agentic coding 의 본격화 — 도구 지형의 재편
vibe coding 과 새로 발견된 보안 문제들
인지 위축(cognitive atrophy)과 스킬 형성의 비대칭
MCP — 에이전트 간 표준의 등장
컨텍스트 엔지니어링 — 새로운 핵심 역량

각 주제 끝에서 1년 전의 네 가지 규칙 중 어디와 연결되는지 짚어 두겠습니다.

1. agentic coding 의 본격화 — 도구 지형이 다시 그려졌습니다#

무엇이 달라졌나#

2024~2025년의 표준은 “자동완성 + 채팅“이었습니다. GitHub Copilot 이 시장의 67%를 잡고 있었고, 개발자는 IDE 안의 인라인 제안과 Copilot Chat 으로 작업했습니다. 2026년 5월 현재 그 지형이 흔들렸습니다.

Pasquale Pillitteri 의 2026 분석에 따르면:

Claude Code 사용자는 9개월 사이 6배 성장 (3% → 18%)
GitHub Copilot 점유율 67% → 51%로 감소
Cursor 의 모회사 Anysphere 매출은 2025년 6월부터 2026년 2월까지 2개월마다 두 배 성장, ARR 20억 달러 달성

핵심은 점유율의 변동보다 사용 방식이 바뀌었다는 점입니다.

하이브리드 사용 패턴#

NXCode 의 2026 비교와 Pragmatic Engineer 의 AI Tooling 2026이 공통으로 정리한 시니어 팀의 표준은 다음과 같습니다.

일상 작성·탐색: Cursor 또는 VS Code + Copilot
장기 에이전트 세션: Claude Code (크로스 컷팅 리팩토링, 테스트 스위트 생성, 프레임워크 마이그레이션, 시스템적 디버깅)
자동화 워크플로: Codex / Antigravity

즉, “어떤 AI 를 쓰느냐“가 아니라 “어떤 작업에 어떤 AI 를 쓰느냐“가 됐습니다. 작업 단위의 길이와 위험도에 따라 도구를 바꿔 쓰는 것이 자연스러워졌습니다.

규칙과의 연결#

이 변화는 Part 1 의 규칙 2(human in the loop) 와 가장 직접적으로 연결됩니다. 짧은 자동완성에는 사람이 매 순간 루프 안에 있을 수 있지만, Claude Code 가 30분 동안 자율적으로 리팩토링을 진행하는 상황에서는 그렇지 않습니다. 결국 사용자가 “언제 사람이 개입할지를 명시적으로 설계“해야 한다는 뜻이고, 이것은 다음 절에서 다룰 보안 문제와도 직결됩니다.

2. vibe coding 과 새로 발견된 보안 문제들#

vibe coding 이 뭔가요#

Andrej Karpathy 가 2025년 초에 만든 표현으로, “한 줄 한 줄 코딩하는 게 아니라 자연어로 원하는 것을 묘사하면 AI 가 만들어 주는” 작업 방식을 가리킵니다. 2026년 상반기 기준 미국 개발자의 92%가 어떤 형태로든 AI 코딩 보조를 사용하고 있고, 그 중 상당수가 vibe coding 으로 분류됩니다.

문제는 이 방식이 작년 인터뷰 시점에서는 존재하지 않던 규모의 보안 리스크를 만들어 냈다는 점입니다.

slopsquatting — AI 환각이 만든 새로운 공급망 공격#

Trend Micro 의 2026 리포트 와 Aikido 의 분석이 공통으로 다루는 내용:

LLM 이 코드를 생성할 때 존재하지 않는 npm/PyPI 패키지 이름을 환각으로 만들어 냅니다.
576,000 개 코드 샘플 테스트 결과, 추천된 패키지 이름의 19.7% 가 실제로는 존재하지 않았고, 오픈소스 모델은 21.7%, 상업 모델은 5.2% 비율이었습니다.
그 중 43% 가 일관되게 반복해서 등장합니다 — 즉, 어떤 환각 이름은 예측 가능하기 때문에, 공격자가 그 이름으로 미리 악성 패키지를 등록해 두면 됩니다.
실제로 2026년 1월 react-codeshift 라는 환각 npm 패키지가 237 개 저장소에 AI 가 만든 에이전트 스킬 파일을 통해 퍼졌습니다. 아무도 의도적으로 심지 않았는데도 말입니다.
한 연구자가 LLM 들이 huggingface-cli 를 Python 패키지로 환각한다는 것을 발견하고 PyPI 에 등록했더니 3개월간 3만 회 다운로드가 발생했습니다.

Stanford AI Index 2026이 이를 자율 에이전트 시대의 3대 신규 공격 표면 중 하나로 지목했습니다.

AI 생성 코드의 취약점 비율#

BeyondScale 의 2026 엔터프라이즈 가이드 와 Checkmarx 의 분석 에서 정리한 숫자들:

AI 생성 코드의 40~62% 가 어떤 형태의 취약점을 포함합니다.
5개 주요 LLM 의 출력 샘플 중 86% 에서 XSS 취약점이 발견되었습니다.
2026년 3월 한 달 동안만 vibe coding 관련 CVE 35건이 발생했습니다.
2026년 2월, vibe coding 으로 만든 소셜 네트워크 사이트 Moltbook 에서 150만 개의 인증 토큰과 35,000 개의 이메일 주소가 잘못 구성된 데이터베이스를 통해 노출되었습니다. 창업자는 “한 줄도 안 짰다"고 자랑했었습니다.

가장 무서운 결과는 2025년 IEEE-ISTAS 실험입니다. AI 가 만든 코드를 다섯 번 반복해서 다듬게 했더니 취약점 수가 37.6% 증가했습니다. “AI 에게 한 번 더 정리하라고 시키면 좋아진다"는 직관이 보안 측면에서는 틀린다는 뜻입니다.

context poisoning#

Atlan 의 2026 분석에 따르면 OWASP 가 2026년 agentic AI 의 톱 리스크로 꼽은 것이 컨텍스트 포이즈닝입니다. 외부 데이터, 도구 출력, 검색 결과를 통해 에이전트의 컨텍스트에 적대적 지시가 섞여 들어가는 공격입니다. 사람이 의도적으로 프롬프트를 조작하지 않아도, AI 가 자율적으로 가져온 정보 자체가 공격 벡터가 됩니다.

규칙과의 연결#

이 보안 문제들은 Part 1 의 규칙 2(human in the loop) 가 단순한 권고가 아니라 필수 안전 장치임을 보여 줍니다. 또한 **규칙 4(최악의 AI)**의 낙관적 프레임에 보정이 필요한 이유이기도 합니다. 모델이 좋아진다고 보안 문제가 자동으로 사라지는 것이 아니라, 새 유형의 공격 표면이 함께 자라기 때문입니다.

3. 인지 위축 — AI 가 우리를 어떻게 바꾸는가#

Anthropic 의 자체 연구#

가장 충격적이었던 것은 모델 제공자 본인이 낸 자료입니다. InfoQ 가 보도한 Anthropic 의 2026년 2월 연구 에 따르면:

AI 보조를 쓰는 개발자가 새 코딩 라이브러리를 배울 때 이해도 테스트에서 17% 낮은 점수를 받았습니다.
같은 시간 동안 생산성 이득은 통계적으로 유의미하지 않았습니다.
AI 를 개념 탐구(conceptual inquiry) 에 쓴 그룹은 65% 이상의 점수를, 코드 생성 위임(code generation delegation) 에 쓴 그룹은 40% 미만의 점수를 받았습니다.

Shen & Tamkin 의 후속 연구#

같은 InfoQ 기사 가 인용한 Shen & Tamkin (2026) 의 통제 실험: 52명의 프로 또는 프리랜서 프로그래머가 새로운 복잡한 프로그래밍 스킬을 학습했고, AI 사용 그룹과 대조군의 장기적 스킬 형성에 명확한 차이가 발생했습니다. 핵심 결과는 “AI 가 문제냐, AI 가 없는 게 정답이냐” 가 아니라 “인지적 참여(cognitive engagement) 가 핵심“이라는 점입니다.

사회과학 쪽의 정리#

University of Technology Sydney 의 2026년 3월 리포트 와 arXiv 의 The Augmentation Trap 는 이렇게 정리합니다.

인지적 오프로딩(cognitive offloading) 자체가 문제가 아닙니다. 계산기, 검색엔진도 오프로딩 도구였습니다.
문제는 스킬을 형성·유지하는 데 필요한 인지 활동을 통째로 떠넘길 때 발생합니다.
그 결과를 인지 위축(cognitive atrophy) 이라고 부릅니다.

규칙과의 연결#

이 부분은 1년 전 인터뷰에서 거의 언급되지 않았던 영역입니다. 가장 가까운 것은 규칙 1(AI를 초대하라) 인데, “초대” 자체가 자동으로 스킬을 형성하지는 않는다는 점이 새로 확인되었습니다. 우리는 “언제 위임할지” 만큼이나 “언제는 일부러 위임하지 않을지“를 의식적으로 설계해야 합니다. 이것은 Part 1 의 규칙 2 재해석 에서 다룬 “매니저로서의 인간"과도 통합니다 — 좋은 매니저는 자신의 핵심 스킬을 의도적으로 유지합니다.

4. MCP — 에이전트 간 표준의 등장#

작년 인터뷰 시점에는 존재하지 않던 표준입니다. Model Context Protocol 은 Anthropic 이 2024년 11월에 발표한 오픈 프로토콜로, LLM 과 외부 도구·데이터 소스 사이의 통합 방식을 표준화합니다.

1년 사이의 확산#

Digital Applied 의 2026 통계 와 WorkOS 의 2026 가이드:

2026년 4월 기준, 엔터프라이즈 AI 팀의 78% 가 프로덕션에 최소 1개의 MCP 기반 에이전트를 보유.
설문에 응한 CTO 의 67% 가 12개월 내 MCP 를 에이전트 통합의 기본 표준으로 채택.
2025년 12월 시점, MCP SDK 의 월간 다운로드가 9,700만 회.
2025년 3월 OpenAI 가 공식 채택, 2026년 1분기 Google 이 Gemini API 와 Vertex AI Agent Builder 에 통합.

거버넌스 이전#

Anthropic 의 발표 에 따르면, 2025년 12월 Anthropic 은 MCP 를 새로 출범한 Linux Foundation 산하 Agentic AI Foundation 에 기증했습니다. Block, OpenAI, AWS, Google, Microsoft 가 창립 멤버로 참여한 이 단계 이후로 MCP 는 “한 회사의 프로젝트"가 아닌 공용 인프라가 되었습니다.

규칙과의 연결#

Part 1 의 규칙 3 재해석 에서 “역할 지정은 아키텍처로 옮겨갔다"고 했는데, 그 아키텍처의 표준 인터페이스가 MCP 입니다. 에이전트에게 도구·데이터·역할을 노출하는 방식이 통일됨으로써, 1년 전에는 회사마다 제각각이던 통합 방식이 표준화되었습니다. 이는 규칙 2(human in the loop) 에도 직접 영향을 줍니다 — 모든 도구 호출이 같은 프로토콜로 흐르기 때문에 사람이 감독·감사할 수 있는 지점이 일관됩니다.

5. 컨텍스트 엔지니어링 — 새로운 핵심 역량#

작년 인터뷰에서 몰릭은 “프롬프팅이 어렵지 않다, 사람한테 말하듯 하면 된다"고 했습니다. 2026년의 답은 다릅니다 — “프롬프트가 아니라 컨텍스트를 설계해야 한다.”

왜 컨텍스트가 중요해졌나#

LogRocket 의 2026 분석 이 정리한 세 가지 압력:

에이전트의 등장: 멀티 스텝으로 계획·추론·행동하는 에이전트는 각 스텝마다 컨텍스트를 정교하게 설계해야 합니다.
긴 컨텍스트 윈도우: Claude Opus 4.7 의 1M 토큰 컨텍스트는 강력하지만, LLM 이 가지는 U자형 성능 곡선 때문에 중간 정보가 무시되는 “lost in the middle” 문제가 더 심해졌습니다.
장기 작업의 메모리 문제: METR 의 반감기 연구 가 지적했듯이, 각 세션이 이전 세션을 기억하지 못한다는 점이 에이전트 시대의 가장 큰 미해결 문제입니다.

실무 패턴#

LangChain 의 가이드 와 Harness Engineering Academy 의 2026 가이드 에서 공통으로 강조하는 기법:

계층형 메모리(tiered memory): 단기·중기·장기 메모리를 구분
컨텍스트 압축: 작업과 관련된 정보만 추출해 요약
검색 기반 주입(retrieval): 필요할 때 필요한 정보만 가져오기
사이드카 메타데이터: 도구 출력에 출처·신뢰도·신선도 메타데이터 첨부
컨텍스트 평가(evals): 무엇이 컨텍스트에 들어갈 때 결과가 좋아졌는지 측정

LangChain 사례에서는 컨텍스트 파이프라인 재설계만으로 작업 완료율을 83% 에서 96% 로 끌어올렸습니다.

규칙과의 연결#

이 영역은 규칙 3(사람처럼 대하라) 의 자연스러운 발전이지만, 동시에 규칙 1(초대하라) 의 의미도 바꿉니다. 작년에는 “그냥 일을 시켜 봐라"였지만, 2026년의 “초대"는 “어떤 컨텍스트와 함께 일을 줄 것인가” 를 설계하는 작업이 되었습니다.

4가지 규칙의 2026년판 업데이트#

Part 1 의 표를 확장하면 다음과 같습니다.

규칙	1년 전(2025년 6월)	2026년 5월
1. AI를 초대하라	직접 써서 경계 파악	모델 바뀔 때마다 재테스트, 에이전트에 줄 권한·도구·컨텍스트를 설계
2. 인간이 루프에	의사결정 루프 안에 머물기	매니저처럼 분해·위임·검증. 자율성은 명시적으로 부여, 보안 체크포인트 필수
3. 사람처럼 대하라	자연어 + 역할 지정	컨텍스트 엔지니어링 + MCP 같은 아키텍처로서의 역할
4. 최악의 AI	더 나아질 거라는 낙관	검증됨. 단 발전은 비매끄럽고, 기술 부채와 인지 위축은 누적된다

여기에 1년 전 인터뷰에는 없었던 보조 규칙 몇 가지를 더할 수 있습니다.

규칙 5(잠정): 새 공격 표면을 가정하라. 모델이 좋아진다고 공격이 사라지지 않습니다. slopsquatting, context poisoning, AI 생성 코드의 86% XSS 같은 새 위협이 함께 자랍니다.
규칙 6(잠정): 인지 위축을 의식적으로 막아라. 위임할 때마다 “이 작업을 직접 하지 않음으로써 잃는 스킬은 무엇인가“를 물으세요. 위임이 자동으로 학습이 되지는 않습니다.
규칙 7(잠정): 단절은 매끄럽지 않게 온다. 몰릭의 “굴러가는 단절(rolling disruption)” 프레임을 기억하세요. 다음 능력 임계값이 깨질 때 어떤 시장·직무·코드베이스가 흔들릴지 시나리오 사고를 해 두세요.

맺으며#

1년 전에 번역했던 글의 마지막 문장은 “당신이 오늘 사용하고 있는 모든 것은 구식이다“였습니다. 그 말은 검증되었습니다. SWE-bench 점수, 에이전트 작업 길이, 도구 시장 점유율 — 모든 숫자가 1년 만에 두 배 가까이 움직였습니다.

그런데 같은 1년 동안 우리는 “구식이 된다“가 좋기만 한 소식은 아니라는 것도 배웠습니다. 새 모델은 새 능력만 가져오는 것이 아니라 새 공격 표면, 새 종류의 기술 부채, 새 종류의 인지 위축까지 함께 가져옵니다. 몰릭 자신이 “공동 지능(co-intelligence)” 에서 “관리(management) “로 프레임을 옮긴 것은 이 비대칭을 인정한 결과로 보입니다.

저자가 작년 인터뷰에서 강조했던 본질 — “일단 자리에 부르고 함께 일해 보라” — 은 여전히 출발점입니다. 다만 그 다음 단계가 1년 사이에 훨씬 두꺼워졌습니다. 컨텍스트를 설계하고, 보안 체크포인트를 두고, 자신의 스킬이 위축되지 않게 의식적으로 일부 작업을 직접 하고, 모델이 바뀔 때마다 경계선을 재테스트하는 일들이 일상이 되었습니다.

다시 1년 뒤, 이 글도 똑같이 구식이 되어 있기를 바랍니다.

References#

원본 인터뷰 번역: 번역글: 에단 몰릭이 말하는 AI와의 “공동 지능"을 위한 4가지 규칙
Part 1: 에단 몰릭의 4가지 규칙은 2026년에도 유효한가
Ethan Mollick, The Shape of the Thing, One Useful Thing, 2026-03-12.
Stanford HAI, The 2026 AI Index Report.
Pasquale Pillitteri, GitHub Copilot vs Cursor vs Claude Code (2026).
NXCode, Cursor vs Claude Code vs GitHub Copilot 2026: Ultimate Comparison.
Pragmatic Engineer, AI Tooling for Software Engineers in 2026.
Trend Micro, Slopsquatting: When AI Agents Hallucinate Malicious Packages.
Aikido, Slopsquatting: The AI Package Hallucination Attack Already Happening.
BeyondScale, Vibe Coding Security Risks: Enterprise Guide 2026.
Checkmarx, Vibe Coding Security: Risks, Vulnerabilities, and Secure AI Coding.
Retool, The Risks of Vibe Coding.
Atlan, Context Poisoning: How Bad Context Breaks AI Agents (2026).
InfoQ, Anthropic Study: AI Coding Assistance Reduces Developer Skill Mastery by 17%.
arXiv, The Augmentation Trap: AI Productivity and the Cost of Cognitive Offloading.
IEEE Xplore, Cognitive Offloading or Atrophy?.
Anthropic, Introducing the Model Context Protocol.
Anthropic, Donating the Model Context Protocol and Establishing the Agentic AI Foundation.
Digital Applied, MCP Adoption Statistics 2026.
WorkOS, Everything Your Team Needs to Know About MCP in 2026.
LangChain, Context Engineering for Agents.
LogRocket, The LLM Context Problem in 2026.
Harness Engineering Academy, Context Engineering: The Key Skill Every AI Developer Needs in 2026.
METR, Is There a Half-Life for the Success Rates of AI Agents?.