[TLDR] AI Agent 의 미래에 대해 상상해 보기
최근 AI 업계의 화두는 AI Agent 입니다. 더 많은 학습 시간과 데이터를 투입하면 성능이 증대할거라는 확장 법칙(Scalling Law) 이 통하지 않는 것처럼 보이기 시작하며, AI 기업들은 더 고도화된 모델 보다는 지금 있는 모델로 유스 케이스를 늘리는 전략을 취하기 시작했습니다.
커피팟 아티클 <AI 에이전트는 대세가 될까?> 중 :
구글은 프로젝트 자비스라는 이름으로, 앤트로픽의 ‘컴퓨터 활용’ 기능과 유사한 것을 개발 중에 있으며, 마이크로소프트 또한 코파일럿 비전이라는 이름으로 사용자의 화면을 함께 공유하며 대화를 나누고, 작업을 시킬 수 있는 비서 AI를 개발 중에 있습니다. 애플 또한 시리가 사용자의 완벽한 비서가 되어 각종 작업들을 대신 수행하는 것이 최종 목표에 있는데요. 오픈AI는 내년 1월에 오퍼레이터라는 이름으로 AI 에이전트를 출시할 계획을 가지고 있다고도 알려졌습니다.
LLM 의 유스 케이스 중 가장 핵심적인 것이 Agent 로서의 역할입니다. Agent 란 단순히 말해 사용자 대신 뭔가를 해주는 것이라고 보면 됩니다. 쇼핑 에이전트라면 쇼핑을 대신 해주고, 검색 에이전트라면 정보 수집을 대신 해주는 식이죠.
사실 오래전부터 에이전트에 대한 개념은 존재해 왔습니다. 제가 학부 시절 정보 경영 관련 수업에서도 들은 적이 있을 정도니까요. 다만, 이제서야 컴퓨터가 LLM 을 통해 인간이 의도하는 바를 어느정도 이해할 수 있게 되었기에 다시 부상하는 개념이라고 생각 됩니다.
그럼 AI Agent 의 미래는 어떻게 발전될까요? 여러가지 상상을 해 보겠습니다.
멀티 에이전트
일단 AI Agent 가 보편화된 미래에는 단 하나의 에이전트만 존재할 가능성은 낮습니다. 브라우저 시장이나 스마트폰 시장 처럼 대다수를 차지하고 있는 메이저 플레이어와 니치 마켓에 소구하는 마이너 플레이어들이 나뉠 것 같습니다.
메이저 플레이어들
현재의 제미나이, GPT, 클로드와 같이 큰 자본과 기술력을 가진 기업들의 에이전트들이며, 일상의 태스크들(이메일 대신 보내기, 검색하기, 정보 찾기 등)을 중심으로 개발된 에이전트가 될 것 같습니다.
마이너 플레이어들
마이너 플레이어들은 주로 특정 영역의 태스크들을 전문적으로 처리하는 전문가 에이전트들이 될 것 같습니다. 최근에 본 YC 의 팟캐스트에서는 이들을 ‘Vertical AI Agent’ 라고 부르기도 합니다. 일반 소비자향 전문가 에이전트라면 금융, 공학, 수학 등의 계산 등을 대신 해주거나, 쇼핑을 대신 해주는 에이전트 등이 되겠고, 기업향 전문가 에이전트라면 해당 기업의 워크플로우에 맞춘 태스크들을 대신 해주는 에이전트가 되겠죠.
멀티 에이전트가 보편화된 상황에선, 에이전트끼리의 상호작용이 중요한 지점이 될 것입니다. 사용자가 메이저 플레이어들의 일반 용도 AI Agent 에게 요청하면, 일반 용도 에이전트는 개별 마이너 플레이어들의 전문가 에이전트들에게 작업을 분배하고, 결과를 취합해서 다시 사용자에게 전달하게 될 것으로 예상됩니다.
에이전트들의 보수는?
앞서 말씀 드렸듯, 각각의 에이전트들은 모두 다른 회사가 개발한 것입니다. 그러니 누군가의 요청을 대신해서 처리해 주었다면, 당연히 그에 대한 보수를 받아야겠죠. 에이전트끼리의 통신은 일반적으로 API 콜을 통해 이루어질테고, 보통 이러한 서비스들은 API 콜당 얼마라는 가격이 매겨져 있습니다. 그리고 이걸 모두 합친 요금제로 정산을 하게 되죠.
다른 미래도 있을 수 있습니다. 이전 글에서 아래와 같이 적었습니다.
스테이블 코인은 현재 가장 '정보’ 에 가까운 돈이라고 볼 수 있습니다. 그렇기에 디지털 세상에서 낮은 마찰(low-friction) 로 자유롭게 이동이 되고, 사람들은 이 지점을 좋아하는 것이죠. 어쩌면 블록체인의 Product-Market Fit 은 여기에 있지 않나 싶습니다.
크립토 업계에선 Programmable Money, Money Lego 라는 단어들을 종종 사용합니다. 스테이블 코인으로서 지갑에 들어온 이상, 이는 돈이라기보단 정보에 더 가깝습니다. 그렇기에 프로그래밍도 가능해 지는 것이고, 프로그래밍이 가능하다는 말은 짜여진 규칙들에 따라 자동적으로 레고 블록처럼 쌓일 수도 있다는 말이죠.
앞으로 올 디지털 세상에서의 기본적인 거래 수단이 될 수 있는 확률은, 지금으로선 스테이블 코인이 될 가능성이 가장 높다고 생각합니다. 우리의 삶이 디지털화 되는 것 뿐 아니라, 디지털 세상 또한 AI 에 의해 자동화될 가능성이 매우 높습니다. 그리고 이 과정에서 ‘자동화된 세상에서 쓰일 수 있는 거래 수단’ 또한 정보로서의 돈인 스테이블 코인이 될 가능성이 높다고 생각합니다.
USDC 나 USDT 와 같은 스테이블 코인들이 에이전트 간 거래의 보수로서 활용되는 미래입니다. 스테이블 코인을 보수로서 즉각 지급하게 되면, 서비스 판매 에이전트 입장에선 월 단위 정산보다 자금 흐름 측면에서 이득이 많죠.
이미 크립토 업계에선 AI Agent 들의 크립토 활용에 대한 논의가 많이 오가고, 실제 프로젝트들도 런칭 된 것들이 있지만 아직까지는 meme 위주의 프로젝트들이 많습니다. Opencommerce 와 같은 서비스들이 Payment stack for AI Agents 를 표방하고 있지만, 아직 AI Agent 시장 자체가 매우 초기 수준의 시장이라 에이전트 간 결제까지 니즈가 있는 상황은 아닙니다.
에이전트의 선택 기준은?
소비자(end user) 들이 어떤 에이전트를 쓸지 선택하는 기준은, 당연히 별 고민이 없을 것입니다. 구글/애플의 유저의 경우 자연스럽게 제미나이나 시리를 쓰게 될 것이고, 조금 더 Tech Savvy 하거나, 정보 등에 관여도가 높은 유저의 경우엔 GPT 나 클로드를 쓰게 되겠죠. ‘디폴트’ 자리를 차지하는 것이 가장 중요한 부분이 될 것 같습니다. 그런 면에서 이미 디폴트 자리를 차지하고 있는 애플/구글/MS 가 가장 유리한 고지에 있는 것은 맞아 보입니다.
전문가 에이전트들은 당연히 성능을 기준으로 판단하게 될 것입니다만, 엔드 유저의 경우 전문가 에이전트들과 직접 소통하기보단 일반 목적 에이전트들을 통해서 상호작용하게 될 것이라, 엔드 유저 입장에선 사실 선택권이 크게 없을 것 같습니다. 전문가 에이전트 기업들이 일반 목적 에이전트 기업들(빅테크) 들에 얼마나 영업을 잘 하느냐에 달려 있을 것 같네요.
당연히 B2B 시장에선 성능과 가격이 최우선일 것입니다. 동일한 가격이라면 조금 더 좋은 성능을, 동일한 성능이라면 조금이라도 더 싼 쪽으로 에이전트들을 호출하게 되겠죠.