SaaS 리더의 절반 이상(57%)은 /annual-reveal-survey-report-top-software-development-challenges-for-2026에 AI를 개발 워크플로우에 통합하는 것이 2026년의 가장 큰 관심사라고 답했습니다. 이러한 압박은 엔지니어링 팀을 훨씬 넘어 확산되었습니다. CFO의 사무실, CTO의 로드맵, 그리고 이제는 CIO의 예산까지 영향을 미치고 있습니다.
AI 토큰 비용은 엔지니어링 과제에서 시작했을 수 있지만, 임베디드 분석이 적용된 SaaS 제품에서는 이제 임원진의 예산 영역에 도달했습니다.
제품의 분석 계층은 이러한 부담이 가장 많이 나타나는 곳입니다. SaaS 제품 분석은 내부 팀과 외부 고객 모두를 지원합니다. AI 기반 임베디드 분석을 통해 고객은 애플리케이션 내부에서 자연어 질문을 직접 던지면서 대시보드와 인사이트를 스스로 탐색할 수 있습니다.
각 상호 작용은 모델 처리를 유발합니다. 질문, 생성된 대시보드, 자동화된 인사이트는 백그라운드에서 LLM 토큰 사용량을 만듭니다.
작은 규모에서는 그 영향이 미미해 보입니다. 하지만 SaaS 규모에서는 무시하기가 훨씬 어려워집니다.
AI 분석의 숨겨진 비용
대부분의 AI 상호 작용은 사용자에게는 간단해 보입니다. 사용자가 질문을 던지고 명확한 답변을 기대합니다. 시스템은 몇 초 만에 인사이트를 반환합니다. 이 단순함 뒤에는 훨씬 더 복잡한 프로세스가 숨어 있으며, 모든 단계가 토큰 비용을 발생시킵니다.
하지만 AI 토큰 비용이란 무엇일까요? 간단히 말해, AI 토큰 비용은 대규모 언어 모델이 요청을 처리할 때 발생하는 컴퓨팅 사용량을 나타냅니다. 프롬프트, 응답 또는 중간 단계 각각이 제공업체에게 비용을 청구하는 토큰을 소모합니다. 임베디드 분석 워크플로우에서는 모델이 데이터를 해석하고, 쿼리를 생성하며, 인사이트를 산출함에 따라 이러한 토큰이 빠르게 축적됩니다.
현대의 AI 분석 시스템은 답변을 생성하기 전에 구조를 해석해야 합니다. 모델은 종종 여러 데이터 소스에 걸쳐 스키마, 관계 및 메타데이터를 분석합니다.
이러한 준비 작업은 숨겨진 작업 부하를 추가합니다. 모든 단계는 모델 처리를 필요로 합니다. 그 결과는 많은 팀이 예상하는 것보다 높은 LLM 토큰 사용량입니다.

일반적인 SaaS 분석 요청을 고려해 봅시다. 사용자는 매출 추세나 이탈 신호에 대해 질문할 수 있습니다. 일부 플랫폼은 간단한 질문만으로도 전체 AI 생성 대시보드를 만들 수 있습니다. 플랫폼은 결과를 보여주기 전에 여러 작업을 수행해야 합니다. 이러한 작업들은 대시보드가 나타나기 훨씬 전부터 토큰을 소모합니다.
이러한 각 단계는 토큰을 소모합니다:
-
스키마 해석
-
메트릭 식별
-
쿼리 생성
-
시각화 선택
-
인사이트 요약
이들 역시 추가적인 모델 처리를 필요로 합니다. 사용량이 증가함에 따라 상호 작용당 AI 사용 비용도 증가합니다. 시간이 지남에 따라 패턴이 명확해집니다. 분석 질문은 종종 여러 모델 호출을 유발합니다. 수천 명의 사용자가 매일 대시보드와 상호 작용할 때, AI 토큰 비용은 빠르게 증가하기 시작합니다.
임베디드 분석에서 AI 토큰 사용량이 확장되는 방식
임베디드 분석 환경은 AI 시스템에 고유한 확장성 문제를 도입합니다. 내부 분석 도구와 달리, 임베디드 분석은 여러 테넌트, 사용자 및 워크플로우에 걸쳐 동시에 작동합니다.
질문을 하든, 대시보드를 생성하든, 인사이트를 탐색하든, 모든 사용자 상호 작용은 전체 모델 활동에 기여합니다. 채택률이 증가함에 따라 토큰 소비는 다음 영역에 걸쳐 복합적으로 증가합니다:
- 테넌트
- 사용자
- 대시보드
- 자동화된 워크플로우
이는 AI 사용 비용이 예상보다 빠르게 증가하는 승수 효과를 만듭니다.
SaaS 플랫폼의 경우, 이는 AI 토큰 비용이 단순히 요청당 문제가 아님을 의미합니다. 제품 사용 및 성장과 직접 연결된 아키텍처적 고려 사항이 됩니다.
CIO가 관여하는 이유
인앱 임베디드 분석은 급증했습니다. 현대화하는 것을 꺼려왔던 SaaS 플랫폼들은 분석 계층에 어려움을 겪고 있습니다. 이러한 느린 BI 문제는 제품에 대한 신뢰를 떨어뜨렸고, 팀들을 AI 강화 분석 경험으로 밀어붙였습니다.
AI 강화 임베디드 분석은 빠르게 인기 있는 앱 현대화 전략이 되었습니다. 자연어 쿼리와 자동화된 인사이트는 질문과 답변 사이의 시간 지연을 줄여줍니다.
이러한 엄청난 개선은 대가를 치렀습니다. 더 빠른 인사이트는 종종 백그라운드에서 여러 모델 작업을 필요로 합니다.
이러한 변화는 새로운 제약을 도입합니다. 조직은 더 이상 대시보드를 기다리는 것이 아니라 AI 인프라 비용을 관리합니다. 단일 임베디드 분석 요청이 여러 모델 작업을 유발할 수 있습니다. 이러한 작업들은 상호 작용할 때마다 증가하는 LLM 토큰 사용량을 생성합니다. 사용자 행동이 이제 인프라 비용을 형성합니다. 사용자는 대시보드와 분석 비서를 통해 무제한으로 질문할 수 있습니다. 각 상호 작용은 모델 활동을 증가시킵니다.
기술 리더의 77%가 AI 사용을 확장할 계획을 세우면서, 토큰 소비는 계속해서 증가할 것입니다. 이것이 바로 CIO가 관여하는 이유입니다. AI 강화 임베디드 분석은 더 이상 단순히 엔지니어링 문제가 아닙니다. 예산 문제이기도 합니다.

멀티테넌트 SaaS의 과제
임베딩된 AI 분석은 제품의 일부가 되며, 사용량은 빠르게 확장됩니다. 초기에는 소수의 고객이 이 기능을 탐색하고 몇 가지 질문을 던지며 토큰 소비가 예산 내에 머무릅니다. 하지만 그 단계는 오래가지 않습니다.
채택이 확산됨에 따라, 테넌트들은 분석을 일상적인 워크플로우에 임베딩합니다. 귀사의 화이트 라벨 분석은 제품에 네이티브하게 보이며, 사용자들은 이를 그렇게 취급하며 끊임없이 상호 작용합니다.
AI 활동은 여러 계층을 통해 동시에 확장되기 시작합니다:
- 대시보드 및 보고서를 탐색하는 테넌트
- 자연어 질문을 하는 사용자
- 대시보드를 자동으로 생성하는 AI
- 백그라운드에서 실행되는 자동화된 인사이트
이것이 SaaS 제품의 성공 모습입니다. 사용자는 깊이 참여하고, 상호 작용이 증가하며, 가치가 복합적으로 증가합니다. 이것이 바로 팀들이 확장 가능한 분석 아키텍처를 중심으로 인프라를 설계하는 이유입니다. 플랫폼은 애플리케이션 경험을 늦추지 않으면서 증가하는 워크로드를 지원해야 합니다.
AI는 다른 확장 요소를 도입합니다. 모든 상호 작용은 모델 처리를 생성합니다. 단일 테넌트 배포와 달리, 멀티테넌트 임베디드 분석은 한 테넌트의 사용자 활동 급증이 즉시 공유된 LLM 사용 비용에 기여한다는 것을 의미합니다. 그 결과는 테넌트, 사용자 및 워크플로우 전반에 걸친 LLM 토큰 소비의 급격한 증가입니다. 멀티테넌트 SaaS 환경에서 LLM 사용 비용은 선형적으로 증가하지 않습니다. 채택이 확산됨에 따라 곱해집니다.
책임감 있는 AI 분석의 모습
분석 워크플로우에 AI를 임베딩하는 팀은 AI 토큰 비용이 통제 불능 상태로 치솟는 것을 방지하기 위해 가드레일을 계획해야 합니다. 이러한 가드레일은 사용자, 테넌트 및 워크플로우가 AI 기능과 어떻게 상호 작용하는지를 정의합니다.
팀이 필요한 제어 기능:
- 테넌트별 토큰 제한
- 사용자별 요청 제한
- AI 요청 속도 제한
- 분석 상호 작용 모니터링
이러한 제어 기능은 채택이 증가함에 따라 장기적인 AI 토큰 최적화를 지원합니다.
통제되지 않은 AI 분석과 관리되는 AI 임베디드 분석 사이의 차이는 상당합니다.
| 통제되지 않은 AI 분석 | 관리되는 AI 분석 |
|---|---|
| 무제한 AI 요청 | 토큰 가드레일 |
| 단일 모델 의존성 | 모델 유연성 |
| 사용량 모니터링 없음 | AI 사용량 가시성 |
| 예측 불가능한 비용 증가 | 구조화된 AI 토큰 최적화 |
모델 유연성 또한 중요한 역할을 합니다. 다양한 모델은 속도, 정확도 및 토큰 소비량에서 차이가 납니다. 조직은 각 모델이 토큰 소비에 어떻게 영향을 미치는지 이해하기 위해 모델을 평가해야 합니다.
이러한 기능들은 SaaS 플랫폼에 필수적이 되고 있습니다. 팀들은 사용량을 모니터링하고, 요청을 제어하며, AI 사용 비용을 예측 가능하게 유지하는 임베디드 분석 아키텍처가 필요합니다.
Reveal이 문제를 해결하는 방법
관리되지 않은 AI 분석은 발생하기를 기다리는 비용 문제입니다. Reveal은 이를 방지하기 위해 구축되었습니다.
Reveal의 AI 기반 임베디드 분석은 사후에 추가된 것이 아니라 비용 거버넌스를 염두에 두고 설계되었습니다. 이 플랫폼은 팀이 분석 워크플로우 내에서 AI 기능이 어떻게 작동하는지 제어할 수 있도록 합니다. 이러한 제어 기능은 채택이 확장됨에 따라 조직이 사용량을 관리하는 데 도움을 줍니다.
Reveal을 사용하면 얻을 수 있는 것:
- 테넌트 및 사용자 전반의 토큰 가드레일
- 분석 워크플로우 전반의 AI 활동 모니터링
- 구성 가능한 모델 선택 및 배포
- AI 상호 작용에 대한 중앙 집중식 거버넌스
이러한 기능들은 AI 채택이 SaaS 제품 전반에 걸쳐 증가함에 따라 예측 가능한 AI 토큰 비용을 유지하는 데 도움을 줍니다.

Reveal은 또한 AI 인프라에 대한 완전한 제어권을 제공합니다:
- 기존 권한 모델을 존중하는 강력한 분석 보안
- 온프레미스 분석 환경을 포함한 유연한 배포 옵션
- 모델, 프롬프트 및 사용 규칙을 포함한 AI 분석 인프라에 대한 완전한 제어
- 테넌트 및 사용자 전반의 AI 활동에 대한 내장 가시성
이 아키텍처는 조직이 비용, 인프라 및 거버넌스에 대한 통제권을 유지하면서 AI 분석을 확장할 수 있도록 합니다. AI가 핵심 제품 기능이 됨에 따라, AI 토큰 비용을 제어하는 것이 지속 가능한 AI 분석에 필수적이 됩니다.
