SaaS 리더의 절반 이상(57%) 2026년 가장 큰 관심사는 개발 워크플로에 AI를 통합하는 것이라고 말합니다. 이러한 압박은 엔지니어링 팀을 넘어 확산되었습니다. 이제 CFO의 사무실, CTO의 로드맵, 그리고 CIO의 예산에 영향을 미치고 있습니다.
AI 토큰 비용은 엔지니어링 과제로 시작되었을 수 있지만, 임베디드 분석이 있는 SaaS 제품에서는 이제 최고 경영진의 예산에 영향을 미치고 있습니다.
제품의 분석 레이어에서 상당한 부담이 발생합니다. SaaS 제품 분석은 내부 팀과 외부 고객을 모두 지원합니다. AI 기반 임베디드 분석을 사용하면
고객은 애플리케이션 내에서 직접 자연어 질문을 하여 대시보드와 인사이트를 직접 탐색할 수 있습니다.
각 상호 작용은 모델 처리를 트리거합니다. 질문, 생성된 대시보드 및 자동화된 인사이트는 백그라운드에서 LLM 토큰 사용량을 생성합니다.
AI 분석의 숨겨진 비용
규모가 작으면 영향이 미미해 보입니다. SaaS 규모에서는 무시하기가 훨씬 더 어려워집니다.
대부분의 AI 상호 작용은 사용자에게 간단하게 보입니다. 사용자는 질문을 하고 명확한 답변을 기대합니다. 시스템은 몇 초 안에 인사이트를 반환합니다. 이러한 단순함 뒤에는 훨씬 더 복잡한 프로세스가 있으며, 각 단계에는 토큰 비용이 발생합니다.
하지만 AI 토큰 비용이란 무엇일까요? 간단히 말해서 AI 토큰 비용은 대규모 언어 모델이 요청을 처리할 때 발생하는 컴퓨팅 사용량을 나타냅니다. 각 프롬프트, 응답 또는 중간 단계는 제공업체가 요금을 부과하는 토큰을 소비합니다. 임베디드 분석 워크플로에서 이러한 토큰은 모델이 데이터를 해석하고, 쿼리를 생성하고, 인사이트를 생성함에 따라 빠르게 누적됩니다. AI 분석 현대 시스템은 답변을 생성하기 전에 구조를 해석해야 합니다. 모델은 종종 여러
데이터 소스에서 스키마, 관계 및 메타데이터를 분석합니다.

이러한 준비 작업은 숨겨진 워크로드를 추가합니다. 각 단계에는 모델 처리가 필요합니다. 결과적으로 많은 팀이 예상하는 것보다 LLM 토큰 사용량이 더 많아집니다. 일반적인 SaaS 분석 요청을 고려해 보겠습니다. 사용자는 수익 추세 또는 이탈 신호에 대해 질문할 수 있습니다. 일부 플랫폼은 간단한 질문에서 전체 AI 기반 대시보드
를 생성할 수도 있습니다. 플랫폼은 결과를 표시하기 전에 여러 작업을 수행해야 합니다. 이러한 작업은 대시보드가 표시되기 훨씬 전에 토큰을 소비합니다.
-
각 단계는 토큰을 소비합니다.
-
스키마 해석
-
메트릭 식별
-
쿼리 생성
-
시각화 선택
인사이트 요약
임베디드 분석에서 AI 토큰 사용량이 어떻게 증가하는가
이러한 작업에도 추가 모델 처리가 필요합니다. 사용량이 증가함에 따라 상호 작용당 AI 사용 비용도 증가합니다. 시간이 지남에 따라 패턴이 분명해집니다. 분석 질문은 종종 여러 모델 호출을 트리거합니다. 수천 명의 사용자가 매일 대시보드와 상호 작용하면 AI 토큰 비용이 빠르게 증가하기 시작합니다.
임베디드 분석 환경은 AI 시스템에 고유한 확장 과제를 제시합니다. 내부 분석 도구와 달리 임베디드 분석은 여러 테넌트, 사용자 및 워크플로에서 동시에 작동합니다.
-
각 사용자 상호 작용(질문, 대시보드 생성 또는 인사이트 탐색)은 전체 모델 활동에 기여합니다. 채택이 증가함에 따라 토큰 소비는 다음을 통해 복합적으로 증가합니다.
-
테넌트
-
사용자
-
대시보드
자동화된 워크플로
이로 인해 AI 사용 비용이 예상보다 빠르게 증가하는 곱셈 효과가 발생합니다.
CIO가 개입하는 이유
SaaS 플랫폼의 경우 AI 토큰 비용은 단순한 요청당 문제가 아닙니다. 제품 사용 및 성장에 직접적으로 연결된 아키텍처 고려 사항이 됩니다. 앱 내 임베디드 분석이 급증했습니다. 현대화하기를 꺼렸던 SaaS 플랫폼은 분석 레이어가 어려움을 겪고 있습니다. 이 느린 BI
AI 기술이 강화된 임베디드 분석은 빠르게 인기를 얻고 있습니다. 애플리케이션 현대화 전략입니다. 자연어 쿼리와 자동화된 인사이트는 질문과 답변 사이의 시간 지연을 줄여줍니다.
이러한 엄청난 개선에는 대가가 따릅니다. 더 빠른 인사이트를 얻으려면 종종 백그라운드에서 여러 모델 작업을 수행해야 합니다.
이러한 변화는 새로운 제약 조건을 도입합니다. 조직은 더 이상 대시보드를 기다릴 필요 없이 AI 인프라 비용을 관리해야 합니다. 단일 임베디드 분석 요청은 여러 모델 작업을 트리거할 수 있습니다. 이러한 작업은 모든 상호 작용에 따라 증가하는 LLM 토큰 사용량을 생성합니다. 사용자 행동이 이제 인프라 비용에 영향을 미칩니다. 사용자는 대시보드와 분석 어시스턴트를 통해 무제한으로 질문할 수 있습니다. 각 상호 작용은 모델 활동을 증가시킵니다.
기술 리더의 77% 대다수가 AI 사용 확대를 계획하고 있기 때문에 토큰 소비량은 계속 증가할 것입니다. 이것이 CIO들이 참여하는 이유입니다. AI 기술이 강화된 임베디드 분석은 더 이상 단순한 엔지니어링 문제가 아닙니다. 예산 문제이기도 합니다.

다중 테넌트 SaaS의 과제
임베디드되면 AI 분석은 제품의 일부가 되며, 사용량이 빠르게 증가합니다. 처음에는 소수의 고객이 기능을 사용해보고 몇 가지 질문을 하며, 토큰 소비량은 예산 내에서 유지됩니다. 그러나 이러한 단계는 오래 지속되지 않습니다.
채택이 확산됨에 따라 테넌트는 분석을 일상적인 워크플로에 통합합니다. 귀사의 화이트 라벨 분석은 제품에 자연스럽게 나타나고, 사용자는 이를 당연하게 생각하며 지속적으로 상호 작용합니다.
AI 활동은 여러 계층에서 동시에 확장되기 시작합니다.
-
대시보드 및 보고서를 탐색하는 테넌트
-
자연어 질문을 하는 사용자
-
AI가 자동으로 대시보드를 생성함
-
백그라운드에서 실행되는 자동화된 인사이트
이것이 SaaS 제품의 성공적인 모습입니다. 사용자는 깊이 참여하고, 상호 작용이 증가하며, 가치가 복합적으로 증가합니다. 그렇기 때문에 팀은 확장 가능한 분석 아키텍처를 기반으로 인프라를 설계합니다. 플랫폼은 애플리케이션 환경 속도를 늦추지 않으면서 증가하는 워크로드를 지원해야 합니다.
AI는 다른 확장 요소를 도입합니다. 모든 상호 작용은 모델 처리도 생성합니다. 단일 테넌트 배포와 달리, 다중 테넌트 임베디드 분석은 모든 테넌트의 사용자 활동 급증이 귀사의 공유 LLM 사용 비용에 즉시 영향을 미칩니다. 결과적으로 모든 테넌트, 사용자 및 워크플로에서 LLM 토큰 소비량이 빠르게 증가합니다. 다중 테넌트 SaaS 환경에서 LLM 사용 비용은 선형적으로 증가하지 않습니다. 채택이 확산됨에 따라 기하급수적으로 증가합니다.
책임감 있는 AI 분석이란 무엇인가
분석 워크플로에 AI를 통합하는 팀은 AI 토큰 비용이 통제 불능 상태로 치닫지 않도록 방지하기 위한 안전 장치를 계획해야 합니다. 이러한 안전 장치는 사용자, 테넌트 및 워크플로가 AI 기능과 상호 작용하는 방식을 정의합니다.
귀사의 팀이 필요한 제어 기능은 다음과 같습니다.
-
테넌트별 토큰 제한
-
사용자별 요청 제한
-
AI 요청 제한
-
분석 상호 작용 모니터링
이러한 제어 기능은 채택이 증가함에 따라 장기적인 AI 토큰 최적화를 지원합니다.
통제되지 않은 AI 분석과 관리되는 AI 임베디드 분석의 차이는 상당합니다.
| 통제되지 않은 AI 분석 | 관리되는 AI 분석 |
|---|---|
| 무제한 AI 요청 | 토큰 안전 장치 |
| 단일 모델 종속성 | 모델 유연성 |
| 사용량 모니터링 없음 | AI 사용 가시성 |
| 예측할 수 없는 비용 증가 | 구조화된 AI 토큰 최적화 |
모델 유연성 또한 중요한 역할을 합니다. 다양한 모델은 속도, 정확성 및 토큰 소비량이 다릅니다. 조직은 각 모델이 토큰 소비량에 미치는 영향을 이해하기 위해 모델을 평가해야 합니다.
이러한 기능은 SaaS 플랫폼에 필수적인 요소가 되고 있습니다. 팀은 사용량을 모니터링하고, 요청을 제어하며, AI 사용 비용을 예측 가능하게 유지하는 임베디드 분석 아키텍처가 필요합니다.
Reveal AI가 문제를 해결하는 방법
관리되지 않은 AI 분석은 곧 문제가 될 것입니다. Reveal 이것은 그러한 문제를 방지하기 위해 만들어졌습니다.
Reveal의 AI 기반 임베디드 분석은 사후에 추가된 것이 아니라 비용 관리를 염두에 두고 설계되었습니다. 이 플랫폼을 통해 팀은 AI 기능이 분석 워크플로 내에서 작동하는 방식을 제어할 수 있습니다. 이러한 제어 기능은 조직이 채택이 확장됨에 따라 사용량을 관리하는 데 도움이 됩니다.
Reveal을 사용하면 다음과 같은 이점을 얻을 수 있습니다.
-
테넌트 및 사용자 간의 토큰 안전 장치
-
분석 워크플로 전반의 AI 활동 모니터링
-
구성 가능한 모델 선택 및 배포
-
AI 상호 작용에 대한 중앙 집중식 관리
이러한 기능은 팀이 SaaS 제품 전반에 걸쳐 AI 채택이 증가함에 따라 예측 가능한 AI 토큰 비용을 유지하는 데 도움이 됩니다.

Reveal은 또한 AI 인프라에 대한 완전한 제어 기능을 제공합니다.
-
강력한 분석 보안 기존 권한 모델을 존중합니다.
-
유연한 배포 옵션(예: 온프레미스 분석 환경)
-
모델, 프롬프트 및 사용 규칙을 포함하여 AI 분석 인프라에 대한 완전한 제어
-
테넌트 및 사용자 간의 AI 활동에 대한 내장 가시성
이 아키텍처를 통해 조직은 비용, 인프라 및 관리를 제어하면서 AI 분석을 확장할 수 있습니다. AI가 핵심 제품 기능이 됨에 따라 AI 토큰 비용을 제어하는 것은 지속 가능한 AI 분석에 필수적입니다.
