보코드

보코드

Vocode

전화 및 실시간 음성 대화가 가능한 AI 음성 에이전트를 개발할 수 있는 오픈소스 라이브러리

부분 무료API오픈소스
웹사이트 방문하기vocode.dev
테미와(과) 비교하기

소개

보이코드(Vocode)는 초현실적인 음성 에이전트를 구축하고 배포할 수 있는 오픈소스 오케스트레이션 플랫폼입니다. STT, LLM, TTS 엔진을 유연하게 조합할 수 있는 추상화 레이어를 제공하며, 특히 전화(Telephony), 웹, 화상 회의 등 다양한 채널에서 실시간 대화 중단 감지 및 지연 시간 최적화에 특화되어 있습니다.

활용 워크플로우

실시간 STT 스트리밍 통합Deepgram, AssemblyAI 등과 연동하여 사용자의 음성을 실시간 텍스트로 변환하고 300ms 미만의 초저지연성을 확보합니다.
지능형 대화 오케스트레이션사용자의 말 끊기(Interruption)를 감지하고, 대화의 시작과 끝(Endpointing)을 판단하여 자연스러운 턴제 대화를 관리합니다.
LLM 에이전트 로직 설계OpenAI, Anthropic, Groq 등의 모델을 연결하여 음성 에이전트의 성격, 지식 베이스 및 대화 흐름을 정의합니다.
초현실적 TTS 음성 합성ElevenLabs, Cartesia, Play.ht 등을 통해 감정이 실린 인간다운 목소리를 실시간 스트리밍 방식으로 생성합니다.
보코드AI 허브
전화망 및 웹 SDK 연결Twilio, Vonage API를 통한 전화 인/아웃바운드 호출 및 React SDK를 이용한 웹 브라우저 음성 인터페이스를 구축합니다.
실시간 도구 및 함수 호출통화 중 예약 시스템 API 호출, 데이터베이스 쿼리 등 외부 액션을 LLM이 직접 수행하도록 설정합니다.
화상 회의 에이전트 배포Zoom, Google Meet 등 화상 회의 플랫폼에 음성 에이전트를 참여시켜 회의 기록 및 상호작용을 자동화합니다.
감정 분석 및 대화 모니터링대화 중 사용자의 감정을 트래킹하고 전체 통화 내역을 로깅하여 에이전트의 응답 품질을 지속적으로 개선합니다.
실시간 STT 스트리밍 통합Deepgram, AssemblyAI 등과 연동하여 사용자의 음성을 실시간 텍스트로 변환하고 300ms 미만의 초저지연성을 확보합니다.
지능형 대화 오케스트레이션사용자의 말 끊기(Interruption)를 감지하고, 대화의 시작과 끝(Endpointing)을 판단하여 자연스러운 턴제 대화를 관리합니다.
LLM 에이전트 로직 설계OpenAI, Anthropic, Groq 등의 모델을 연결하여 음성 에이전트의 성격, 지식 베이스 및 대화 흐름을 정의합니다.
초현실적 TTS 음성 합성ElevenLabs, Cartesia, Play.ht 등을 통해 감정이 실린 인간다운 목소리를 실시간 스트리밍 방식으로 생성합니다.
보코드AI 허브
전화망 및 웹 SDK 연결Twilio, Vonage API를 통한 전화 인/아웃바운드 호출 및 React SDK를 이용한 웹 브라우저 음성 인터페이스를 구축합니다.
실시간 도구 및 함수 호출통화 중 예약 시스템 API 호출, 데이터베이스 쿼리 등 외부 액션을 LLM이 직접 수행하도록 설정합니다.
화상 회의 에이전트 배포Zoom, Google Meet 등 화상 회의 플랫폼에 음성 에이전트를 참여시켜 회의 기록 및 상호작용을 자동화합니다.
감정 분석 및 대화 모니터링대화 중 사용자의 감정을 트래킹하고 전체 통화 내역을 로깅하여 에이전트의 응답 품질을 지속적으로 개선합니다.
연동OpenAIDeepgramElevenLabsTwilioCartesiaGroqAssemblyAIVonageZoom

핵심 차별점: STT-LLM-TTS를 단일 파이프라인으로 통합하여 실시간 대화 중단 핸들링과 초저지연 음성 대화를 구현하는 오픈소스 오케스트레이터

주요 기능

  • 실시간 대화 중단(Interruption) 처리
  • 다중 STT/TTS 엔진 오케스트레이션
  • 화상 회의(Zoom 등) 봇 통합
  • 엔터프라이즈급 전화 API
  • 감정 트래킹 및 분석

가격 정보

부분 무료시작 가격: 월 $25

무료 플랜으로 기본 기능을 테스트할 수 있으며, 개발자 플랜은 월 $25부터 시작한다. 유료 플랜에서는 우선적인 기술 지원과 외부 API 통합 기능을 제공하며, 대규모 프로젝트를 위한 맞춤형 엔터프라이즈 플랜도 선택 가능하다.

가격표 확인하기

활용 사례

  • 24/7 AI 고객 상담원
  • 실시간 예약 및 스케줄링 봇
  • 화상 회의 자동 참여 비서
  • 음성 기반 인터랙티브 학습 앱

대상 사용자

개발자소프트웨어 팀

연동 서비스

OpenAIDeepgramElevenLabsTwilioAssemblyAIAnthropic

태그

음성 인식(STT)음성 합성(TTS)에이전트오픈소스API개발자 도구

사용자 리뷰

리뷰를 불러오는 중...

대안 도구

이 도구 대신 사용할 수 있는 대안