CLOVA Speech 개요

Prev Next

CLOVA Speech는 CLOVA의 NEST(Neural End-to-end Speech Transcriber) 음성 인식 기술을 통해 빠르고 쉬운 음성 인식 서비스를 제공하는 네이버 클라우드 플랫폼의 서비스입니다. 길이가 긴 오디오/비디오 파일의 텍스트 변환, 음성 메모, 영상 자막 생성, 통화 녹취록 관리 등 음성 기반 기능에 대한 API를 RESTful 형태로 제공합니다.

참고

CLOVA Speech 서비스는 길이가 긴 오디오/비디오 파일을 업로드하여 음성 인식 결과를 확인할 수 있습니다. 반면, CLOVA Speech Recognition(CSR) 서비스는 1분 이내의 명령형 음성 인식에 최적화되어 있습니다.

CLOVA Speech API에서 공통으로 사용하는 요청 형식과 응답 형식을 설명합니다.

공통 요청 형식을 설명합니다.

API URL

요청 API URL은 다음과 같습니다.

CLOVA Speech 도메인에서 생성된 API Gateway의 고유 InvokeURL
HTTP
참고

InvokeURL을 확인하는 방법은 CLOVA Speech 사용 가이드를 참조해 주십시오.

요청 헤더

헤더에 대한 설명은 다음과 같습니다.

필드 필수 여부 설명
Content-Type Required 요청 데이터의 형식
  • application/json | multipart/form-data | application/octet-stream

공통 응답 형식을 설명합니다.

응답 상태 코드

응답 상태 코드에 대한 설명은 다음과 같습니다.

참고

네이버 클라우드 플랫폼에서 공통으로 사용하는 응답 상태 코드에 대한 정보는 Ncloud API 응답 상태 코드를 참조해 주십시오.

HTTP 상태 코드 코드 메시지 설명
400 400 Invalid request parameters 입력한 요청 파라미터 값이 올바르지 않음
401 401 Invalid secret 입력한 Secret Key 값이 올바르지 않음
400 STT002 Invalid Content Type application/octet-stream 이외의 Content-Type이 입력됨
400 STT003 Empty Sound Data 음성 데이터 누락
400 STT005 Invalid Language 입력된 언어(lang) 파라미터를 지원하지 않음
400 STT004 Empty Language 언어(lang) 파라미터 누락
413 STT001 Exceed Sound Data length 입력된 음성 데이터 값이 허용 길이를 초과 (60초)
500 STT006 Failed to pre-processing 음성 인식 전처리 중 오류 발생
  • 음성 데이터가 정상적인 wav, mp3, flac 인지 확인 필요
500 STT998 Failed to STT 음성 인식 중 오류가 발생함
  • 고객 지원 문의 필요
500 STT999 Internal Server Error 내부 서버 오류
  • 고객 지원 문의 필요
- - SUCCEEDED 작업 성공
- - PROCESSING 작업 진행 중
- - ERROR_SERVER_BUSY 서버 여유 자원이 없음
- - ERROR_TOKEN_INVALID 토큰이 존재하지 않음
- - ERROR_AUDIO_EMPTY 음성 데이터 값이 존재하지 않음
- - ERROR_AUDIO_CONVERSION 음성 변환 실패
- - ERROR_PARAMS_FORMAT_INVALID 입력한 파라미터 형식이 JSON이 아님
- - ERROR_REQUEST_PARAMETER 입력한 요청 파라미터가 올바르지 않음
- - ERROR_REQUEST_PARAMETER 화자가 인식되지 않음
- - ERROR_INVALID_SECRET 입력한 Secret Key 값이 올바르지 않음
- - ERROR_DATA_NOT_FOUND 서버 내부 오류
- - ERROR_DATA_CONFLICT 데이터 충돌
- - ERROR_INTERNAL_ERROR 서버 내부 오류
- - ERROR_EXTERNAL_ERROR 서비스 작동 불가능
- - ERROR_TOO_MANY_JOBS 작업량 초과
- - ERROR_GATEWAY_TIMEOUT 시간 초과
- - FAILED 기타 오류

CLOVA Speech 서비스에서 제공하는 API에 대한 설명은 다음과 같습니다.

API 설명
장문 인식 > Object Storage 파일 인식 네이버 클라우드 플랫폼의 Object Storage에 저장되어 있는 미디어 파일의 고유 URL로 장문 인식
장문 인식 > 외부 파일 인식 공개되어 있는 음성 파일의 고유 URL로 장문 인식
장문 인식 > 로컬 파일 인식 로컬 파일에 대해 장문 인식
장문 인식 > 작업 상태 확인 비동기(async) 방식의 작업 상태 확인
단문 인식 최대 60초 길이의 짧은 음성 파일 인식

CLOVA Speech API에 대한 사용자의 이해를 돕기 위해 다양한 연관 리소스를 제공하고 있습니다.