Transcribe
1 Amazon Transcribe
- Amazon Transcribe는 음성을 텍스트로 자동 변환하는 서비스입니다.
- 딥러닝 기반의 자동 음성 인식(ASR) 기술을 사용하여 빠르고 정확하게 음성을 텍스트로 변환합니다.
2 주요 기능
2.1 자동 음성 인식 (ASR)
- 오디오 및 비디오 파일을 텍스트로 자동 변환합니다.
- 실시간 및 배치 작업 모두 지원합니다.
- 다양한 언어와 방언을 인식할 수 있습니다.
2.2 개인정보 식별 정보(PII) 제거
- 자동으로 PII를 제거하여 개인 정보를 보호할 수 있습니다.
- 민감한 정보를 안전하게 처리하고 저장할 수 있습니다.
2.3 자동 언어 인식
- 다국어 오디오에서 언어를 자동으로 인식할 수 있습니다.
- 여러 언어가 혼합된 오디오 파일에서도 정확하게 언어를 감지하고 텍스트로 변환합니다.
2.4 사용자 정의 사전
- 특정 용어, 이름, 브랜드와 같은 고유한 단어를 인식하도록 사용자 정의 사전을 생성할 수 있습니다.
- 더 나은 정확도 를 위해 음성 인식 모델을 사용자 지정할 수 있습니다.
2.5 다중 스피커 인식
- 회의, 인터뷰, 고객 지원 전화 등 다중 스피커가 있는 오디오 파일에서 스피커를 식별할 수 있습니다.
- 각 스피커의 발언을 분리하여 텍스트로 변환합니다.
2.6 시간 정보 추가
- 변환된 텍스트에 타임스탬프를 추가하여 각 단어가 오디오 파일에서 발생한 시간을 표시할 수 있습니다.
- 이를 통해 텍스트와 오디오를 동기화할 수 있습니다.
2.7 실시간 스트리밍
- 실시간으로 오디오 스트림을 처리하고 텍스트로 변환할 수 있습니다.
- 실시간 자막, 라이브 트랜스크립션, 실시간 고객 지원 등의 용도로 활용할 수 있습니다.
3 사용 사례
3.1 고객 서비스 통화 기록
- 고객과의 통화를 텍스트로 변환하여 고객 지원의 품질을 향상시킬 수 있습니다.
- 통화 내용을 분석하여 고객의 요구사항과 문제점을 파악할 수 있습니다.
3.2 자동 자막 및 자막 생성
- 인터뷰, 뉴스 방송, 팟캐스트 등의 오디오 콘텐츠를 텍스트로 변환하여 검색 및 분석이 용이하게 할 수 있습니다.
- 자막 생성을 자동화하여 접근성을 높일 수 있습니다.
3.3 미디어 자산의 메타데이터 생성
- 미디어 자산의 메타데이터를 생성하여 완전히 검색 가능한 아카이브를 만들 수 있습니다.
- 다양한 미디어 콘텐츠를 텍스트로 변환하여 검색 및 분류할 수 있습니다.