본문으로 건너뛰기

Comprehend

1 Amazon Comprehend

  • Amazon Comprehend는 자연어 처리(NLP)를 사용하여 문서의 내용을 분석하고 통찰력을 추출하는 완전 관리형 서버리스 서비스입니다.
  • 머신러닝을 사용하여 텍스트에서 인사이트와 관계를 찾아냅니다.

2 주요 기능

2.1 실시간 및 비동기 분석

  • Amazon Comprehend 콘솔 또는 API를 사용하여 문서 분석 기능에 접근할 수 있습니다.
  • 소규모 작업에 대해 실시간 분석을 실행하거나 대규모 문서에 대해 비동기 분석 작업을 시작할 수 있습니다.

2.2 사전 훈련된 모델 및 커스텀 모델

  • 사전 훈련된 모델을 사용하여 문서나 문서 세트를 분석할 수 있습니다.
  • 커스텀 모델을 훈련하여 특정 요구 사항에 맞는 분류 및 엔터티 인식 모델을 만들 수 있습니다.

2.3 다양한 입력 형식 지원

  • 모든 기능은 UTF-8 텍스트 문서를 입력으로 받습니다.
  • 커스텀 분류 및 커스텀 엔터티 인식 기능은 이미지 파일, PDF 파일, 워드 파일도 입력으로 받을 수 있습니다.

2.4 다중 언어 지원

  • 다양한 언어로 문서를 분석할 수 있으며, 주요 언어를 자동으로 감지할 수 있습니다.

3 Amazon Comprehend의 인사이트

3.1 언어 감지

  • 텍스트의 언어를 자동으로 감지합니다.

3.2 엔터티 추출

  • 텍스트에서 사람, 장소, 조직, 이벤트, 브랜드 등의 엔터티를 추출합니다.

3.3 핵심 구문 추출

  • 문서에 나타나는 주요 구문을 식별합니다.

3.4 감정 분석

  • 문서의 주요 감정을 분석하여 긍정적, 중립적, 부정적 또는 혼합된 감정을 감지합니다.

3.5 구문 분석

  • 문서를 토큰화하고 각 단어의 품사를 분석합니다.

3.6 문서 클러스터링

  • 문서 집합을 검사하여 유사한 키워드를 기반으로 문서를 주제 또는 클러스터로 구성합니다.

4 커스텀 모델

4.1 커스텀 분류

  • 자동 머신 러닝(AutoML)을 사용하여 커스텀 분류 모델을 생성합니다.
  • 문서를 사용자가 정의한 카테고리로 분류할 수 있습니다.

4.2 커스텀 엔터티 인식

  • 특정 용어나 명사 기반 구문을 분석하는 커스텀 엔터티 인식 모델을 생성합니다.

5 Flywheels

  • Flywheels를 사용하여 시간 경과에 따른 커스텀 모델 버전의 훈련 및 관리를 간소화합니다.
  • 커스텀 분류 및 커스텀 엔터티 인식을 위한 평문 텍스트 커스텀 모델을 지원합니다.

6 사용 예시

6.1 고객 상호작용 분석

  • 고객 이메일을 분석하여 긍정적 또는 부정적 경험을 이끄는 요인을 찾을 수 있습니다.

6.2 주제별 기사 그룹화

  • Comprehend를 사용하여 기사를 주제별로 그룹화하고 관련된 인사이트를 도출할 수 있습니다.

7 Amazon Comprehend Medical

  • Amazon Comprehend Medical은 비정형 임상 텍스트에서 유용한 정보를 감지하고 반환합니다.
  • 의사의 메모, 퇴원 요약, 검사 결과, 사례 노트 등을 분석할 수 있습니다.
  • NLP를 사용하여 보호된 건강 정보(PHI)를 감지하는 DetectPHI API를 제공합니다.

7.1 문서 저장 및 실시간 데이터 분석

  • Amazon S3에 문서를 저장하거나 Kinesis Data Firehose를 사용하여 실시간 데이터를 분석할 수 있습니다.
  • Amazon Transcribe와 연동하여 환자 내러티브를 텍스트로 변환하고, 이를 Amazon Comprehend Medical로 분석할 수 있습니다.

8 혜택

8.1 강력한 자연어 처리 통합

  • 복잡한 텍스트 분석 기능을 간단한 API로 제공하여 애플리케이션에 통합할 수 있습니다.
  • 텍스트 분석 전문 지식 없이도 강력한 인사이트를 활용할 수 있습니다.

8.2 심층 학습 기반 자연어 처리

  • 심층 학습 기술을 사용하여 텍스트를 정확하게 분석합니다.
  • 다양한 도메인에서 새로운 데이터로 모델을 지속적으로 훈련하여 정확도를 향상시킵니다.

8.3 확장 가능한 자연어 처리

  • 수백만 개의 문서를 분석하여 인사이트를 발견할 수 있습니다.

8.4 다른 AWS 서비스와의 통합

  • Amazon Comprehend는 Amazon S3, AWS KMS 및 AWS Lambda와 같은 다른 AWS 서비스와 원활하게 작동하도록 설계되었습니다.
  • AWS Identity and Access Management(IAM)를 지원하여 Amazon Comprehend 작업에 대한 접근을 안전하게 제어할 수 있습니다.

8.5 출력 결과 및 볼륨 데이터 암호화

  • Amazon S3는 입력 문서를 암호화할 수 있으며, Amazon Comprehend는 이를 더욱 확장합니다.
  • 자체 KMS 키를 사용하여 작업의 출력 결과와 분석 작업을 처리하는 컴퓨팅 인스턴스에 연결된 저장 볼륨의 데이터를 암호화할 수 있습니다.
  • 결과적으로 보안이 크게 향상됩니다.

8.6 저비용

  • 최소 요금이나 선불 약정이 없습니다.
  • 분석한 문서와 훈련한 커스텀 모델에 대해서만 비용을 지불합니다.

9 AWS의 다양한 머신러닝 서비스

  • Amazon SageMaker
    • 용도: 머신러닝 모델을 구축, 훈련, 배포할 수 있는 통합 환경 제공.
    • 특징: 데이터 레이블링, 모델 훈련, 튜닝, 배포 도구 포함.
  • Amazon Comprehend
    • 용도: 텍스트 분석 및 이해를 위한 자연어 처리(NLP) 서비스.
    • 특징: 감정, 핵심 구절, 엔티티, 언어 등의 통찰 추출.
  • Amazon Rekognition
    • 용도: 이미지 및 비디오 분석.
    • 특징: 객체 감지, 얼굴 인식, 이미지 내 텍스트 인식, 콘텐츠 검열.
  • Amazon Polly
    • 용도: 텍스트를 자연스러운 음성으로 변환하는 서비스.
    • 특징: 다양한 언어와 목소리를 지원하여 텍스트를 음성으로 변환.
  • Amazon Transcribe
    • 용도: 음성을 텍스트로 변환하는 자동 음성 인식 서비스.
    • 특징: 다양한 음성 파일의 내용을 텍스트로 변환하여 기록.
  • Amazon Translate
    • 용도: 언어 간 텍스트 번역 서비스.
    • 특징: 실시간 언어 번역을 제공하며 다국어 콘텐츠 제작 지원.
  • Amazon Forecast
    • 용도: 시간 시계열 데이터를 기반으로 예측 생성.
    • 특징: 데이터 패턴을 분석하여 수요 예측, 재고 관리 등에서 활용.
  • Amazon Personalize
    • 용도: 개인화된 추천 시스템 구축.
    • 특징: 사용자 행동 데이터를 기반으로 맞춤형 콘텐츠 추천.
  • Amazon Textract
    • 용도: 문서에서 텍스트, 테이블, 데이터 등을 자동으로 추출하는 서비스.
    • 특징: OCR(광학 문자 인식) 기술을 사용하여 문서 내 정보를 구조화된 데이터로 변환.