본문으로 건너뛰기

Rekognition

1 Amazon Rekognition

  • Amazon Rekognition은 클라우드 기반의 이미지 및 비디오 분석 서비스입니다.
  • 애플리케이션에 고급 컴퓨터 비전 기능을 쉽게 추가할 수 있습니다.
  • 딥러닝 기술을 기반으로 하며, 머신러닝 전문 지식 없이도 사용할 수 있습니다.
  • Amazon S3에 저장된 이미지 또는 비디오 파일을 빠르게 분석할 수 있는 간단하고 사용하기 쉬운 API를 제공합니다.

2 주요 기능

2.1 이미지 분석

  • 객체, 사람, 텍스트, 장면 탐지
    • 이미지를 분석하여 객체, 사람, 텍스트, 장면 및 유명인을 탐지하고 분류할 수 있습니다.
  • 텍스트 탐지
    • 다양한 언어로 인쇄된 텍스트와 손으로 쓴 텍스트를 인식할 수 있습니다.
  • 부적절한 콘텐츠 탐지
    • 명시적이고 부적절하거나 폭력적인 콘텐츠를 탐지하고 필터링할 수 있습니다.
    • 세분화된 부적절한 콘텐츠 라벨을 탐지합니다.
  • 유명인 인식
    • 정치인, 운동선수, 배우, 음악가 등 다양한 범주의 수만 명의 유명인을 인식할 수 있습니다.
  • 얼굴 분석
    • 얼굴을 탐지, 분석 및 비교하고 성별, 나이, 감정 등의 얼굴 속성을 분석할 수 있습니다.
    • 사용자 인증, 카탈로깅, 인구 조사, 공공 안전 등의 용도로 사용됩니다.
  • 사용자 정의 라벨
    • 특정 사용 사례에 맞는 객체를 탐지하기 위해 사용자 정의 분류기를 구축할 수 있습니다. 예: 로고, 제품, 캐릭터.
  • 이미지 속성 분석
    • 이미지의 품질, 색상, 선명도, 대비와 같은 속성을 분석할 수 있습니다.

2.2 비디오 분석

  • 객체, 사람, 텍스트, 장면 탐지
    • 비디오에서 객체, 사람, 텍스트, 장면 및 유명인을 탐지하고 분류할 수 있습니다.
  • 텍스트 탐지
    • 다양한 언어로 인쇄된 텍스트와 손으로 쓴 텍스트를 인식할 수 있습니다.
  • 사람 경로 추적
    • 비디오 프레임을 가로질러 식별된 사람들을 추적할 수 있습니다.
  • 얼굴 분석
    • 스트리밍 또는 저장된 비디오에서 얼굴을 탐지, 분석 및 비교할 수 있습니다.
  • 유명인 인식
    • 정치인, 운동선수, 배우, 음악가 등 다양한 범주의 수만 명의 유명인을 저장된 비디오에서 인식할 수 있습니다.
  • 부적절한 콘텐츠 탐지
    • 비디오에서 명시적이고 부적절하거나 폭력적인 콘텐츠를 탐지할 수 있습니다.
  • 비디오 분할
    • 검은 화면, 엔드 크레딧과 같은 유용한 비디오 세그먼트를 자동으로 식별할 수 있습니다.
  • 얼굴 실시간성
    • 얼굴 검증 중에 라이브 사용자가 있는지 감지할 수 있습니다.

3 활용 사례

3.1 검색 가능한 미디어 라이브러리

  • Rekognition은 이미지와 비디오에서 라벨, 객체, 개념, 장면을 탐지합니다.
  • 이러한 시각적 콘텐츠 분석을 기반으로 라벨을 검색할 수 있습니다.
  • 이미지 및 비디오 라이브러리를 검색 가능하게 만드는 데 유용합니다.

3.2 얼굴 기반 사용자 신원 확인

  • 이미지의 얼굴을 참조 얼굴 이미지와 비교하여 사용자 신원을 확인합니다.
  • 애플리케이션에서 신원 확인에 유용합니다.

3.3 얼굴 실시간성 감지

  • Rekognition Face Liveness는 얼굴 기반 신원 확인 중 사기를 방지하도록 설계된 관리형 머신 러닝 기능입니다.
  • 사용자가 카메라 앞에 실제로 있는지 확인하고, 사진, 비디오, 3D 마스크 등의 스푸핑 공격을 감지할 수 있습니다.
  • 또한, 사전 녹화된 비디오나 딥페이크 비디오와 같은 스푸핑 공격도 감지할 수 있습니다.

3.4 얼굴 검색

  • Rekognition을 사용하여 저장된 비디오 및 스트리밍 비디오에서 얼굴 컬렉션에 저장된 얼굴을 검색할 수 있습니다.
  • 얼굴 컬렉션은 사용자가 소유하고 관리하는 얼굴의 인덱스입니다.
  • 얼굴을 기반으로 사람을 검색하려면 얼굴을 인덱싱하고 검색해야 합니다.

3.5 부적절한 콘텐츠 탐지

  • 이미지와 비디오에서 명시적이고 부적절하거나 폭력적인 콘텐츠를 탐지하고 필터링합니다.
  • 비즈니스 요구에 맞춘 세분화된 필터링을 위한 라벨을 사용합니다.
  • 콘텐츠 모더레이션 API는 감지된 라벨(객체 및 개념)과 함께 신뢰도 점수를 반환합니다.
  • 이러한 객체/라벨은 특정 유형의 부적절한 콘텐츠를 나타내며, 대량의 사용자 생성 콘텐츠(UGC)를 관리하는 데 유용합니다.
  • 콘텐츠 모더레이션 API의 출력을 사용자 정의할 수 있습니다.

3.6 개인 보호 장비 감지

  • 이미지를 통해 개인 보호 장비를 감지하여 다양한 산업에서 안전 준수를 모니터링할 수 있습니다.
  • 부적절한 장비를 감지하여 안전하지 않은 조건을 자동으로 플래그 지정하고, 이러한 조건에 대한 경고를 수신하여 준수 및 교육을 개선할 수 있습니다.

3.7 유명인 인식

  • 정치인, 운동선수, 배우, 음악가 등 다양한 범주의 수만 명의 유명인을 이미지와 비디오에서 인식할 수 있습니다.
  • 이름을 제공할 필요 없이 유명인 출연을 식별할 수 있습니다.

3.8 텍스트 탐지

  • 이미지에서 텍스트를 탐지하고 추출하여 시각적 검색 또는 메타데이터 추출에 활용할 수 있습니다.
  • 다양한 폰트와 스타일에서 텍스트를 탐지하고, 표지판과 배너의 텍스트를 감지할 수 있습니다.

3.9 사용자 정의 라벨

  • 특정 비즈니스 사용 사례에 맞는 객체, 개념 및 장면을 식별합니다.
  • 사용자 정의 분류기를 훈련하여 특정 객체를 더 정확하게 탐지할 수 있습니다.

4 콘텐츠 모더레이션

  • Rekognition은 이미지와 비디오에서 부적절하거나 원치 않거나 불쾌한 콘텐츠를 탐지합니다.
  • 소셜 미디어, 방송 매체, 광고, 전자상거래 환경에서 안전한 사용자 경험을 제공하는 데 사용됩니다.
  • 항목이 플래그로 지정될 최소 신뢰도 임계값을 설정할 수 있습니다.
  • Amazon Augmented AI(A2I)에서 수동 검토를 위해 민감한 콘텐츠를 플래그 지정할 수 있습니다.
  • 규정 준수를 돕습니다.

5 장점

5.1 강력한 이미지 및 비디오 분석 기능 통합

  • 전문 지식 없이도 애플리케이션에 정확한 이미지 및 비디오 분석 기능을 추가할 수 있습니다.
  • Amazon Rekognition API는 딥러닝을 통해 분석을 제공하며, 머신러닝 지식이 없어도 사용할 수 있습니다.
  • 웹, 모바일, 장치 애플리케이션에 컴퓨터 비전 기능을 빠르게 구축할 수 있습니다.

5.2 딥러닝 기반 이미지 및 비디오 분석

  • 딥러닝을 통해 이미지를 분석하여 높은 정확도를 제공합니다.
  • Amazon Rekognition은 라벨, 객체, 장면, 얼굴, 유명인을 감지할 수 있습니다.
  • 결과를 필터링하여 특정 라벨을 포함하거나 제외할 수 있습니다.

5.3 확장 가능한 이미지 분석

  • 수백만 개의 이미지를 분석하여 방대한 시각적 데이터 세트를 구성할 수 있습니다.
  • 증가하는 이미지 라이브러리와 트래픽을 처리할 수 있도록 확장할 수 있습니다.
  • 용량을 계획할 필요가 없으며, 사용한 만큼만 비용을 지불합니다.

5.4 이미지 속성을 기반으로 분석 및 필터링

  • 이미지의 품질, 색상, 시각적 콘텐츠를 분석하고 필터링할 수 있으며, 이미지 선명도, 밝기, 대비를 감지할 수 있습니다.

5.5 다른 AWS 서비스와 통합

  • Amazon Rekognition은 S3와 Lambda와 기본적으로 통합됩니다.
  • Lambda에서 Amazon Rekognition API를 호출하여 데이터를 이동하지 않고도 Amazon S3에서 이미지를 처리할 수 있습니다.
  • Rekognition은 AWS IAM을 사용하여 내장된 확장성과 보안을 제공합니다.

5.6 저비용

  • 사용한 만큼만 지불하는 가격 정책, 최소 사용량이나 약정이 없습니다.
  • 시작하기 위한 무료 티어를 제공합니다.
  • 사용량이 증가함에 따라 계층화된 가격을 통해 비용을 절감할 수 있습니다.
  • 내부 솔루션에 비해 비용 효율적입니다.

5.7 간단한 커스터마이제이션

  • 어댑터를 사용하여 사용 사례에 맞게 정확도를 사용자 정의할 수 있습니다.
  • 샘플 이미지를 제공하여 어댑터를 훈련시킵니다.
  • 주어진 도메인의 객체 및 라벨 탐지를 개선합니다.
  • 머신러닝 전문 지식 없이도 분석을 쉽게 맞춤화할 수 있습니다.

6 AWS의 다양한 머신러닝 서비스

  1. Amazon SageMaker
    • 용도: 머신러닝 모델을 구축, 훈련, 배포할 수 있는 통합 환경을 제공.
    • 특징: 데이터 레이블링, 모델 훈련, 튜닝, 배포 도구 포함.
  2. Amazon Comprehend
    • 용도: 텍스트 분석 및 이해를 위한 자연어 처리(NLP) 서비스.
    • 특징: 감정, 핵심 구절, 엔티티, 언어 등의 통찰을 추출.
  3. Amazon Rekognition
    • 용도: 이미지 및 비디오 분석.
    • 특징: 객체 감지, 얼굴 인식, 이미지 내 텍스트 인식, 콘텐츠 검열.
  4. Amazon Polly
    • 용도: 텍스트를 자연스러운 음성으로 변환하는 서비스.
    • 특징: 다양한 언어와 목소리를 지원하여 텍스트를 음성으로 변환.
  5. Amazon Transcribe
    • 용도: 음성을 텍스트로 변환하는 자동 음성 인식 서비스.
    • 특징: 다양한 음성 파일의 내용을 텍스트로 변환하여 기록.
  6. Amazon Translate
    • 용도: 언어 간 텍스트 번역 서비스.
    • 특징: 실시간 언어 번역을 제공하며 다국어 콘텐츠 제작 지원.
  7. Amazon Forecast
    • 용도: 시간 시계열 데이터를 기반으로 예측 생성.
    • 특징: 데이터 패턴을 분석하여 수요 예측, 재고 관리 등에서 활용.
  8. Amazon Personalize
    • 용도: 개인화된 추천 시스템 구축.
    • 특징: 사용자 행동 데이터를 기반으로 맞춤형 콘텐츠 추천

참고 자료