이 기사의 핵심 내용은?

Amazon이 2026년 6월 16일, 별도의 리소스 없이 AI 안전성을 모니터링하는 InvokeGuardrailChecks API를 출시했다. 해당 API는 콘텐츠 필터, 프롬프트 공격, 개인식별정보에 대해 0에서 1.0 범위의 심각도 및 신뢰도 점수를 제공한다. 개발자는 이제 멀티 턴 에이전틱 AI 루프 전반에서 리소스 관리 없이도 요청 단위로 세밀한 안전 로직을 구현할 수 있다.

Amazon, 리소스 관리 없는 Bedrock Guardrails API 출시

•Amazon이 2026년 6월 16일, 별도의 리소스 없이 AI 안전성을 모니터링하는 InvokeGuardrailChecks API를 출시했다.
•해당 API는 콘텐츠 필터, 프롬프트 공격, 개인식별정보에 대해 0에서 1.0 범위의 심각도 및 신뢰도 점수를 제공한다.
•개발자는 이제 멀티 턴 에이전틱 AI 루프 전반에서 리소스 관리 없이도 요청 단위로 세밀한 안전 로직을 구현할 수 있다.

•Amazon이 2026년 6월 16일, 별도의 리소스 없이 AI 안전성을 모니터링하는 InvokeGuardrailChecks API를 출시했다.
•해당 API는 콘텐츠 필터, 프롬프트 공격, 개인식별정보에 대해 0에서 1.0 범위의 심각도 및 신뢰도 점수를 제공한다.
•개발자는 이제 멀티 턴 에이전틱 AI 루프 전반에서 리소스 관리 없이도 요청 단위로 세밀한 안전 로직을 구현할 수 있다.

Amazon이 2026년 6월 16일 Amazon Bedrock Guardrails를 위한 InvokeGuardrailChecks API를 공개했다. 이를 통해 개발자는 별도의 가드레일 리소스를 관리할 필요 없이 에이전틱 AI 워크플로우에 즉각적인 안전성 검사를 적용할 수 있다. 이 리소스리스 API는 수치화된 점수를 제공하여 특정 애플리케이션 요구 사항에 따라 콘텐츠 차단, 우회, 재시도, 로깅 등의 사용자 지정 로직을 구현할 수 있도록 지원한다. 특히 탐지 전용 모드로 작동하여 사용자 입력 단계의 프롬프트 인젝션이나 도구 출력 과정에서의 개인식별정보 노출 등 에이전틱 AI 루프 특유의 위험에 대해 맥락을 인식한 보안 조치를 수행한다.

기존 가드레일 구현 방식은 개별 가드레일 리소스 생성 및 수명 주기를 관리해야 했으나, 새로운 InvokeGuardrailChecks API는 요청마다 호출되는 방식을 취한다. 이는 수십 단계의 과정을 반복하는 에이전트를 관리할 때 발생하는 운영 부담을 획기적으로 줄여준다. 각 호출은 시스템, 사용자, 어시스턴트 역할을 지원하는 구조화된 메시지 스키마를 통해 안전성 평가의 맥락적 정확성을 보장한다. API는 콘텐츠 필터와 탈옥 탐지에 대해 0에서 1.0 사이의 심각도 점수를 제공하며, 개인식별정보 필터에 대해서는 신뢰도 점수를 제공하여 정밀한 임계값 설정과 개인식별정보 마스킹을 위한 위치 데이터를 지원한다.

이 API는 콘텐츠 필터, 탈옥 탐지, 개인식별정보 필터 등 세 가지 핵심 안전성 검사를 지원한다. 콘텐츠 필터는 혐오 표현, 폭력, 성적 콘텐츠, 모욕, 비행 등을 감지하며, 탈옥 탐지는 탈옥, 프롬프트 인젝션, 프롬프트 유출을 독립적으로 모니터링한다. 개인식별정보 필터는 이메일, 전화번호, 신용카드 번호를 포함한 총 31가지 유형의 민감 정보를 식별할 수 있다. 요청-응답 대칭 구조로 설계되어 개발자는 특정 검사 결과와 요청을 쉽게 매핑할 수 있으며, AWS SDK나 AWS CLI를 통해 통합 가능하다. 또한 IAM 정책을 사용하여 리전별 조건, IP 주소, 보안 주체 태그 등 다양한 제약 조건을 적용한 보안 범위 설정이 가능하다.

Amazon이 2026년 6월 16일 Amazon Bedrock Guardrails를 위한 InvokeGuardrailChecks API를 공개했다. 이를 통해 개발자는 별도의 가드레일 리소스를 관리할 필요 없이 에이전틱 AI 워크플로우에 즉각적인 안전성 검사를 적용할 수 있다. 이 리소스리스 API는 수치화된 점수를 제공하여 특정 애플리케이션 요구 사항에 따라 콘텐츠 차단, 우회, 재시도, 로깅 등의 사용자 지정 로직을 구현할 수 있도록 지원한다. 특히 탐지 전용 모드로 작동하여 사용자 입력 단계의 프롬프트 인젝션이나 도구 출력 과정에서의 개인식별정보 노출 등 에이전틱 AI 루프 특유의 위험에 대해 맥락을 인식한 보안 조치를 수행한다.

기존 가드레일 구현 방식은 개별 가드레일 리소스 생성 및 수명 주기를 관리해야 했으나, 새로운 InvokeGuardrailChecks API는 요청마다 호출되는 방식을 취한다. 이는 수십 단계의 과정을 반복하는 에이전트를 관리할 때 발생하는 운영 부담을 획기적으로 줄여준다. 각 호출은 시스템, 사용자, 어시스턴트 역할을 지원하는 구조화된 메시지 스키마를 통해 안전성 평가의 맥락적 정확성을 보장한다. API는 콘텐츠 필터와 탈옥 탐지에 대해 0에서 1.0 사이의 심각도 점수를 제공하며, 개인식별정보 필터에 대해서는 신뢰도 점수를 제공하여 정밀한 임계값 설정과 개인식별정보 마스킹을 위한 위치 데이터를 지원한다.

이 API는 콘텐츠 필터, 탈옥 탐지, 개인식별정보 필터 등 세 가지 핵심 안전성 검사를 지원한다. 콘텐츠 필터는 혐오 표현, 폭력, 성적 콘텐츠, 모욕, 비행 등을 감지하며, 탈옥 탐지는 탈옥, 프롬프트 인젝션, 프롬프트 유출을 독립적으로 모니터링한다. 개인식별정보 필터는 이메일, 전화번호, 신용카드 번호를 포함한 총 31가지 유형의 민감 정보를 식별할 수 있다. 요청-응답 대칭 구조로 설계되어 개발자는 특정 검사 결과와 요청을 쉽게 매핑할 수 있으며, AWS SDK나 AWS CLI를 통해 통합 가능하다. 또한 IAM 정책을 사용하여 리전별 조건, IP 주소, 보안 주체 태그 등 다양한 제약 조건을 적용한 보안 범위 설정이 가능하다.