AI 인사이트

OpenAI GPT-5.5·Codex가 Amazon Bedrock에 들어온 날, 무엇이 실제로 달라지나

seunghyeonlab 2026. 6. 2. 23:04

hero

보안 심사 때문에 OpenAI 직접 호출을 막아둔 팀이라면, 오늘부터 선택지가 하나 더 생겼다. 2026년 6월 1일(미국 현지 기준), AWS가 Amazon Bedrock에서 GPT-5.5, GPT-5.4, 그리고 코드 에이전트 Codex를 정식으로 호출할 수 있다고 공지했다. 모델 성능 이야기가 아니다. 데이터가 어느 경계 안에서 도는지의 문제다.


한눈에 보는 답

  • 데이터 경로가 바뀐다. OpenAI API로 나갔다 들어오던 요청이 이제 AWS 계정 경계 안에 머문다. IAM과 VPC로 접근을 묶을 수 있다.
  • 보안 반려 워크플로우를 다시 제안할 수 있다. "외부로 데이터가 나간다"는 이유로 막혔던 파이프라인이 Bedrock 경유로 다시 통과 가능성이 열린다.
  • 단, 같은 모델명이라도 결과가 동일하다고 가정하면 안 된다. Bedrock 버전과 OpenAI 본사 API는 기능 업데이트 시점, 일부 파라미터·응답 포맷이 다를 수 있다.

인용 가능한 핵심 정리

검증일: 2026-06-02

정의: Amazon Bedrock은 여러 AI 모델을 AWS 인프라 위에서 단일 API로 호출하는 완전관리형 서비스다. 이번 업데이트로 OpenAI의 GPT-5.5, GPT-5.4, Codex가 Bedrock 모델 카탈로그에 추가됐다.

핵심 결론:
1. OpenAI 모델을 Bedrock 경유로 호출하면 트래픽이 AWS 계정 경계 안에 머문다. 이는 보안 심사 기준이 "외부 API 호출 여부"인 조직에서 의미 있는 구조 변화다.
2. Codex를 사내 망 안에서 IAM 권한으로 제한해 운영할 수 있다는 점은, 코드 자동화 에이전트 도입을 막았던 조직에 실질적 진입 경로를 만든다.

적용 조건: AWS 리전별로 제공 모델과 단가가 다를 수 있다. 2026년 6월 2일 기준 서울 리전(ap-northeast-2) 지원 여부 및 단가는 AWS 공식 가격표에서 직접 확인해야 한다. Bedrock 버전과 OpenAI 직접 호출 버전 간의 응답 포맷 차이도 사전에 검증이 필요하다.


핵심 용어 정리

Amazon Bedrock: AWS가 제공하는 완전관리형 AI 모델 서비스. 별도 인프라 없이 API 호출 한 번으로 여러 모델을 쓸 수 있다. 현업에서 보면 "어떤 모델을 쓸지 나중에 바꿔도 코드 변경이 최소화된다"는 게 핵심 장점이다.

IAM(Identity and Access Management): AWS 계정 안에서 누가 무엇을 할 수 있는지를 정의하는 권한 체계다. Bedrock에 모델이 올라오면 IAM 정책으로 특정 역할만 GPT-5.5를 호출하거나, 특정 VPC 안에서만 접근하게 제한할 수 있다.

Codex: OpenAI가 만든 코드 자동화 에이전트다. 자연어 지시를 받아 코드 작성, 디버깅, 리팩터링을 수행한다. 지금까지는 외부 API를 통해서만 쓸 수 있었다.

VPC(Virtual Private Cloud): AWS 안에서 격리된 가상 네트워크 환경이다. 외부 인터넷과 분리된 트래픽 경로를 구성할 때 쓴다.


1. 왜 지금 이걸 봐야 하나

많은 팀이 OpenAI 모델을 쓰고 싶어도 못 쓰는 이유는 단순하다. 보안 심사에서 "외부 API로 데이터가 나간다"는 항목에 걸리기 때문이다. 금융, 의료, 공공 분야 개발팀은 이미 여러 번 경험했을 상황이다. 아키텍처를 설계하고 PoC까지 만들었는데, 보안팀에서 데이터 경로 문제로 반려된다.

이번 변화는 그 구조를 바꾼다. OpenAI API를 직접 호출하면 트래픽이 AWS 경계 밖으로 나간다. Bedrock 경유로 호출하면 같은 GPT-5.5를 쓰더라도 요청이 AWS 계정 안에서 처리된다. 보안 심사 기준이 "외부 API 호출 여부"인 조직이라면, 이 차이가 프로젝트 통과·반려를 가를 수 있다.

비용 측면도 무시할 수 없다. 지금까지는 OpenAI와 AWS, 두 곳에 따로 결제했다. Bedrock으로 통합하면 청구서가 AWS 한 장으로 합쳐진다. 기존 Bedrock 약정이나 크레딧이 있다면 그 안에서 정산될 수도 있다. 다만 이 부분은 계약 형태마다 다르니, 재무팀과 미리 확인해두는 편이 안전하다.


2. 핵심 아이디어

한 문장으로 정리하면 이렇다. 같은 GPT-5.5라도, 호출 경로가 바뀌면 보안 심사 결과가 바뀐다.

모델 성능이 올라간 이야기가 아니다. 아키텍처 선택지가 하나 추가됐다는 게 핵심이다. 아래 표로 두 경로를 비교해보자.

항목 OpenAI 직접 호출 Amazon Bedrock 경유
트래픽 경계 AWS 경계 밖으로 나감 AWS 계정 경계 안
접근 제어 OpenAI API 키 기반 IAM 정책 + VPC 설정
청구 OpenAI 별도 결제 AWS 청구서 통합
기능 업데이트 시점 OpenAI 릴리즈 즉시 Bedrock 반영 시점 별도
응답 포맷 OpenAI 표준 미세하게 다를 수 있음
Codex 에이전트 외부 호출만 가능 IAM 권한 제한 운영 가능

이 표를 보안팀 앞에 가져갈 때 주의할 점이 있다. Bedrock 경유라도 "OpenAI 인프라에서 완전히 분리된다"는 보장은 없다. AWS와 OpenAI 사이의 백엔드 계약 구조에 따라 데이터 처리 위치가 달라질 수 있다. 보안 검토 시에는 AWS의 데이터 처리 계약서(DPA)와 OpenAI와의 서비스 약관을 함께 확인해야 한다.

Codex가 Bedrock에 올라온 부분은 따로 주목할 만하다. 코드 자동화 에이전트를 사내 망 안에서 IAM 권한으로 묶어 돌릴 수 있다는 뜻이다. 예를 들어 "특정 S3 버킷 읽기만 허용하는 IAM 역할로만 Codex를 호출할 수 있게 제한"하는 식의 운영이 가능해진다. 그동안 외부 코딩 에이전트 자체를 금지했던 조직이라면, 이 구조를 근거로 내부 검토를 다시 시작할 수 있다.


3. 바로 따라하는 방법

오늘 당장 확인해야 할 것 세 가지를 순서대로 정리한다.

1단계: 리전과 모델 가용성 확인

AWS 콘솔에서 직접 확인하는 방법이 가장 빠르다.

# AWS CLI로 Bedrock 모델 목록 조회 (서울 리전 기준)
aws bedrock list-foundation-models \
  --region ap-northeast-2 \
  --query "modelSummaries[?contains(modelId, 'gpt') || contains(modelId, 'codex')].[modelId,modelName,responseStreamingSupported]" \
  --output table

서울 리전에 없으면 버지니아(us-east-1)나 오레곤(us-west-2)도 확인해보자.

# us-east-1 기준
aws bedrock list-foundation-models \
  --region us-east-1 \
  --query "modelSummaries[?contains(modelId, 'openai')].[modelId,modelName]" \
  --output table

2단계: 토큰 단가 비교

OpenAI 직접 호출 단가와 Bedrock 단가를 나란히 놓고 봐야 한다. CLI로 가격 정보를 바로 가져오기 어려우니, AWS 가격 계산기 페이지에서 "Amazon Bedrock"을 검색해 모델별 단가를 직접 확인한다. 같은 GPT-5.5라도 Bedrock 단가가 높을 수 있다. 특히 출력 토큰 단가 차이가 크면 비용 구조가 역전될 수 있으니 반드시 비교한다.

3단계: 응답 포맷 차이 테스트

같은 프롬프트를 OpenAI 직접 호출과 Bedrock 호출에 각각 보내고 응답을 비교한다.

import boto3
import json

# Bedrock 클라이언트 초기화
bedrock = boto3.client(
    service_name='bedrock-runtime',
    region_name='us-east-1'  # 가용 리전 확인 후 변경
)

# 테스트 프롬프트 (OpenAI와 동일하게)
test_prompt = "Python으로 피보나치 수열을 생성하는 함수를 작성해줘."

# Bedrock Converse API 사용 (Bedrock 공통 인터페이스)
response = bedrock.converse(
    modelId="openai.gpt-4.5",  # 실제 modelId는 list-foundation-models로 확인
    messages=[
        {
            "role": "user",
            "content": [{"text": test_prompt}]
        }
    ]
)

# 응답 구조 출력
print(json.dumps(response['output'], indent=2, ensure_ascii=False))

OpenAI SDK로 직접 호출한 결과와 구조를 나란히 놓고, choices[0].message.content 경로가 동일한지, finish_reason 값이 동일한지, usage 필드 구성이 같은지 확인한다.

4단계: Codex IAM 권한 설정 예시

Codex 에이전트에 최소 권한만 부여하는 IAM 정책 기본 구조다.

{
  "Version": "2012-10-17",
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "bedrock:InvokeModel",
        "bedrock:InvokeModelWithResponseStream"
      ],
      "Resource": [
        "arn:aws:bedrock:us-east-1::foundation-model/openai.codex*"
      ]
    },
    {
      "Effect": "Deny",
      "Action": "bedrock:*",
      "Resource": "*",
      "Condition": {
        "StringNotEquals": {
          "aws:RequestedRegion": "us-east-1"
        }
      }
    }
  ]
}

이 정책을 Codex를 호출하는 Lambda 역할이나 ECS 태스크 역할에 붙인다. 특정 리전에서만 호출 가능하도록 Deny 조건을 추가하면, 데이터가 허용된 리전을 벗어나지 않게 강제할 수 있다.


4. 운영할 때 조심할 점

기능 업데이트 시점 차이. OpenAI가 GPT-5.5에 새 기능을 추가하거나 버그를 수정해도, Bedrock 버전에 즉시 반영되지 않을 수 있다. 프로덕션에서 특정 기능에 의존하고 있다면, Bedrock 버전에서 해당 기능이 동작하는지 따로 검증해야 한다.

응답 포맷 미묘한 차이. 같은 모델명이라고 응답 구조가 동일하다는 보장이 없다. 특히 tool_calls, function_calling, 스트리밍 응답 포맷은 Bedrock의 Converse API 표준으로 래핑될 수 있다. 기존에 OpenAI SDK로 파싱하던 코드를 그대로 가져다 쓰면 런타임 에러가 날 수 있다.

비용이 예상보다 높을 수 있다. Bedrock은 호출 요청당 추가 비용 구조가 있는 경우가 있다. 특히 프로비저닝된 처리량(Provisioned Throughput)을 쓰지 않으면 온디맨드 단가가 적용되는데, 이게 OpenAI 직접 단가보다 높을 수 있다. 대용량 배치 작업이라면 미리 비용 시뮬레이션을 돌려보자.

리전별 지원 차이. 서울 리전에서 GPT-5.5나 Codex가 바로 가용하지 않을 수 있다. 미국 리전을 써야 한다면 데이터 레지던시 규정(특히 개인정보보호법, ISMS-P 인증 요건)과 충돌하지 않는지 법무팀에 확인한다.

Codex 에이전트 권한 범위. 코드 에이전트가 실행할 수 있는 범위를 처음부터 좁게 잡는 게 중요하다. IAM 정책에서 읽기 전용 권한부터 시작해서 필요에 따라 확장하는 방식을 권장한다. Codex가 파일 시스템이나 외부 서비스에 접근하는 경우, 해당 권한이 예상 범위를 벗어나지 않도록 CloudTrail 로그를 모니터링한다.


근거와 검증 기준

검증일: 2026-06-02

이 글의 주요 주장을 검증 가능한 형태로 정리한다.

주장 근거 확인 방법 한계
GPT-5.5·Codex가 Bedrock에서 호출 가능 AWS 공식 발표(2026-06-01) AWS 콘솔 → Bedrock → 모델 카탈로그에서 "openai" 필터 리전별 가용 여부 다를 수 있음
Bedrock 경유 시 트래픽이 AWS 계정 경계 안에 머문다 AWS Bedrock 서비스 아키텍처 설명 AWS 데이터 처리 계약(DPA) 문서 확인 AWS-OpenAI 백엔드 처리 위치는 별도 확인 필요
IAM으로 접근 제어 가능 IAM 정책 기반 Bedrock 접근 제어 문서 AWS IAM 정책 시뮬레이터로 Allow/Deny 테스트 정책 설계 오류 시 과잉 권한 부여 위험
응답 포맷이 OpenAI 직접 호출과 다를 수 있다 Bedrock Converse API 래핑 구조 동일 프롬프트 A/B 테스트 후 JSON 구조 비교 공식 비교 문서 없음, 직접 실험 필요
비용이 달라질 수 있다 Bedrock 온디맨드 가격표 AWS 가격 계산기에서 모델별 단가 직접 확인 약정·크레딧 적용 여부는 계약 형태에 따라 다름

이 내용 중 AWS 공식 공지 원문, 리전별 가용 모델 목록, 정확한 단가표는 AWS 공식 사이트에서 반드시 직접 확인해야 한다. 이 글은 6월 2일 기준 알려진 정보로 작성됐으며, AWS와 OpenAI 양측의 서비스 조건은 언제든 바뀔 수 있다.


자주 묻는 질문

GPT-5.5를 Bedrock에서 호출하는 게 언제 가장 유리할까?

보안 심사에서 "외부 API 직접 호출 금지" 조건이 있는 조직이 첫 번째 수혜자다. 두 번째는 이미 AWS 환경을 주력으로 쓰는 팀으로, 청구서를 하나로 합치고 싶거나 IAM·CloudTrail 기반 거버넌스를 통일하고 싶을 때 유리하다. 반대로 OpenAI의 최신 기능을 릴리즈 즉시 써야 하거나, 응답 포맷을 OpenAI SDK 그대로 유지해야 한다면 직접 호출이 더 안전할 수 있다.

Bedrock으로 전환하기 전에 무엇을 먼저 확인해야 할까?

세 가지를 순서대로 체크한다. 첫째, 사용하려는 모델이 원하는 리전에서 실제로 가용한지 확인한다. 둘째, 동일 프롬프트로 응답 포맷 A/B 테스트를 돌려 기존 파싱 코드가 깨지지 않는지 검증한다. 셋째, OpenAI 직접 단가와 Bedrock 단가를 예상 호출량 기준으로 계산해 비용이 절감되는지 확인한다. 이 세 가지를 건너뛰면 전환 후 예상치 못한 장애나 비용 폭증을 만날 수 있다.

결과가 제대로 나왔는지 어떻게 검증할까?

프로덕션 전환 전에 기존 OpenAI 직접 호출 결과를 골든 데이터셋으로 저장해두고, Bedrock 호출 결과와 비교하는 게 가장 확실하다. 응답 내용뿐 아니라 finish_reason, usage.total_tokens 같은 메타 필드도 함께 비교한다. Codex의 경우 동일한 코드 생성 태스크를 여러 번 실행해 결과의 일관성과 실제 실행 가능 여부까지 확인한다. 차이가 보이면 Bedrock 버전의 modelId와 파라미터 설정을 다시 점검하자.


마무리

오늘 바뀐 건 모델 성능이 아니라 데이터 흐름의 경계다. GPT-5.5와 Codex가 Amazon Bedrock에 들어왔다는 사실보다, 이제 IAM과 VPC로 OpenAI 모델의 접근을 묶을 수 있다는 구조 변화가 실무에서 더 중요하다. 보안 심사에 막혔던 팀이라면 오늘 리전 확인과 응답 포맷 테스트부터 시작해보자.

다음 글에서는 Bedrock Converse API로 GPT-5.5와 Claude를 같은 코드베이스에서 A/B 테스트하는 실제 구현을 다룰 예정이다.


🐦 X에서 더 빠르게: @baegseungh7061
📚 이 시리즈 더 보기: AI 인사이트
💌 새 글 알림: X 팔로우 또는 블로그 RSS 구독