이 기사의 핵심 내용은?

영국 AI 안전 연구소(AISI)가 GPT-5.5의 복잡한 네트워크 침투 수행 능력을 확인했다. GPT-5.5는 32단계 기업 네트워크 공격 시뮬레이션에서 10회 중 2회 성공을 기록했다. 현재까지 산업 제어 시스템 공격 시뮬레이션을 완전히 완수한 AI 모델은 존재하지 않는다.

영국 AISI, GPT-5.5의 사이버 공격 성능 검증

•영국 AI 안전 연구소(AISI)가 GPT-5.5의 복잡한 네트워크 침투 수행 능력을 확인했다.
•GPT-5.5는 32단계 기업 네트워크 공격 시뮬레이션에서 10회 중 2회 성공을 기록했다.
•현재까지 산업 제어 시스템 공격 시뮬레이션을 완전히 완수한 AI 모델은 존재하지 않는다.

프론티어 AI 모델의 급격한 발전은 생산성 향상이라는 긍정적인 면과 함께 심각한 보안 우려를 낳고 있다. 영국 AI 안전 연구소(AISI)의 최근 보고서는 OpenAI의 최신 모델인 GPT-5.5가 보유한 사이버 공격 능력을 구체적으로 다루며 이러한 이중적 현실을 경고한다. 연구진은 첨단 사이버 환경을 활용해 과거 전문 인력의 영역이었던 복잡한 다단계 사이버 공격을 AI가 얼마나 수행할 수 있는지 정량화하고 있다.

이번 평가의 핵심은 기업 네트워크 탈취를 모의한 32단계 시뮬레이션 'The Last Ones'였다. 이는 단순히 코딩 능력을 테스트하는 것이 아니라, 정찰과 자격 증명 탈취, Active Directory를 넘나드는 측면 이동, 그리고 CI/CD 공급망을 공략하는 고난도 과정을 포함한다. GPT-5.5와 Anthropic의 Claude Mythos Preview가 이 시뮬레이션을 완수한 것은 AI가 단순 챗봇을 넘어 자율적인 장기 작업 계획이 가능한 에이전트로 진화했음을 의미한다.

다만 AISI는 연구를 위한 통제된 환경이었음을 분명히 했다. 실제 기업 환경에서 발생하는 실시간 방어 체계나 네트워크 모니터링, 위협 헌팅 등은 반영되지 않았기에, 모델이 실제 강력한 보안 방어 체계를 회피할 수 있는지는 여전히 미지수다. 또한 운영 기술(OT)을 표적으로 한 별도의 시뮬레이션에서는 실패를 기록했는데, 이는 현재의 대규모 언어 모델에게 전문적인 기술 영역이 여전히 높은 장벽임을 시사한다.

흥미로운 점은 모델의 성능이 컴퓨팅 자원 투자에 비례하여 확장된다는 사실이다. AISI는 아직 모델의 성능 정점을 확인하지 못했으며, AI의 추론 능력이 향상될수록 사이버 공격 역량 또한 부수적으로 증가하고 있다고 지적했다. 이는 의도된 설계라기보다 코드 작성과 다단계 추론 능력이 개선되면서 나타나는 창발적 능력에 가깝다.

이제 정책 입안자와 보안 팀의 관심은 단순한 금지에서 적응형 보안 체계로 이동하고 있다. 이러한 능력은 보안 전문가들의 레드티밍, 자동화된 침투 테스트, 취약점 대응 등 방어적 목적에도 활용될 수 있다. AISI는 정부 기관들과 협력하여 AI 기반 위협이 일상이 된 미래를 대비하고, 사이버 보안 체계의 근본적인 변화를 준비할 것을 강조하고 있다.

프론티어 AI 모델의 급격한 발전은 생산성 향상이라는 긍정적인 면과 함께 심각한 보안 우려를 낳고 있다. 영국 AI 안전 연구소(AISI)의 최근 보고서는 OpenAI의 최신 모델인 GPT-5.5가 보유한 사이버 공격 능력을 구체적으로 다루며 이러한 이중적 현실을 경고한다. 연구진은 첨단 사이버 환경을 활용해 과거 전문 인력의 영역이었던 복잡한 다단계 사이버 공격을 AI가 얼마나 수행할 수 있는지 정량화하고 있다.

이번 평가의 핵심은 기업 네트워크 탈취를 모의한 32단계 시뮬레이션 'The Last Ones'였다. 이는 단순히 코딩 능력을 테스트하는 것이 아니라, 정찰과 자격 증명 탈취, Active Directory를 넘나드는 측면 이동, 그리고 CI/CD 공급망을 공략하는 고난도 과정을 포함한다. GPT-5.5와 Anthropic의 Claude Mythos Preview가 이 시뮬레이션을 완수한 것은 AI가 단순 챗봇을 넘어 자율적인 장기 작업 계획이 가능한 에이전트로 진화했음을 의미한다.

다만 AISI는 연구를 위한 통제된 환경이었음을 분명히 했다. 실제 기업 환경에서 발생하는 실시간 방어 체계나 네트워크 모니터링, 위협 헌팅 등은 반영되지 않았기에, 모델이 실제 강력한 보안 방어 체계를 회피할 수 있는지는 여전히 미지수다. 또한 운영 기술(OT)을 표적으로 한 별도의 시뮬레이션에서는 실패를 기록했는데, 이는 현재의 대규모 언어 모델에게 전문적인 기술 영역이 여전히 높은 장벽임을 시사한다.

흥미로운 점은 모델의 성능이 컴퓨팅 자원 투자에 비례하여 확장된다는 사실이다. AISI는 아직 모델의 성능 정점을 확인하지 못했으며, AI의 추론 능력이 향상될수록 사이버 공격 역량 또한 부수적으로 증가하고 있다고 지적했다. 이는 의도된 설계라기보다 코드 작성과 다단계 추론 능력이 개선되면서 나타나는 창발적 능력에 가깝다.

이제 정책 입안자와 보안 팀의 관심은 단순한 금지에서 적응형 보안 체계로 이동하고 있다. 이러한 능력은 보안 전문가들의 레드티밍, 자동화된 침투 테스트, 취약점 대응 등 방어적 목적에도 활용될 수 있다. AISI는 정부 기관들과 협력하여 AI 기반 위협이 일상이 된 미래를 대비하고, 사이버 보안 체계의 근본적인 변화를 준비할 것을 강조하고 있다.