음성 AI 서비스의 걸림돌, WebRTC의 한계
Simon Willison
2026년 5월 10일 (일)
- •WebRTC 프로토콜은 네트워크 환경이 불안정할 때 패킷을 폐기하여 낮은 지연 시간을 우선시한다.
- •루크 컬리(Luke Curley)는 현재 브라우저의 WebRTC 구현 방식이 안정적인 LLM 프롬프팅에 적합하지 않다고 지적한다.
- •현행 표준은 오디오 패킷의 재전송을 허용하지 않아, 프롬프트 정확도보다 실시간 전송 속도를 강제로 우선하게 만든다.
본 기사는 실시간 통신 프로토콜과 현대 음성 AI 인터페이스 요구 사항 사이의 기술적 충돌을 다룬다. 음성 기술 전문가인 루크 컬리(Luke Curley)는 브라우저 기반 실시간 통신 표준인 WebRTC가 네트워크 상태가 좋지 않을 때 음성 패킷을 공격적으로 폐기함으로써 낮은 지연 시간을 유지하도록 설계되었다고 설명한다.
이러한 방식은 빠른 대화가 오가는 화상 회의에서는 음질보다 연결성을 우선하기에 적합할 수 있으나, AI 상호작용에서는 문제가 된다. 루크 컬리는 사용자들이 AI로부터 정확한 답변을 받기 위해 0.2초 정도의 추가 지연을 감수할 의향이 있음에도, 현재의 브라우저 기반 WebRTC는 실시간 전송만을 강제하도록 설계되어 있다고 비판한다. 결과적으로 패킷 손실 시 재전송이 불가능한 구조는 AI 프롬프트의 신뢰성을 떨어뜨리는 주요 요인이 된다.