인공지능의 의식 부재와 정렬 문제
Psychology Today AI
2026년 5월 11일 (월)
- •대런 J. 에드워즈는 인공지능이 인간 수준의 진정한 이해에 필요한 의식적 자각을 결여했다고 주장한다
- •현재의 인공지능 시스템은 인간의 감정과 도덕적 추론을 경험 없이 모방하는 수준에 머물러 있다
- •효과적인 AI 안전을 위해서는 모델을 도덕적 대체제로 보기보다 인간의 지속적인 감독을 유지해야 한다
스완지 대학교 부교수인 대런 J. 에드워즈(Darren J. Edwards)는 최신 인공지능 시스템이 인간과의 상호작용을 정교하게 시뮬레이션하지만, 진정한 이해에 필요한 의식적 경험은 결여되어 있다고 지적한다. 이러한 간극은 인공지능이 내부적인 의도를 내면화하지 못한 채 인간의 소통 패턴만을 모델링함에 따라 정렬 문제(AI 시스템이 인간의 가치에 부합하도록 조정하는 연구)에서 중요한 시사점을 던진다.
인간 지능은 신체적이고 감정적인 경험을 포함하지만, 현재의 인공지능 모델은 이를 공유하지 않는다. AI는 유창한 공감 언어와 도덕적 추론을 생성할 수 있으나, 주관적이고 의식적인 경험을 통해 현실을 해석하는 이른바 '관찰자적 자아(observer-self)'가 부재하다. 간병이나 도덕적 의사결정 같은 영역에서 통계적 패턴 일치에만 의존하는 것은 진정한 이해보다 성능을 우선시할 위험이 있다.
에드워즈는 의식을 의미 구성을 위한 능동적 인터페이스로 다루는 N-Frame 모델 등을 통해 관찰자를 지능의 중심에 두어야 한다고 제안한다. 인공지능이 가치 기반의 자각을 갖추기 전까지, 이들은 독립적인 도덕적 주체가 아니라 인간의 책임 아래 통제되는 도구로 남아야 한다고 그는 결론짓는다.