Anthropic, AI 안전성 테스트 및 정렬 문제 해명 | aib vote