AI 신뢰성을 위한 새로운 논리 기반 벤치마크 | aib vote