LLM 신뢰성을 위한 새로운 표준, 구조화된 출력 벤치마크 | aib vote