AI 비교하기AI 교차검증AI 최신정보AI 커뮤니티
우리의 비전이용약관개인정보처리방침FAQ문의하기

Pulse AI, 벤치마크 데이터 조작 의혹 적발

Pulse AI, 벤치마크 데이터 조작 의혹 적발

DEV.to
2026년 6월 26일 (금)
  • •감사원 마크 존슨이 Pulse AI의 1,247개 벤치마크 데이터셋 중 98개의 조작 및 도용 사례를 적발했다.
  • •Pulse AI의 CTO 토레스(Torres)는 시리즈 C 투자 유치를 위한 목표치를 달성하고자 공개 데이터베이스를 활용했음을 시인했다.
  • •감사 결과, Pulse AI의 파이프라인 아키텍처와 명명 규칙이 존슨의 이전 직장 시스템을 그대로 복제한 것으로 드러났다.
  • •감사원 마크 존슨이 Pulse AI의 1,247개 벤치마크 데이터셋 중 98개의 조작 및 도용 사례를 적발했다.
  • •Pulse AI의 CTO 토레스(Torres)는 시리즈 C 투자 유치를 위한 목표치를 달성하고자 공개 데이터베이스를 활용했음을 시인했다.
  • •감사 결과, Pulse AI의 파이프라인 아키텍처와 명명 규칙이 존슨의 이전 직장 시스템을 그대로 복제한 것으로 드러났다.

전 인프라 엔지니어이자 현재 감사인인 마크 존슨(Mark Johnson)은 1,800만 달러 규모의 시리즈 B 투자를 추진 중인 Pulse AI에 대한 기술적 실사(Due Diligence)를 수행했다. Pulse AI는 자사의 자동화 플랫폼이 89%의 생산 결함 탐지율을 기록했다고 주장해 왔다. 그러나 존슨은 감사 과정에서 회사가 제시한 1,247개의 결함 샘플 중 44개가 오픈소스 결함 데이터베이스와 일치하며, 54개는 수작업으로 조작된 사실을 발견했다. 조작된 98개의 샘플은 전체 데이터셋의 7.9%를 차지하며, 해당 데이터는 'Apex-Lens-Cleaner v1.0.0'이라는 도구를 통해 처리된 것으로 확인됐다.

추가 조사 결과, Pulse AI의 데이터 파이프라인 명명 규칙인 '/pulse/ingestion/{env}/{source}' 체계가 존슨의 이전 직장 아키텍처와 동일함이 드러났다. 존슨은 이 설계가 과거 동료인 케일럽(Caleb)과 연관되어 있음을 파악했으며, CTO 토레스(Torres)가 사용한 IT 자산 스티커와 작업 공간 구성 방식 또한 이전 직장의 환경과 일치한다는 점을 지적했다. 이에 대해 토레스(Torres)는 시리즈 C 투자 라운드 전 95%의 목표 벤치마크 수치를 달성하기 위해 공개 데이터베이스에서 샘플을 가져오고 일부는 자체 제작했음을 인정했다.

이번 감사로 인해 Pulse AI의 벤치마크 결과는 실제 생산 데이터가 아닌 외부 출처와 내부 조작으로 구성되었음이 밝혀졌다. 존슨은 7.9%의 결함 데이터 중복 문제를 벤처캐피털(VC) 측에 보고했다. 다만 시스템 아키텍처 복제 의혹과 관련된 추가 증거는 기밀로 유지했으며, 이는 과거 대량 해고 이후 업계에서 자취를 감춘 이전 동료와 연결된 것으로 보인다. 존슨은 전문 실사 계약을 이행함과 동시에 자신의 시스템 아키텍처 도용 경로를 추적하기 위해 이번 감사를 비공개로 진행했다.

전 인프라 엔지니어이자 현재 감사인인 마크 존슨(Mark Johnson)은 1,800만 달러 규모의 시리즈 B 투자를 추진 중인 Pulse AI에 대한 기술적 실사(Due Diligence)를 수행했다. Pulse AI는 자사의 자동화 플랫폼이 89%의 생산 결함 탐지율을 기록했다고 주장해 왔다. 그러나 존슨은 감사 과정에서 회사가 제시한 1,247개의 결함 샘플 중 44개가 오픈소스 결함 데이터베이스와 일치하며, 54개는 수작업으로 조작된 사실을 발견했다. 조작된 98개의 샘플은 전체 데이터셋의 7.9%를 차지하며, 해당 데이터는 'Apex-Lens-Cleaner v1.0.0'이라는 도구를 통해 처리된 것으로 확인됐다.

추가 조사 결과, Pulse AI의 데이터 파이프라인 명명 규칙인 '/pulse/ingestion/{env}/{source}' 체계가 존슨의 이전 직장 아키텍처와 동일함이 드러났다. 존슨은 이 설계가 과거 동료인 케일럽(Caleb)과 연관되어 있음을 파악했으며, CTO 토레스(Torres)가 사용한 IT 자산 스티커와 작업 공간 구성 방식 또한 이전 직장의 환경과 일치한다는 점을 지적했다. 이에 대해 토레스(Torres)는 시리즈 C 투자 라운드 전 95%의 목표 벤치마크 수치를 달성하기 위해 공개 데이터베이스에서 샘플을 가져오고 일부는 자체 제작했음을 인정했다.

이번 감사로 인해 Pulse AI의 벤치마크 결과는 실제 생산 데이터가 아닌 외부 출처와 내부 조작으로 구성되었음이 밝혀졌다. 존슨은 7.9%의 결함 데이터 중복 문제를 벤처캐피털(VC) 측에 보고했다. 다만 시스템 아키텍처 복제 의혹과 관련된 추가 증거는 기밀로 유지했으며, 이는 과거 대량 해고 이후 업계에서 자취를 감춘 이전 동료와 연결된 것으로 보인다. 존슨은 전문 실사 계약을 이행함과 동시에 자신의 시스템 아키텍처 도용 경로를 추적하기 위해 이번 감사를 비공개로 진행했다.

원문 보기 (영어)·2026년 6월 24일
#pulse ai#audit#benchmark#data pipeline#technical due diligence