AI 비교하기AI 사용하기AI 최신정보AI 커뮤니티
우리의 비전이용약관개인정보처리방침문의하기
  1. 오늘의 AI 소식
  2. DEV, Gemini 기반 시맨틱 피드 알고리즘 도입

DEV, Gemini 기반 시맨틱 피드 알고리즘 도입

DEV, Gemini 기반 시맨틱 피드 알고리즘 도입

DEV.to
2026년 5월 23일 (토)
  • •DEV가 Gemini Embeddings 2와 pgvector를 통합하여 새로운 시맨틱 피드 알고리즘을 구축했다.
  • •3,072차원 벡터를 활용해 사용자 관심사와 게시글 내용을 통합된 의미론적 공간에 매핑한다.
  • •TrendDetector 서비스가 6시간마다 고품질 게시글을 클러스터링하고 Gemini API로 커뮤니티 논의를 요약한다.
  • •DEV가 Gemini Embeddings 2와 pgvector를 통합하여 새로운 시맨틱 피드 알고리즘을 구축했다.
  • •3,072차원 벡터를 활용해 사용자 관심사와 게시글 내용을 통합된 의미론적 공간에 매핑한다.
  • •TrendDetector 서비스가 6시간마다 고품질 게시글을 클러스터링하고 Gemini API로 커뮤니티 논의를 요약한다.

개발자 커뮤니티 플랫폼 DEV가 Gemini Embeddings 2와 PostgreSQL 확장 프로그램인 pgvector를 통합하여 콘텐츠 발견 기능을 고도화한다. 새로운 시스템은 단순한 최신순이나 반응 기반 정렬에서 벗어나, 사용자의 고유한 관심사 프로필을 바탕으로 게시물을 순위 매기는 시맨틱 피드백 루프를 구현한다. 이를 위해 각 사용자별로 동적인 관심사 임베딩(interest_embedding)을 생성하고, 사용자 관심사와 게시물 내용 간의 코사인 유사도를 계산하여 통합된 의미론적 공간 내에서 적합한 콘텐츠를 추출한다. 이 방식은 작성자 팔로우나 반응 수와 같은 커뮤니티 사회적 신호와 균형을 이루며 지적 자극을 주는 게시글을 우선적으로 제공한다.

시스템의 안정성과 투명성을 위해 엔지니어링 팀은 Ai::Base 및 Ai::Embedding 클래스를 사용하는 래퍼 패턴을 도입했다. 이 아키텍처는 AiAudit 모델을 통해 모델 버전, 페이로드, 지연 시간, 토큰 사용량을 모든 벡터 생성 작업마다 자동으로 기록하여 포괄적인 감사 추적을 지원한다. Gemini Embeddings 2 모델은 콘텐츠를 3,072차원 벡터로 표현한다. 이번 업그레이드로 이미지, 영상, 오디오 분석 등 향후 확장성을 고려한 네이티브 멀티모달 지원이 가능해졌으며, 기존 피드 로직의 대대적인 수정 없이 인프라를 활용할 수 있다.

한편, 팀은 일반적인 태그로는 파악하기 어려운 미묘한 대화 흐름을 식별하기 위해 TrendDetector 서비스를 배포했다. 백그라운드 프로세스는 6시간마다 홈페이지 최소 점수보다 15점 이상 높은 고품질 게시글을 대상으로 리더 클러스터링 알고리즘을 실행한다. 게시글은 0.15의 코사인 거리 임계값을 기준으로 그룹화된다. 클러스터가 10개 게시물에 도달하면 Gemini API가 핵심 논의를 요약 및 라벨링하며, 이 결과는 UI 정렬 개선을 위해 TrendMembership 모델에 저장된다. 해당 인프라는 오픈소스 Forem 코드베이스에서 확인할 수 있다.

개발자 커뮤니티 플랫폼 DEV가 Gemini Embeddings 2와 PostgreSQL 확장 프로그램인 pgvector를 통합하여 콘텐츠 발견 기능을 고도화한다. 새로운 시스템은 단순한 최신순이나 반응 기반 정렬에서 벗어나, 사용자의 고유한 관심사 프로필을 바탕으로 게시물을 순위 매기는 시맨틱 피드백 루프를 구현한다. 이를 위해 각 사용자별로 동적인 관심사 임베딩(interest_embedding)을 생성하고, 사용자 관심사와 게시물 내용 간의 코사인 유사도를 계산하여 통합된 의미론적 공간 내에서 적합한 콘텐츠를 추출한다. 이 방식은 작성자 팔로우나 반응 수와 같은 커뮤니티 사회적 신호와 균형을 이루며 지적 자극을 주는 게시글을 우선적으로 제공한다.

시스템의 안정성과 투명성을 위해 엔지니어링 팀은 Ai::Base 및 Ai::Embedding 클래스를 사용하는 래퍼 패턴을 도입했다. 이 아키텍처는 AiAudit 모델을 통해 모델 버전, 페이로드, 지연 시간, 토큰 사용량을 모든 벡터 생성 작업마다 자동으로 기록하여 포괄적인 감사 추적을 지원한다. Gemini Embeddings 2 모델은 콘텐츠를 3,072차원 벡터로 표현한다. 이번 업그레이드로 이미지, 영상, 오디오 분석 등 향후 확장성을 고려한 네이티브 멀티모달 지원이 가능해졌으며, 기존 피드 로직의 대대적인 수정 없이 인프라를 활용할 수 있다.

한편, 팀은 일반적인 태그로는 파악하기 어려운 미묘한 대화 흐름을 식별하기 위해 TrendDetector 서비스를 배포했다. 백그라운드 프로세스는 6시간마다 홈페이지 최소 점수보다 15점 이상 높은 고품질 게시글을 대상으로 리더 클러스터링 알고리즘을 실행한다. 게시글은 0.15의 코사인 거리 임계값을 기준으로 그룹화된다. 클러스터가 10개 게시물에 도달하면 Gemini API가 핵심 논의를 요약 및 라벨링하며, 이 결과는 UI 정렬 개선을 위해 TrendMembership 모델에 저장된다. 해당 인프라는 오픈소스 Forem 코드베이스에서 확인할 수 있다.

원문 보기 (영어)·2026년 5월 22일
#gemini#postgresql#pgvector#embeddings#forem#vector search#semantic similarity