패스트캠퍼스 환급챌린지 32일차 : 30개 프로젝트로 끝내는 추천시스템 구현 초격차 패키지 강의 후기
본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.
공부 시작
강의 종료
강의장
학습 인증샷
학습후기
추천 시스템 벤치마크, 실무에서 진짜 중요한 이유
이번 강의에서는 추천 시스템의 성능을 비교하고 평가하기 위한 벤치마크 프레임워크 BARS와,
Retrieval 단계에서 자주 사용하는 Matrix Factorization(MF)과 DNN 기반 모델의 차이를 다뤘다.
좋은 추천 모델을 논의하려면 단순히 AUC, Recall 같은 지표만 보면 안 되고
그 모델이 어떤 상황에서 잘 작동하는지 어떤 조건에서 한계가 있는지를 같이 봐야 한다
BARS(Benchmarking for Advanced Recommender Systems): 실무 지향 추천 알고리즘 벤치마크 프레임워크
기존의 단순한 offline 성능 지표만으로는 부족한 실무형 평가를 위한 벤치마크 프레임워크
추천 시나리오를 다양하게 정의해서 평가한다
- 단발성 클릭 추천
- 연속된 시청 기록 기반 추천
- 대화형 추천 등
기존에는 단순히 user-item interaction만으로 평가했다면
BARS는 실제 사용 환경에서 어떤 종류의 추천이 필요한지를 기준으로 알고리즘을 테스트한다.
Retrieval 단계의 핵심: 빠르고 정확하게 후보를 뽑는 것
전체 아이템 중에서 수백만 개를 다 보지 않고,
수십~수백 개의 후보군만 빠르게 추리는 과정이다.
- Matrix Factorization (MF)
- 고전적이고 간단하지만 여전히 강력한 방식
- 유저와 아이템을 벡터로 임베딩해서 내적(dot product)으로 유사도를 계산
- 학습은 보통 SGD로 간단하게 돌릴 수 있고, 모델도 가볍다
- DNN 기반 모델
- 다양한 feature를 쓸 수 있다는 게 최대 장점
- 예를 들어 유저의 최근 행동 시퀀스, 디바이스 정보, 위치 같은 것도 넣을 수 있음
- 구조는 복잡하지만 표현력은 훨씬 강하다
이번 강의는 모델 자체보다는
추천 시스템을 어떻게 평가하고, 언제 어떤 모델을 써야 하는지에 대한 기준을 다듬는 데 도움이 됐다.
특히 Retrieval 모델을 선택할 때
- 서비스 초기인가?
- 로그가 얼마나 쌓였는가?
- 유저 피드백이 어느 정도 구조화돼 있는가?
- 추천 응답 시간이 얼마나 중요한가?
이런 걸 먼저 고려해야 한다는 걸 다시 정리할 수 있었다.
결국 중요한 건 밸런스
추천 시스템은 모델만 잘 만들어선 안 되고
- 성능
- 속도
- 피드백 구조
- 실시간 반영 가능성
이 네 가지를 함께 고려해야 한다.
Matrix Factorization은 여전히 유효한 선택지이고
DNN은 잘만 활용하면 훨씬 더 강력한 추천을 만들어줄 수 있다.
하지만 중요한 건 우리 서비스에는 어떤 모델이 지금 맞는가에 대한 판단이다.
BARS처럼 다양한 시나리오에서의 성능을 보면서
서비스 상황에 맞는 구조와 전략을 설계하는 게
현업 개발자에게는 훨씬 더 중요한 일이라고 느꼈다.