본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.

https://abit.ly/lisbva

 

패스트캠퍼스 환급챌린지는 60일간 매일 공부를 하는 습관 들이는 동기부여를 위해 진행하지만

제가 이번에 28월 29화 30수에 예비군이 예정되어있어 미리 패스트캠퍼스측에 메일로 문의한 결과

예비군 가기 전 27일요일에 [28월 29화 30수] 분량을 포스팅하고

예비군 참석 관련 서류를 제출하면 예외적으로 인정해준다고 합니다ㅎㅎ

 

 

공부 시작

강의 종료

강의장

학습 인증샷

학습후기

 

 

 

유튜브 추천 아키텍처

 

이전 강의에서 추천시스템 학술 논문은 보통 성능을 중점으로 보기 때문에

실제 서비스에서 사용하기에 적합하지 않은 경우가 많다고 했다

 

유튜브 추천 아키텍처를 알아보면서 효율도 보장하고 무엇보다 Latency가 적게 추천하는 방식을 알아보자

 

 

간단한 유튜브 추천 아키텍처 구조

Candidate generation 으로 후보를 만들고

 

ranking으로 순위를 만들어 A/B 테스트를 이용한 의사 결정

여기서 다양한 Candidate 함께 사용 가능

 


원래는 item의 개수만큼 임베딩 차원이 늘어나지만

Candidate generation를 통해서 후보를 만들어 임베딩 차원을 낮춰 연산 속도를 빠르게 했다.

 

그리고 이 임베딩을 모두 softmax 연산을 하지 않고

이 중 본 영상과 아직 보지않은 영상을 나누어 일정 비율만큼 샘플링해서 softmax 연산을 해 연산을 더 줄였다.

 

즉 classifier 추론 1번 + ANN 계산만으로 Candidate generation를 가능하게 했다.

 

 


 

추가 feature

검색어 히스토리, 위치정보, 기기정보 등등

 

데이터셋 정하기

기존에는 시간 정보가 없어 랜덤하게 잘라서 traing test set을 나눴는데

시간을 기준으로 나눴다.

 


기존에는 CTR(클릭률)을 target으로 예측 후 추천했더니

낚시성 영상이 많이 추천되었다.

그래서 이를 해결하기 위해 Logistic Regression으로 유저의 예상 시청시간을 target으로 바꾸어 퀄리티를 높혔다.

 

target을 어떻게 잡는지에 따라 추천 시스템의 퀄리티가 달라진다.

상품의 조회수보다 결국 상품의 구매전환이 중요한 것 처럼

그저 CTR을 높이는 것 뿐만 아니라 유저가 내 서비스에 오래 머물게 하는게 도메인에 따라 더 중요할 수 있다.

 

서비스 초반에는 후킹을 위한 CTR을 높이고

유저수가 충분히 확보되었다면 결제전환 또는 앱 사용시간을 target으로 추천시스템을 변형해야겠다.