추천 시스템
- 주변에서 자주 접하는 추천 시스템으로는 넷플릭스, 유튜브, 쿠팡이 존재
→ 이들은 개개인에게 맞는 특정 영상, 상품 등만 큐레이팅 - 수 만 편의 영화, 수 억 편의 영상, 수십 만 개의 상품 등
정보의 양이 폭증함에 따라 정보 소비자가 원하는 정보를 얻는데 시간과 노력이 많이 필요하므로
정보 소비자에게 원하는 정보를 쉽게 얻도록 도와주는 분야를 정보 필터링이라고 함 - 정보 필터링의 대표적인 분야로는 검색과 추천 시스템이 존재하며
그 중 추천 시스템은 정보 소비자가 원하는 정보를 찾아 소비자에게 추천하는 시스템을 말함 - 검색은 소비자가 관심사를 표현하는 검색이라는 행위를 해야함 (active)
반면 추천은 특별한 행위 없이도 정보 전달이 가능함 (passive)
추천 시스템 분류
- 시나리오에 따른 분류
- 연관된 아이템 추천
: 현재 소비되고 있는 아이템과 연관된 아이템을 추천
예) 쿠팡에서 탐사수 검색 시 상품 하단에는 연관 상품인 동원샘물 등을 추천 - 개인화 아이템 추천
: 소비중인 아이템이 없더라도, 개인의 관심사를 찾아 소비할 만한 아이템을 추천
예) 유튜브 메인화면에서 고도의 개인화된 영상 추천
- 연관된 아이템 추천
- 피드백 종류에 따른 분류
- 명시적 피드백을 사용하는 추천 시스템
: 영화 평점 / 좋아요, 싫어요와 같이 소비자가 명시적으로 자신의 선호를 표현한 데이터 - 암시적 피드백을 사용하는 추천 시스템
: 웹 페이지 접속 기록 (상품), 음악 청취 기록과 같이 소비자가 명시적으로 표현하지는 않았지만, 선호를 보여주는 피드백
- 명시적 피드백을 사용하는 추천 시스템
- 업데이트 주기에 따른 분류
- Offline 추천 시스템 (정적 추천 시스템)
: 특정 시점의 데이터를 사용해 추천 결과를 계산하는 방식 - Online 추천 시스템 (동적 추천 시스템)
: 지속적으로 사용자의 데이터를 받아 추천 결과를 업데이트 하는 방식
- Offline 추천 시스템 (정적 추천 시스템)
- 현업에서는 다양한 추천 로직이 섞인 하이브리드 추천 시스템을 많이 사용
추천 알고리즘
- Knowledge-based Filtering
: 추천하고자 하는 분야의 도메인 지식을 활용해 추천하는 방식
예) 성별/연령별로 많이 팔리는 상품들을 모아 추천에 활용 - Content-based Filtering
: 추천하려는 아이템의 콘텐츠 정보를 분석하거나, 정리된 메타 정보를 활용해 콘텐츠별로 특징 정보를 만들고 이를 활용해 추천
예) 상품 페이지 하단에 같은 카테고리에 있는 인기 상품 추천 - Collaborative Filtering
: 소비자들의 소비 이력을 사용해 소비하지 않은 새로운 아이템을 추천
예) 클릭 이력을 바탕으로 소비자가 다음으로 클릭할 만한 상품을 추천
추천 알고리즘 평가 방법
- 오프라인 평가
: 사용자의 아이템에 대한 선호 기록과 추천 시스템이 추천한 결과를 비교하여 추천 품질을 평가
- 별다른 비용 지출 없이 수집된 데이터만 이용하여 평가 가능
- 여러 모델을 동시에 평가할 수 있음
- 선호 기록이 기존에 사용하고 있는 추천 모델에 영향을 받을 수 있으므로, 실제 사용자의 만족도와 평가 결과가 다를 수 있음
- 온라인 평가
: 만들어진 추천 시스템을 직접 사용자에게 노출시켜 사용자의 반응을 수집 하여 평가
- 실제 사용자의 만족도를 측정한다는 측면에서 정확한 방식
- 비용이 비싼 평가 방식 (사용자의 만족도 감소 가능성 등)
- 모델 개발 시에는 오프라인 평가, 테스트 시에는 온라인 평가로 하이브리드 사용
참고 자료
더보기
[개념부터 실습까지] 추천 시스템 입문편
'ML > 추천 시스템 입문편' 카테고리의 다른 글
[추천 시스템 입문편] Content-Based Recommendation 2 (0) | 2023.05.16 |
---|---|
[추천 시스템 입문편] Content-Based Recommendation 1 (0) | 2023.05.16 |
[추천 시스템 입문편] 아주 간단한 추천 시스템 만들기 (0) | 2023.05.12 |
[추천 시스템 입문편] Pandas 보충강의 (0) | 2023.05.12 |
[추천 시스템 입문편] 영화 데이터 읽고 기초 분석하기 (0) | 2023.05.12 |