넷플릭스 추천 알고리즘

안녕하세요! IT&교육봉사동아리 언제나 푸른소리입니다!

여러분은 넷플릭스를 자주 보시나요?넷플릭스에 들어가면 영화나 드라마를 추천해주는데요.이번 포스팅에서는 추천 알고리즘에 대해 알아보도록 하겠습니다.

알고리즘은 어떤 문제를 해결하기 위해 정한 절차 또는 규칙의 모음으로 포털 검색 결과를 사용자가 원하는 방향으로 제공하는 등 다양한 방면에서 활용되고 있습니다.그중에서도 일상에서 가장 익숙한 것은 추천 알고리즘입니다.권장 알고리즘이란 방대한 데이터 중에서 일정한 규칙에 따라 사용자가 좋아할 만한 콘텐츠를 추천해 사용자의 만족도를 높입니다.

권장 알고리즘이 권장하는 콘텐츠를 선택하는 방법은 크게 협업 필터링과 콘텐츠 기반 필터링으로 나뉩니다.

존재하지 않는 이미지입니다.출처 : http://blog.daehong.com/237

협업 필터링(Collaborative Filtering)은 많은 사용자로부터 얻은 기호 정보를 통해 사용자의 관심사를 자동으로 예측하게 하는 방법입니다.예를 들어, 상품을 구매하면 그 상품을 구매한 사람이 구입한 다른 상품을 추천 상품으로 표시합니다.그러나 단점으로는 기존 데이터가 없는 신규 사용자의 경우 추천이 어렵다는 점, 사용자가 많아질수록 추천에 계산 시간이 오래 걸린다는 점, 다수의 사용자가 관심을 보이는 콘텐츠가 보이는 비율이 높아지고 소외되는 콘텐츠가 생긴다는 한계를 가집니다.

콘텐츠 기반 필터링(Content-based Filtering)은 콘텐츠 정보를 기반으로 다른 콘텐츠를 추천하는 방식입니다.영화 콘텐츠의 경우라면 영화 줄거리, 등장 배우나 장르 등을 데이터화하고 상품이라면 상품 상세 정보를 분석해 추천합니다.그렇기 때문에 콘텐츠 자체를 분석하는 것이기 때문에 초기에 사용자의 행동 데이터가 적어도 추천할 수 있습니다.하지만 콘텐츠 정보를 모두 포함시키는 데 어려움이 있어 세부적으로 파악하기 어렵다는 한계가 있습니다.

그렇다면 넷플릭스 추천 알고리즘이 어떻게 우리를 관찰하고 있을까요?

넷플릭스는 협업 필터링과 콘텐츠 기반 필터링의 단점을 보완하고 통합한 앙상블 시스템(Ensemble System)을 사용합니다.

먼저 같은 영상을 본 사람이 비슷한 패턴의 행동을 보일 경우 동일한 프로파일링 그룹에 묶는 콜라보레이션 필터링을 사용합니다.예를 들어 어떤 드라마를 한 편만 보고 종영한 두 사람이 있다면 이 둘은 비슷한 패턴으로 묶입니다.이러한 아이템에는 오프닝 스킵 여부, 재시청률, 되돌리기 등 다양한 기준으로 상세한 그룹이 생성됩니다.

여기에 콘텐츠 기반 필터링 방법을 더 섞습니다.이 시점에서 넷플릭스는 대규모 인재를 활용하여 수많은 콘텐츠를 태그합니다.시대적 배경, 영상의 분위기를 묘사하는 형용사 등 다양한 태그를 이용해 콘텐츠를 단순히 ‘코미디’가 아닌 ’90년대 코미디’처럼 구체적인 속성을 부여합니다.

지금까지 추천 알고리즘에 대해 알아봤습니다.코로나로 인해 넷플릭스와 유튜브 등 온라인 스트리밍 서비스가 점점 발전하고 있어 앞으로가 더욱 기대됩니다!

이상으로 포스팅을 마치겠습니다.다음에도 더 재미있는 IT뉴스와 함께 찾아뵙겠습니다!감사합니다!

참조 : http://blog.naver.com/with_msip/221870532849http ://www.crteconomy.com/news/articleView.html?idxno=1608

error: Content is protected !!