cs Coursera 강의 리뷰 1 - Non-Personalized and Stereotype-Based Recommenders
본문 바로가기
  • 매일 한걸음씩
  • 매일 한걸음씩
개발/Recommender System

Coursera 강의 리뷰 1 - Non-Personalized and Stereotype-Based Recommenders

by 시몬쯔 2020. 4. 23.
728x90
반응형

보통 personalized recommenders를 다루는데 예를 들어 넷플릭스 추천 시스템등...개인에게 최적화된 추천 시스템을 제공한다.

 

그런데 첫 강의로 왜 Non-personalized에 대해 다룰끼?

그 이유로 4가지를 들 수 있다.

- 새로운 users : 새로운 user에 대해 아는 정보가 없다(cold start) 그래도 추천 해주고 싶음..

- simple but beneficial : personalized보다 간단하지만 효과적임

- online communities around common displays

- Applications & media where personalization is impossible

 

"Weak Personalization" - stereotyped personalization

-> User에 대해 아는 게 별로 없을 때 zip code나 국적, 성별 등의 stereotype 을 고려해 추천함.

 

추천 시스템의 history를 따라가면 The Zagat Guide를 볼 수 있다.

맛집 정보에 대해 써놓은 웹사이트인데 미국 전역의 맛집에 대해 평가해놓았다.

food, decor and service를 0~30사이의 점수로 평가해놓음.

 

여기서 Computing the scores의 의미는 무엇인가? 무슨 기준일까?

Popularity만 따진다면 맥도날드가 1위할 것이다. 

 

Average는 항상 옳지 만은 않다.

Normalization도 해결법 중 하나가 될 수 있다.

예를 들어 A라는 사람이 4개의 식당에 각 4,4,3,5점을 주고 B라는 사람이 2,2,1,3를 주었다면 

B의 2점은 A의 4점과 비슷한 이미가 될 수 있다. A라는 사람은 관대한 성격을 가졌고 B라는 사람이 깐깐한 성격을 가졌다면 같은 식당에 다른 점수를 줄 수 있기 때문이다. 그래서 충분한 데이터를 가졌다면 Normalizing은 효과가 있을 수도 있다. 

 

이와같이 Popularity는 Non-personalized recommender에 좋은 지표가 될 수 있지만 아닐 수도 있다. 

또 예를 들어보자면 인기 음악 탑 10에서 노래를 찾아 듣는다고 하자. 이 차트는 10대 남자들이 많이 이용하여 그들 취향에 맞춰진 차트일 수도 있다. 혹은 우리나라에서 예를 들면 사재기한 음악일 수도 있다.

사용자가 누구인지 맥락을 전혀 고려하지 않고 추천한 결과이다.

 

다시 Zagat으로 돌아가보자. 초기 팬들은 이 사이트가 점점 나빠지고 있다고 주장한다.

이유는 무엇일까? 첫번째 이유는 높은 점수를 가진 mediocre(그저그런,평범한) 식당이 많기 때문이다.

두번째는 mediocre score를 가진 훌륭한 식당이 많기 때문이다.

 

-> self-selection bias때문에 이런 현상이 일어난다.

(예를 들어 작년에 간 식당이 마음에 들지 않아 이번해에 안가서 평가를 안하면 이번 해의 그 식당 score는 올라간다.)

-> 다양한 평가자들이 점점 늘어난다.

 

이러한 이유로 Personalization Recommendation이 필요하다.

 

 

 

 

728x90
반응형

댓글