문제 설명
실패율
슈퍼 게임 개발자 오렐리는 큰 고민에 빠졌다. 그녀가 만든 프랜즈 오천성이 대성공을 거뒀지만, 요즘 신규 사용자의 수가 급감한 것이다. 원인은 신규 사용자와 기존 사용자 사이에 스테이지 차이가 너무 큰 것이 문제였다.
이 문제를 어떻게 할까 고민 한 그녀는 동적으로 게임 시간을 늘려서 난이도를 조절하기로 했다. 역시 슈퍼 개발자라 대부분의 로직은 쉽게 구현했지만, 실패율을 구하는 부분에서 위기에 빠지고 말았다. 오렐리를 위해 실패율을 구하는 코드를 완성하라.
- 실패율은 다음과 같이 정의한다.
- 스테이지에 도달했으나 아직 클리어하지 못한 플레이어의 수 / 스테이지에 도달한 플레이어 수
전체 스테이지의 개수 N, 게임을 이용하는 사용자가 현재 멈춰있는 스테이지의 번호가 담긴 배열 stages가 매개변수로 주어질 때, 실패율이 높은 스테이지부터 내림차순으로 스테이지의 번호가 담겨있는 배열을 return 하도록 solution 함수를 완성하라.
제한사항
- 스테이지의 개수 N은 1 이상 500 이하의 자연수이다.
- stages의 길이는 1 이상 200,000 이하이다.
- stages에는 1 이상 N + 1 이하의 자연수가 담겨있다.
- 각 자연수는 사용자가 현재 도전 중인 스테이지의 번호를 나타낸다.
- 단, N + 1 은 마지막 스테이지(N 번째 스테이지) 까지 클리어 한 사용자를 나타낸다.
- 만약 실패율이 같은 스테이지가 있다면 작은 번호의 스테이지가 먼저 오도록 하면 된다.
- 스테이지에 도달한 유저가 없는 경우 해당 스테이지의 실패율은 0 으로 정의한다.
입력 값으로는 N(integer), stages(list) 가 주어집니다. stages에는 각 user들이 진행하고 있는 stage의 번호가 담겨있습니다. 예를 들어, N=3 이고 stages=[1,2,2,3] 이라면 각 stage별 게임을 진행하고 있는 user는 아래와 같이 됩니다. 총 stage는 3 단계까지 있으며, 1단계에는 1명, 2단계에는 2명, 3단계에는 1명이 있습니다.
실패율 : 스테이지에 도달했으나 아직 클리어하지 못한 플레이어의 수 / 스테이지에 도달한 플레이어 수
이 경우, 각 스테이지 별 실패율은 다음과 같습니다.
- Stage 1에 머물고 있는 user는 1명, Stage 1이상을 진행한 user는 4명이므로 fail rate = 1/4
- Stage 2에 머물고 있는 user는 2명, Stage 2이상을 진행한 user는 3명이므로 fail rate = 2/3
- Stage 3에 머물고 있는 user는 1명, Stage 3이상을 진행한 user는 1명이므로 fail rate = 1/1
- Stage 4에 머물고 있는 user는 0명, Stage 4이상을 진행한 user는 0명이므로 fail rate = 0
위 예시를 통해, fail rate를 구하기 위해 "스테이지에 도달했으나 아직 클리어하지 못한 플레이어 수" 는 stages list를 탐색하여 알 수 있으며, "스테이지에 도달한 플레이어 수" 는 전체 user에서 이전 스테이지에 머물러 있는 user의 숫자를 빼주면 됩니다.
예) Stage 2에 실패율을 구하기 위한 "스테이지에 도달한 플레이어 수" = 전체 user수 (4) - Stage 1에 머물고 있는 user 수(1) = 3
하지만, Stage 4의 경우 그 이상을 진행하는 user는 없기 때문에 실패율은 무조건 0이 됩니다. 이 경우, DivdeZero runtime error가 나지 않게 예외처리를 해주어야합니다. 예외처리문은 간단히 if문으로 처리하였지만, try and exception 구문을 사용하셔도 무관합니다.
- stages list를 정렬하여 각 stage별 진행하고 있는 user를 파악한다.
- stages 에서 요소를 하나 pop하여, 다음 요소가 다른 값이 나올 때 까지 탐색을 진행한다.(연속된 같은 요소 탐색)
- 실패율을 구한다.
위 로직을 간단히 추상화해본 코드는 아래와 같습니다.
def solution(N, stages): # 평균 17.22ms
# stages list를 정렬 후 stage를 순차 탐색
stages = sorted(stages, reverse=True)
fail_rate = [] # 실패율 리스트
# 1 부터 N stage까지 탐색
for value in range(1,N+1):
num_user = len(stages)
if num_user <= 0: # DivideZero runtime error exception
num_user = 1
v_list = []
while True:
# empty pop error exception
if len(stages)==0:
break
init = stages.pop() # pop
if init == value:
v_list.append(init)
else:
stages.append(init)
break
fail = len(v_list) / num_user # 실패율
fail_rate.append(fail)
# 실패율 list를 기반으로 높은 실패율을 기준으로 인덱스 값 정렬
fail_rate = [(i,value) for i, value in enumerate(fail_rate)]
fail_rate = [i[0]+1 for i in sorted(fail_rate, key=lambda x:x[1], reverse=True)]
return fail_rate
문제를 풀이 후, 다른 분들의 코드를 확인해보니 count 메서드, 또는 완전탐색 기법으로 각 로직을 비교해주어 "간단한 코드"를 구현하셨지만 "효율적인" 코드로 보이지는 않습니다. 코드의 실행시간을 비교해본 결과, 제가 구현한 코드의 효율성 부분에서 많게는 약 50배 정도 빠름(평균 실행시간 17.22ms vs 846.03ms)을 확인하였습니다. 이는 전체 list를 $n^2$번 탐색하는 것이 아닌 탐색이 끝난 요소는 pop을 이용해 제거하고 중간중간 만족하는 조건에서는 break문을 통해 불필요한 탐색을 줄이는 내용이 효율성에 있어 좋은 영향을 주어 $O(nlogn)$ 복잡도를 달성할 수 있었지 않았나 추측해봅니다.
프로그래머스에 등록된 다른 분들의 풀이법은 아래 접은 코드블록으로 첨부하겠습니다. 공부를 위해서만 참고하시기 바랍니다.
# 1번 평균 205.66ms
def solution(N, stages):
result = {}
denominator = len(stages)
for stage in range(1, N+1):
if denominator != 0:
count = stages.count(stage)
result[stage] = count / denominator
denominator -= count
else:
result[stage] = 0
return sorted(result, key=lambda x : result[x], reverse=True)
# 2번 평균 846.03ms
def solution(N, stages):
fail = {}
for i in range(1,N+1):
try:
fail_ = len([a for a in stages if a==i])/len([a for a in stages if a>=i])
except:
fail_ = 0
fail[i]=fail_
answer = sorted(fail, key=fail.get, reverse=True)
return answer
'Programmers 풀이 > [KaKao]' 카테고리의 다른 글
[Python] 프로그래머스 2021 KAKAO 코딩테스트 - 메뉴 리뉴얼 (0) | 2021.08.23 |
---|---|
[Python] 프로그래머스 2019 KAKAO 코딩테스트 - 오픈채팅방 (0) | 2021.08.22 |
[Python] 프로그래머스 2018 KAKAO 코딩테스트 - 추석 트래픽 (0) | 2021.08.09 |
[Python] 프로그래머스 2019 KAKAO 코딩테스트 - 크레인 인형뽑기 게임 (6) | 2020.12.20 |
[Python] 프로그래머스 2020 KAKAO 코딩테스트 - 문자열 압축 (0) | 2020.12.15 |