문제 설명
실패율

슈퍼 게임 개발자 오렐리는 큰 고민에 빠졌다. 그녀가 만든 프랜즈 오천성이 대성공을 거뒀지만, 요즘 신규 사용자의 수가 급감한 것이다. 원인은 신규 사용자와 기존 사용자 사이에 스테이지 차이가 너무 큰 것이 문제였다.
이 문제를 어떻게 할까 고민 한 그녀는 동적으로 게임 시간을 늘려서 난이도를 조절하기로 했다. 역시 슈퍼 개발자라 대부분의 로직은 쉽게 구현했지만, 실패율을 구하는 부분에서 위기에 빠지고 말았다. 오렐리를 위해 실패율을 구하는 코드를 완성하라.
- 실패율은 다음과 같이 정의한다.
- 스테이지에 도달했으나 아직 클리어하지 못한 플레이어의 수 / 스테이지에 도달한 플레이어 수
전체 스테이지의 개수 N, 게임을 이용하는 사용자가 현재 멈춰있는 스테이지의 번호가 담긴 배열 stages가 매개변수로 주어질 때, 실패율이 높은 스테이지부터 내림차순으로 스테이지의 번호가 담겨있는 배열을 return 하도록 solution 함수를 완성하라.
제한사항
- 스테이지의 개수 N은 1 이상 500 이하의 자연수이다.
- stages의 길이는 1 이상 200,000 이하이다.
- stages에는 1 이상 N + 1 이하의 자연수가 담겨있다.
- 각 자연수는 사용자가 현재 도전 중인 스테이지의 번호를 나타낸다.
- 단, N + 1 은 마지막 스테이지(N 번째 스테이지) 까지 클리어 한 사용자를 나타낸다.
- 만약 실패율이 같은 스테이지가 있다면 작은 번호의 스테이지가 먼저 오도록 하면 된다.
- 스테이지에 도달한 유저가 없는 경우 해당 스테이지의 실패율은 0 으로 정의한다.
입력 값으로는 N(integer), stages(list) 가 주어집니다. stages에는 각 user들이 진행하고 있는 stage의 번호가 담겨있습니다. 예를 들어, N=3 이고 stages=[1,2,2,3] 이라면 각 stage별 게임을 진행하고 있는 user는 아래와 같이 됩니다. 총 stage는 3 단계까지 있으며, 1단계에는 1명, 2단계에는 2명, 3단계에는 1명이 있습니다.

실패율 : 스테이지에 도달했으나 아직 클리어하지 못한 플레이어의 수 / 스테이지에 도달한 플레이어 수
이 경우, 각 스테이지 별 실패율은 다음과 같습니다.
- Stage 1에 머물고 있는 user는 1명, Stage 1이상을 진행한 user는 4명이므로 fail rate = 1/4
- Stage 2에 머물고 있는 user는 2명, Stage 2이상을 진행한 user는 3명이므로 fail rate = 2/3
- Stage 3에 머물고 있는 user는 1명, Stage 3이상을 진행한 user는 1명이므로 fail rate = 1/1
- Stage 4에 머물고 있는 user는 0명, Stage 4이상을 진행한 user는 0명이므로 fail rate = 0
위 예시를 통해, fail rate를 구하기 위해 "스테이지에 도달했으나 아직 클리어하지 못한 플레이어 수" 는 stages list를 탐색하여 알 수 있으며, "스테이지에 도달한 플레이어 수" 는 전체 user에서 이전 스테이지에 머물러 있는 user의 숫자를 빼주면 됩니다.
예) Stage 2에 실패율을 구하기 위한 "스테이지에 도달한 플레이어 수" = 전체 user수 (4) - Stage 1에 머물고 있는 user 수(1) = 3
하지만, Stage 4의 경우 그 이상을 진행하는 user는 없기 때문에 실패율은 무조건 0이 됩니다. 이 경우, DivdeZero runtime error가 나지 않게 예외처리를 해주어야합니다. 예외처리문은 간단히 if문으로 처리하였지만, try and exception 구문을 사용하셔도 무관합니다.
- stages list를 정렬하여 각 stage별 진행하고 있는 user를 파악한다.
- stages 에서 요소를 하나 pop하여, 다음 요소가 다른 값이 나올 때 까지 탐색을 진행한다.(연속된 같은 요소 탐색)
- 실패율을 구한다.
위 로직을 간단히 추상화해본 코드는 아래와 같습니다.
def solution(N, stages): # 평균 17.22ms
# stages list를 정렬 후 stage를 순차 탐색
stages = sorted(stages, reverse=True)
fail_rate = [] # 실패율 리스트
# 1 부터 N stage까지 탐색
for value in range(1,N+1):
num_user = len(stages)
if num_user <= 0: # DivideZero runtime error exception
num_user = 1
v_list = []
while True:
# empty pop error exception
if len(stages)==0:
break
init = stages.pop() # pop
if init == value:
v_list.append(init)
else:
stages.append(init)
break
fail = len(v_list) / num_user # 실패율
fail_rate.append(fail)
# 실패율 list를 기반으로 높은 실패율을 기준으로 인덱스 값 정렬
fail_rate = [(i,value) for i, value in enumerate(fail_rate)]
fail_rate = [i[0]+1 for i in sorted(fail_rate, key=lambda x:x[1], reverse=True)]
return fail_rate
문제를 풀이 후, 다른 분들의 코드를 확인해보니 count 메서드, 또는 완전탐색 기법으로 각 로직을 비교해주어 "간단한 코드"를 구현하셨지만 "효율적인" 코드로 보이지는 않습니다. 코드의 실행시간을 비교해본 결과, 제가 구현한 코드의 효율성 부분에서 많게는 약 50배 정도 빠름(평균 실행시간 17.22ms vs 846.03ms)을 확인하였습니다. 이는 전체 list를 n2번 탐색하는 것이 아닌 탐색이 끝난 요소는 pop을 이용해 제거하고 중간중간 만족하는 조건에서는 break문을 통해 불필요한 탐색을 줄이는 내용이 효율성에 있어 좋은 영향을 주어 O(nlogn) 복잡도를 달성할 수 있었지 않았나 추측해봅니다.
프로그래머스에 등록된 다른 분들의 풀이법은 아래 접은 코드블록으로 첨부하겠습니다. 공부를 위해서만 참고하시기 바랍니다.
# 1번 평균 205.66ms
def solution(N, stages):
result = {}
denominator = len(stages)
for stage in range(1, N+1):
if denominator != 0:
count = stages.count(stage)
result[stage] = count / denominator
denominator -= count
else:
result[stage] = 0
return sorted(result, key=lambda x : result[x], reverse=True)
# 2번 평균 846.03ms
def solution(N, stages):
fail = {}
for i in range(1,N+1):
try:
fail_ = len([a for a in stages if a==i])/len([a for a in stages if a>=i])
except:
fail_ = 0
fail[i]=fail_
answer = sorted(fail, key=fail.get, reverse=True)
return answer
'Programmers 풀이 > [KaKao]' 카테고리의 다른 글
[Python] 프로그래머스 2021 KAKAO 코딩테스트 - 메뉴 리뉴얼 (0) | 2021.08.23 |
---|---|
[Python] 프로그래머스 2019 KAKAO 코딩테스트 - 오픈채팅방 (0) | 2021.08.22 |
[Python] 프로그래머스 2018 KAKAO 코딩테스트 - 추석 트래픽 (0) | 2021.08.09 |
[Python] 프로그래머스 2019 KAKAO 코딩테스트 - 크레인 인형뽑기 게임 (6) | 2020.12.20 |
[Python] 프로그래머스 2020 KAKAO 코딩테스트 - 문자열 압축 (0) | 2020.12.15 |