Slow is better than NOTHING

Programmers 풀이/[KaKao]

[Python] 프로그래머스 2019 KAKAO 코딩테스트 - 실패율

Jeff_Kang 2021. 8. 21. 20:18
반응형

문제 설명

실패율

슈퍼 게임 개발자 오렐리는 큰 고민에 빠졌다. 그녀가 만든 프랜즈 오천성이 대성공을 거뒀지만, 요즘 신규 사용자의 수가 급감한 것이다. 원인은 신규 사용자와 기존 사용자 사이에 스테이지 차이가 너무 큰 것이 문제였다.

이 문제를 어떻게 할까 고민 한 그녀는 동적으로 게임 시간을 늘려서 난이도를 조절하기로 했다. 역시 슈퍼 개발자라 대부분의 로직은 쉽게 구현했지만, 실패율을 구하는 부분에서 위기에 빠지고 말았다. 오렐리를 위해 실패율을 구하는 코드를 완성하라.

  • 실패율은 다음과 같이 정의한다.
    • 스테이지에 도달했으나 아직 클리어하지 못한 플레이어의 수 / 스테이지에 도달한 플레이어 수

전체 스테이지의 개수 N, 게임을 이용하는 사용자가 현재 멈춰있는 스테이지의 번호가 담긴 배열 stages가 매개변수로 주어질 때, 실패율이 높은 스테이지부터 내림차순으로 스테이지의 번호가 담겨있는 배열을 return 하도록 solution 함수를 완성하라.

제한사항

  • 스테이지의 개수 N은 1 이상 500 이하의 자연수이다.
  • stages의 길이는 1 이상 200,000 이하이다.
  • stages에는 1 이상 N + 1 이하의 자연수가 담겨있다.
    • 각 자연수는 사용자가 현재 도전 중인 스테이지의 번호를 나타낸다.
    • 단, N + 1 은 마지막 스테이지(N 번째 스테이지) 까지 클리어 한 사용자를 나타낸다.
  • 만약 실패율이 같은 스테이지가 있다면 작은 번호의 스테이지가 먼저 오도록 하면 된다.
  • 스테이지에 도달한 유저가 없는 경우 해당 스테이지의 실패율은 0 으로 정의한다.

입력 값으로는 N(integer), stages(list) 가 주어집니다. stages에는 각 user들이 진행하고 있는 stage의 번호가 담겨있습니다. 예를 들어, N=3 이고 stages=[1,2,2,3] 이라면 각 stage별 게임을 진행하고 있는 user는 아래와 같이 됩니다. 총 stage는 3 단계까지 있으며, 1단계에는 1명, 2단계에는 2명, 3단계에는 1명이 있습니다.

N=4, stages=[1,2,2,3]

실패율 : 스테이지에 도달했으나 아직 클리어하지 못한 플레이어의 수 / 스테이지에 도달한 플레이어 수​

이 경우, 각 스테이지 별 실패율은 다음과 같습니다.

  • Stage 1에 머물고 있는 user는 1명, Stage 1이상을 진행한 user는 4명이므로 fail rate = 1/4
  • Stage 2에 머물고 있는 user는 2명, Stage 2이상을 진행한 user는 3명이므로 fail rate = 2/3
  • Stage 3에 머물고 있는 user는 1명, Stage 3이상을 진행한 user는 1명이므로 fail rate = 1/1
  • Stage 4에 머물고 있는 user는 0명, Stage 4이상을 진행한 user는 0명이므로 fail rate = 0

위 예시를 통해, fail rate를 구하기 위해 "스테이지에 도달했으나 아직 클리어하지 못한 플레이어 수" 는 stages list를 탐색하여 알 수 있으며, "스테이지에 도달한 플레이어 수" 는 전체 user에서 이전 스테이지에 머물러 있는 user의 숫자를 빼주면 됩니다.

예) Stage 2에 실패율을 구하기 위한 "스테이지에 도달한 플레이어 수" = 전체 user수 (4) - Stage 1에 머물고 있는 user 수(1) = 3

하지만, Stage 4의 경우 그 이상을 진행하는 user는 없기 때문에 실패율은 무조건 0이 됩니다. 이 경우, DivdeZero runtime error가 나지 않게 예외처리를 해주어야합니다. 예외처리문은 간단히 if문으로 처리하였지만, try and exception 구문을 사용하셔도 무관합니다.

  1. stages list를 정렬하여 각 stage별 진행하고 있는 user를 파악한다.
  2. stages 에서 요소를 하나 pop하여, 다음 요소가 다른 값이 나올 때 까지 탐색을 진행한다.(연속된 같은 요소 탐색)
  3. 실패율을 구한다.

위 로직을 간단히 추상화해본 코드는 아래와 같습니다.

def solution(N, stages): # 평균 17.22ms
    # stages list를 정렬 후 stage를 순차 탐색
    stages = sorted(stages, reverse=True)
    fail_rate = [] # 실패율 리스트
    
    # 1 부터 N stage까지 탐색
    for value in range(1,N+1):
        num_user = len(stages) 
        if num_user <= 0: # DivideZero runtime error exception
            num_user = 1
        v_list = []
        
        while True:
            # empty pop error exception 
            if len(stages)==0:
                break
            init = stages.pop() # pop
            if init == value:
                v_list.append(init)
            else:
                stages.append(init)
                break     
        fail = len(v_list) / num_user # 실패율
        fail_rate.append(fail)
    # 실패율 list를 기반으로 높은 실패율을 기준으로 인덱스 값 정렬
    fail_rate = [(i,value) for i, value in enumerate(fail_rate)]
    fail_rate = [i[0]+1 for i in sorted(fail_rate, key=lambda x:x[1], reverse=True)]
    return fail_rate

문제를 풀이 후, 다른 분들의 코드를 확인해보니 count 메서드, 또는 완전탐색 기법으로 각 로직을 비교해주어 "간단한 코드"를 구현하셨지만 "효율적인" 코드로 보이지는 않습니다. 코드의 실행시간을 비교해본 결과, 제가 구현한 코드의 효율성 부분에서 많게는 약 50배 정도 빠름(평균 실행시간 17.22ms vs 846.03ms)을 확인하였습니다. 이는 전체 list를 $n^2$번 탐색하는 것이 아닌 탐색이 끝난 요소는 pop을 이용해 제거하고 중간중간 만족하는 조건에서는 break문을 통해 불필요한 탐색을 줄이는 내용이 효율성에 있어 좋은 영향을 주어 $O(nlogn)$ 복잡도를 달성할 수 있었지 않았나 추측해봅니다.

프로그래머스에 등록된 다른 분들의 풀이법은 아래 접은 코드블록으로 첨부하겠습니다. 공부를 위해서만 참고하시기 바랍니다.

더보기
# 1번 평균 205.66ms
def solution(N, stages):
    result = {}
    denominator = len(stages)
    for stage in range(1, N+1):
        if denominator != 0:
            count = stages.count(stage)
            result[stage] = count / denominator
            denominator -= count
        else:
            result[stage] = 0
    return sorted(result, key=lambda x : result[x], reverse=True)
    
 # 2번 평균 846.03ms
 def solution(N, stages):
    fail = {}
    for i in range(1,N+1):
        try:
            fail_ = len([a for a in stages if a==i])/len([a for a in stages if a>=i])
        except:
            fail_ = 0
        fail[i]=fail_
    answer = sorted(fail, key=fail.get, reverse=True)
    return answer

 

반응형