Algorithm/문제 풀이

[Programmers] 2018 카카오 3차 파일명 정렬

JJongyn 2023. 12. 23. 02:26

문제


 

세 차례의 코딩 테스트와 두 차례의 면접이라는 기나긴 블라인드 공채를 무사히 통과해 카카오에 입사한 무지는 파일 저장소 서버 관리를 맡게 되었다. 저장소 서버에는 프로그램의 과거 버전을 모두 담고 있어, 이름 순으로 정렬된 파일 목록은 보기가 불편했다. 파일을 이름 순으로 정렬하면 나중에 만들어진 ver-10.zip이 ver-9.zip보다 먼저 표시되기 때문이다. 버전 번호 외에도 숫자가 포함된 파일 목록은 여러 면에서 관리하기 불편했다. 예컨대 파일 목록이 ["img12.png", "img10.png", "img2.png", "img1.png"] 일 경우, 일반적인 정렬은 ["img1.png", "img10.png", "img12.png", "img2.png"] 순이 되지만, 숫자 순으로 정 된 ["img1.png", "img2.png", "img10.png", img12.png"] 순이 훨씬 자연스럽다. 무지는 단순한 문자 코드 순이 아닌, 파일명에 포함된 숫자를 반영한 정렬 기능을 저장소 관리 프로그램에 구현하기로 했다. 소스 파일 저장소에 저장된 파일명은 100 글자 이내로, 영문 대소문자, 숫자, 공백(" "), 마침표("."), 빼기 부호("-")만으로 이루어져 있다. 파일명은 영문자로 시작하며, 숫자를 하나 이상 포함하고 있다. 파일명은 크게 HEAD, NUMBER, TAIL의 세 부분으로 구성된다. HEAD는 숫자가 아닌 문자로 이루어져 있으며, 최소한 한 글자 이상이다. NUMBER는 한 글자에서 최대 다섯 글자 사이의 연속된 숫자로 이루어져 있으며, 앞쪽에 0이 올 수 있다. 0부터 99999 사이의 숫자로, 00000이나 0101 등도 가능하다. TAIL은 그 나머지 부분으로, 여기에는 숫자가 다시 나타날 수도 있으며, 아무 글자도 없을 수 있다.

풀이


일단 이 문제는 스스로 다 해결하지는 못했고 중간에 힌트를 보고 풀었다. 코드 자체는 굉장히 단순하게 HEAD 부분을 탐색하기 위해 숫자가 나올 때 까지 탐색하고 그 이후에는 연속으로 숫자가 나오는 구간을 탐색한다. 이를 answers에 인덱스랑 같이 저장을 해준다. 인덱스를 저장하는 게 중요하다!! 그 이유는 본 문제에서 원래 입력에 주어진 순서를 유지하라고 했으니 정렬을 입력데이터에서 해줘야 하기 때문!

def solution(files):
    answers = []
    # TAIL 부분은 상관 x
    for idx, file in enumerate(files):
        file = file.lower() # 대소문자 처리
        answers.append([idx, '', '', ''])
        i = 0
        # HEAD 부분 처리
        while not file[i].isalpha:
            i += 1
        start_s = i
        while not file[i].isdigit():
            answers[-1][1] += file[i]
            i += 1
        # NUMBER 부분 처리
        while i < len(file) and file[i].isdigit():
            answers[-1][2] += file[i]
            i += 1    
        answers[-1][2] = int(answers[-1][2])
        
    answers = sorted(answers, key=lambda x:(x[1], x[2], x[0]))
    results = [files[i[0]] for i in answers]
    return results

 

여기서 예외를 생각 못했던 부분 중 하나는 나의 원래 로직은 숫자가 나오는 부분까지 탐색하는건데 들어온 입력의 맨 첫 글자가 숫자가 나오는 경우 HEAD부분을 넘어가 버린다. 그래서 맨 앞에서 Isalpha를 통해 문자열이 나오는 부분까지 이동시켜 주었고, 마지막에서는 i < len(file)을 설정을 안 했다는 점이다. 문제의 설명에서 TAIL이 없을 수도 있다는 거니깐 i < len(file)을 안 해주면 i+1 된 게 while에 들어가면서 Runtime error가 발생한다.