NICE DNB 비재무 데이터를 활용한 중소기업 휴·폐업 예측 챌린지 회고

주제
- 나이스 디앤비에서 제공하는 데이터와 비재무 데이터를 최대한 활용해 중소기업 휴·폐업을 예측해봅니다.
주관·후원·운영
- 주관: 나이스 디앤비 & 던앤브레드스트릿
- 후원: 디캠프
- 운영: 넘블
기간
- 22. 09. 30 ~ 22. 11. 24
심사기준

깃허브 레포지토리
numble-nicednb-challenge
numble-nicednb-challenge has 3 repositories available. Follow their code on GitHub.
github.com
2달간의 여정...
처음 데이터를 제공 받았을 때의 기분을 잊을 수가 없다. 나도 팀원들도 모두 예제 데이터 위주로 공부해왔기 때문에 이런 날것의 데이터는 처음이었기 때문이다. 그때의 나는 조금 더 실무적인 데이터를 다뤄볼 수 있다는 생각으로 한껏 기대에 부푼 마음과 당혹스러움이 교차했었다. 그렇게 우리의 일정은 흘러갔다.

창의적인 비재무 변수(=외부 변수)를 찾고 그것이 휴폐업 예측에 효과적이라는 것을 입증할 방법은 무엇일까?
이에 우리 팀은 찾은 변수가 통계적으로 유의미하고 모델링에 적용했을 때 성능이 올라간다면 입증이 가능할 것이라 생각했다. 따라서 먼저 제공받은 데이터가 깔끔하게 정리되어 있어야 추후 결과에 신뢰성이 있을 것이라 생각하여 한 달 동안이나 제공받은 데이터에 대한 분석, 전처리를 진행했다.
전처리를 위해 재무 관련 법령과 세무사님께 조언을 구하며 논문도 여러 편을 읽어봤다. 그렇게 전처리한 결과물들을 정리하고 이후의 계획에 대해 작성하고 중간결과물을 제출했다. 솔직히 이 한 달이 너무 힘들었다. 하지만 중간 결과물을 검토하며 팀원들과 얘기를 나눌 때 만큼은 정말 보람찼다.
그렇게 대략 일주일이 지나고..중간 결과물에 대한 피드백이 왔다. 사전에 피드백이 6줄 정도 제공된다는 안내를 받았기에 큰 기대를 안고 있었다. 자세한 피드백을 받고 싶어 최대한 자세하게 썼을 뿐더러 우리의 추후 계획이 주최측의 입장에선 어떻게 느껴질지 너무 궁금했기 때문이다. 그러나 피드백은 우리의 기대를 충족시키지 못했다. 6줄 중에 실질적인 피드백의 내용은 거의 한 줄이었기 때문이다. 심지어 그 피드백마저 우리가 기대했던 내용이 아니었기 때문에 매우 허탈했다.
우리 팀은 그렇게 패닉에 빠졌다. "주최측이 보기엔 우리가 너무 못했나?", "너무 기초적인 내용으로 느껴졌나?" 등등 부정적인 생각만 다들 떠올렸다. 그렇게 침울한 일주일을 보냈다. 방향성이 잡히질 않아 도저히 코딩을 할 엄두가 안 나서 외부 변수에 대한 아이디어 회의라도 꾸준하게 해보자는 계획을 세웠지만 키워드 정도만 서로 공유하고 자세하게 들여다 보진 못했다.
그러고 며칠 동안 팀원 한 명이 혼자서 비재무 변수를 모색하고 우리에게 결과를 꾸준히 공유해줬다. 그때 팀원에게 정말 미안하지만 솔직히 심드렁한 채로 들었다. 깊은 생각은 하지 않은 채로 무작정 좋다는 말만 반복했었다. 그러고 있는 내 모습에 실증이나서 나도 다시 열심히 해야겠다는 의지가 불타올랐다. 그렇게 나머지 팀원 한 명도 다시 열심히하게 됐고 우리 모두 각자의 결과를 공유하며 외부 변수들을 찾아 해맸다.
마감 일주일 전, 막막해서 죽을 것 같았다. 노력 대비 결과는 더 초라해 보였다. 어떻게든 결과를 내려고 밤도 지새웠다. 그렇게 최종 보고서도 끝마치고 팀원들과 서로 고생했다는 말을 주고 받으며 1차적인 막을 내렸다. 막막하고 불안하고 초라해보이고 온갖 부정적인 생각을 다 떠올리며 시간을 보냈지만, 다시 읽어보고 팀원들과 소감을 나누니 무조건 top10 안에는 들거라 생각했다. 노력도 노력이고 결과물의 논리성도 잘보였고 결과물에 대한 요약도 잘 이루어 졌다고 생각했기 때문이다.
그렇게 top10 발표날이 다가왔고 우리는 정말 top10에 들어서 최종 결과 발표 대상 팀에 선정되었다. 그 동안 스트레스를 받았던 날들은 사라지고 뿌듯함만 남았다. 정말 좋은 팀원들을 만나 첫 대회에 이렇게 좋은 성과를 낼 수 있다니. 우리는 힘든 것도 모르고 발표 준비를 이어나갔다.
그렇게 발표 날, 우리는 세 번째 발표를 맡았다. 발표는 내가 아닌 팀원이 하게 되었는데 정말 깔끔하고 우리가 전달하고자 했던 내용들을 빠짐없이 전달해줘서 너무 고마웠다. 질의 응답은 팀 모두가 나가서 진행됐는데 나름 깔끔하게 잘 대답했다고 생각했다. 나머지 팀들의 발표를 들으면서도 솔직히 우리 팀이 top3안에 들수도 있겠다는 생각을 했다.
하지만 결과는 장려상이었다. 3등안에 들지 못했기 때문에 장려상을 입상하게 된 것이다. 그때 당시에는 정말 의문투성이었다. "심사기준에 맞춘 최적의 발표 자료라고 생각했는데 왜? 도대체 왜??"라는 생각밖에 안 들었다. 하지만 다시 곱씹어보니 안 보이던 우리 팀이 top3안에 들 수 없었던 원인들이 조금씩 보였다.
배운점
1. 발표의 청자를 고려해야한다
우리는 심사 기준의 "전체 분석 과정을 적절히 요약 정리하여 보고하였는가?"에 정말 잘맞췄다고 생각했는데, 듣는 청자를 제대로 고려하지 못했다. 온전히 우리 입장에서 적절히 요약한 것이다. 그랬기에 우리가 보기엔 정말 완벽하다고 생각했지만 심사위원 분이 "전체 분석과정이 기초에 기반하여 꼼꼼하게 이루어진 것 같아요."라는 발표 소감을 말씀해주신 것이다. 들으시는 분들이 데이터 분석 전문가였기 때문에 우리가 조금 더 생략하고 심화적인 내용으로 발표를 구성했어도 될 것 같았다. 아니 그렇게 했어야 했다. 입상한 팀들은 모두 그랬으니.
2. 창의적이라는 것에 대한 기준
우리는 무조건 새롭고 이전에는 없었던 혁신적인 것들이 창의적이라고 생각했다. 하지만 틀린 말이다.
어디로든 갈 수 있는 순간이동 문
이 아이디어는 어떤가? 기존에 없던 방법이니 창의적이지 않은가? 아니라면 왜일까? 바로 실현가능성이 떨어지기 때문이다. 지금 극단적인 예시를 들긴 했지만 어느 공모전을 나가든, 내가 어디서 창의적인 아이디어를 내야한다면 당연히 실현가능성은 검증되어야 한다. 우리 팀의 아이디어는 심사위원들 분의 입장에서 실현가능성이 떨어졌지 않을까 생각한다.
생각해보면 이미 중소기업의 휴폐업은 예측되어 기업의 신용등급에 적용되고 있었을텐데, 거기에 고도화를 위한 아이디어가 필요했던 것이 아닐까? 라는 생각이 든다. 우리는 데이터를 쉽게 수집할 수 있도록 무료로 제공되는 공공데이터 위주로 아이디어를 냈지만 이것을 받아들이는 입장에선 실제 모델에 적용이 가능할 것이라는 생각이 안 들었을 수도 있다.
따라서 창의적이라는 것에 대한 기준을 다시 잡을 수 있게 되었다.
3. 팀워크
학부 시절 조별 과제를 할 때마다 거의 혼자 도맡아서 했었다. 괜한 탓을 하는 것일지도 모르지만, 내가 느끼기엔 만나는 팀원마다 열심히 하지 않았고 나는 어떻게든 잘 끝내고 싶었기 때문에 줄곧 그래왔다. 그래서 난 누구와 함께 무엇을 하는 것에 대한 거부감이 컸다. 근데 이번 챌린지를 통해 생각이 전혀 바뀌었다. 이번에도 혼자 나갔더라면 난 절대 끝내지 못했다. 힘들 때 다시 힘을 낼 수 있도록 동기부여 해주고, 서로의 생각을 공유하며 발전해갈 수 있다는게 정말 좋았다.
솔직히 자기소개서에 있는 팀원과의 갈등 경험, 소통의 중요성에 대해 큰 생각이 없었지만 왜 단골 질문에 있는지 몸소 느꼈다. 이번 챌린지를 통해 팀원과 어떻게 하면 더 소통을 잘 할 수 있을지와 팀워크의 중요성에 대해 깨달을 수 있어 만족스럽다.
좋은 팀원들과 복잡한 데이터도 다뤄보고 실력적으로도, 마인드셋도 다시 정비할 수 있는 시간을 보낼 수 있어 좋았습니다. 다음 공모전, 프로젝트에서는 더욱 빛을 발할 수 있다는 자신감과 앞으로의 발전을 위한 다짐을 하며 글을 마치겠습니다 :)