이전글:
2025.09.14 - [Project] - 부트캠프/ sql프로젝트: #1. 데이터셋 정하기
부트캠프/ sql프로젝트: #1. 데이터셋 정하기
데이터셋 선택과정이번 프로젝트에서는 네 가지 데이터셋이 추천 데이터로 주어졌다.(원하면 다른 외부 데이터를 사용해도 됨)샌프란시스코 범죄 데이터주택 가격 데이터Olist 이커머스 데이터
yj-data.tistory.com
컨셉 선정 과정
컨셉을 선정할 때 크게 두 가지 아이디어가 나왔었다.
- 정책 중심 아이디어
- 범죄 데이터는 공공데이터 성격이라 정책이랑 자연스럽게 연결될 수밖에 없긴 한 데이터인거 같다.
- 내가 낸 아이디어: 샌프란시스코에서 30년 넘게 같은 국회의원이 선거 준비를 위해서 외부 리서치 펌(우리 조)을 고용했음. 따라서 우리는 치안 조언을 하는 등의 리서치 펌인것으로 컨셉 잡기.
- 범죄 데이터는 공공데이터 성격이라 정책이랑 자연스럽게 연결될 수밖에 없긴 한 데이터인거 같다.
- 여행자 관련 아이디어
- 데이터를 여행자 입장에서 풀어보자는 얘기도 있었다.
- 크게 두 가지로 나뉘었는데:
- 샌프란시스코를 여행하려는 사람한테 치안 관련 조언을 해주는 것
- 시간여행 콘셉트로, 과거 샌프란시스코에 간 여행자에게 지금의 우리가 해줄 수 있는 조언
개인적으로 지난번 Instacart 프로젝트가 너무 무겁고 진지했어서, 이번엔 가볍고 재미있게 가자는 생각에 나도 여행자 관련 아이디어로 갔으면 좋겠다는 생각을 했다. 그렇게 여행자 관련 으로 진행하기로 결론을 보고, 각자 EDA를 한 다음 다시 얘기하기로 했다.
EDA 과정과 주제 전환
- 여행자 쪽으로 해보자, 하고 EDA를 하는데 전체 범죄쪽으로 봤을때, 요일별 구역별 특이점이 잘 보이지 않아 인사이트를 뽑을 만한 구석을 찾는데 큰 어려움을 겪었다. 그래서 정책쪽으로 틀어야하나 싶었는데, 일단 여행자쪽으로 며칠 더 파보기로 했다.
- 결국 마땅한 인사이트가 나오지 않아서, 급하게 방향을 틀어야 했다. 그럼 여기서는 '이상치'가 보이는 데이터에 집중해서 주제를 짜보았다.
- 결론적으로 '마약 데이터'에 집중하기로 했다. 그 뒤로 잠시 마약데이터 관련하여 EDA를 진행하였다.
- 마약 데이터로는 어찌저찌 가능할 것 같아서 마약데이터로 한정해서 진행하기로 결론을 내렸다.
- 그 이후에는 한가지 문제가 남아있었는데
- '클라이언트가 제기한 문제 상황'이라는 것을 설정해야하는 것이었다. 이게 일반 회사였으면 문제가 생긴 이후에(예, 매출이 떨어졌다) 그 이유를 파헤치기위한 분석을 시작하는데, 프로젝트는 문제상황부터 기획을 해야하기 때문에 문제상황 설정이 필요했다.
- 마약 데이터로 하기로 결정한 상황에서, 문제를 설정한다면 어떤 문제가 있다고 데이터로서 증명할수 있을까? 를 한참 고민하고 검색하다가 찾은 문제상황은
- 미국 주요 도시 마약 과다복용 사망률 데이터였다.
- 현재 프로젝트 용으로 다루고 있는 데이터의 2003년에서 2015년인데, 그 기간동안 사망률이 2배가 되었더라.
- 그래서 이걸 문제상황으로 삼고 스토리를 구성했다.
- 주제 전환이 늦다 보니 이미 해둔 EDA 결과를 사이사이 넣어가며 발표흐름을 짰다. 시간도 촉박해서 완성할 수 있을지 불안했는데, 일단 전체 틀을 짜고 나니 안심이 되었었다. 개연성이 부족한 부분은 팀원분들에게 시각화 자료를 요청해가며 이틀만에 ppt를 완성했다.🎉
- 상세한 내용은 다음 포스트에 작성하겠다.😎
팀 협업 방식
이번에는 지난번과 달리 팀장이 없는 구조에서 프로젝트를 진행했다. 모든 팀원이 자유롭게 의견을 내고, 합의된 방향으로 나아가는 방식으로 한번 해보고 싶었다. 여기서 느낀점은 확실히 모두의 의견을 조율해 하나로 모으는 과정이 쉽지않다는 것이었다. 주장은 강하지만, 최종 결정을 내리는데 부담을 느낀 팀원이 있었어서, 확실히 더 어려웠던 것도 있다.
다음 프로젝트 땐 합의를 빨리 이끌어내는 게 핵심일 것 같다. 방법을 생각해 보자면
- 다음에는 이런 분이 계시더라도, 논의를 끈질지게 진행을 해서, 당장 방향을 정해놓고 진행할수 있도록 하는게 더 좋을 것 같다
- 아니면,
- 처음부터 각자 데이터 내 특이점을 찾아오기로 약속하기
- 두 팀으로 나눠서 주제 후보 두 개를 정한 뒤 병렬로 탐색하기
- 그다음 전체 회의에서 비교 후 하나를 선택 → 모두가 집중해서 진행하기
- 이런 방법을 사용하면 의견 조율에 시간 덜 쓰면서도, 폭 넓게 탐색할 수 있을 것 같다. 폭은 넓게 탐색할 수 있을 것 같다.
- 아무래도 부트캠프에서 하는 프로젝트는 전체 시간이 그렇게 길지 않아서, 토의를 오래하면 진행상황에 문제가 생길 수 있는 듯 하다. 다음 프로젝트 할 때 참고하기!
'Project' 카테고리의 다른 글
| 부트캠프/ 파이썬 프로젝트(Instacart): Step3. 인스타카트 최종파일 (0) | 2025.09.16 |
|---|---|
| 부트캠프/ sql프로젝트: #3. 프로젝트 흐름 및 기여도 정리 (0) | 2025.09.14 |
| 부트캠프/ sql프로젝트: #1. 데이터셋 정하기 (0) | 2025.09.14 |
| 부트캠프 / 개인 파이썬 프로젝트: #5. 인사이트 제시 및 결론(+최종 파일) (0) | 2025.09.08 |
| 부트캠프 / 개인 파이썬 프로젝트: #4. 머신러닝 모델 선택, 분석, 성능 비교 (0) | 2025.09.08 |