본문 바로가기
Project

관광데이터 공모전 - Step4. 가설검증과 분석

by yj-data 2025. 7. 29.

이전글: 2025.07.29 - [Project] - 관광데이터 공모전 - Step3. 지난 수상작 학습 및 분석 시작

 

관광데이터 공모전 - Step3. 지난 수상작 학습 및 분석 시작

주제: 지역관광 활성화데이터 분석 과제: 지역 간 관광 수요 격차를 분석하고, 체류 및 소비 확대를 위한 지역별 전략 제시 1. 작년 수상작 학습(참고할 거리 찾기)대상_옹고집쌈밥_지역_관광_활

yj-data.tistory.com

yjdata_관광공모전_제출자료.pdf
0.66MB

 

3번 스텝에서 세웠던 가설들을 검증하기 위해서 국민여행조사 데이터를 기반으로 다양한 분석을 진행했다.

 

펫 가설: 폐기

- 반려동물이 있는 사람 과 아닌 사람 소비금액 혹은 체류 일자 등을 비교해 봤을 때 전혀 차이가 없었음.

- 그리고 반려동물이 있다고 대답한 사람 또 수가 매우 적었고, 그중에서도 함께 반려동물과 여행을 떠났다는 사람은 정말 적었다.

 

액티브시니어 가설 : 폐기

- 액티브 시니어를 일단 어떻게 정의할지부터 문제

- 액티브 시니어를 리서치한 결과 일단 아직도 일을 하고 있는 사람이 다수인 것으로 판명되어서 특별히 이 사람들을 대상으로 전략을 더 뽑기는 쉽지 않겠다라고 생각했음

- 오십대 이상의 사람들은 40대 이하와는 종류가 다른 여행을 즐기고 어떤 활동을 더 즐긴다, 에 대한 데이터가 있어야 되는데 이 데이터를 국민여행 조사에서 뽑아내기에는 충분한 데이터가 없었고, 그냥 검색된 정보로 시작하기에는 이 가설의 존재 여부부터 확인을 해야하는데, 그러면 너무 많은 전제를 검증하고 진행해야하는 문제가 있었다. 시간은 한정되어있기 때문이다. (내 관심사나 취직처와 큰 연관이 있는 것도 아니어서 그렇게 많은 시간은 쓰지않기로 했다)


가설 검증은 모두 실패했고 나는 다시 원점으로 돌아왔다. 그래서 다시 공모전의 주제를 돌아보기로 했다. 

주제: 지역관광 활성화데이터
분석 과제: 지역 간 관광 수요 격차를 분석하고, 체류 및 소비 확대를 위한 지역별 전략 제시

 

이 주제에 기반해서

첫째, 지역간 관광 수요 격차를 먼저 분석하기로 했고

둘째, 수요분석에 기반해서 뽑은 지역 에 대한 관광 전략을 세우기로 했다. 

뭔가 외부 주제를 가지고 이 여행조사 데이터와 접목을 시키고 싶었는데 도저히 아이디어가 떠오르지 않고 시간도 충분치 않아서 이 방식으로 진행했다.


1. 수요 격차 분석:

작년 수상작을 학습한 내용을 참고해서, 나도 수요지수라는 걸 만들기 위해 최대 최소 정규화를 사용해서 지수를 구하고 가중치를 적용 하기로 했다.

- 수요는 여러 요소를 고민했지만 검색 건수, 방문자 수, 그리고 소비금액을 기준으로 지수를 구하기로 결정했다. (데이터는 한국관광데이터랩에서 받았다)

- 17개 시도중 지역 관광에 부합하는 7개 행정구역을 선정하고, 2024년 데이터를 기준으로 각 행정구역별로 데이터를 가져왔다. 최대 최소 정규화를 각각 진행해서 각 요소에 대한 지수를 만들었다.

행정구역 명 검색건수 검색지수 방문자수 방문지수 소비금액 소비지수
강원특별자치도 34823391 1.00000 146618304 0.61147 1240866294 0.65481
충청남도 27250982 0.64936 165468408 0.84052 1153836451 0.54829
경상남도 25742545 0.57951 157232103 0.74044 1522874765 1.00000
경상북도 23477880 0.47465 178592992 1.00000 1221707301 0.63136
충청북도 17941470 0.21828 115004435 0.22733 1013558747 0.37658
전라남도 17457951 0.19590 126777920 0.37039 946257882 0.29420
전라북도 13227403 0.00000 96296204 0.00000 705900134 0.00000

 

 

- 그리고 가중치는 두어 가지 방법이 있는데, 정보 엔트로피 가중치법을 사용하기로 했다. 사실 전라북도 지수가 정말 낮고, 전라북도에 다녀온 경험도 있었어서 전라북도를 하기로 정했었기 때문에 가중치 계산은 필요 없었다. 그러나 추가공부가 되기도 하고 다른 시도를 선택을 할 때 이 가중치가 쓰일 수 있고 (순위를 정한다던가), 그리고 보고서에도 좀 더 있어 보이기 때문에 (전문용어로 개연성) 하기로 했다. ㅎㅎㅎㅎㅎㅎㅎㅎㅎ

항목 가중치
검색지수 0.38
방문지수 0.32
소비지수 0.29

 

해서 최종 계산은

지역 수요지수
강원특별자치도 0.76557
충청남도 0.67473
경상남도 0.74716
경상북도 0.68346
충청북도 0.26490
전라남도 0.27828
전북특별자치도 0.00000

이렇게 시각화를 해서 마무리하였다. 그림 완결은 folium으로 하고싶었으나, 시간 및 디자인 예쁨의 관계로 tableau로 마무리 했다.

 


2. 지역확정 후에는 지역 특성 파악

지역을 확정했으니 이제 지역 해당 지역의 특성을 파악해야 한다 그리고 3.에서는 그 특성에 기반해서 관광활성화 전략을 세울것이다. 

전라북도 방문객의 특성은 

1. 숙박 시설 선호도

2. 관광 소비 패턴

3. 방문객의 거주지

4. 인기 관광지

5. 여행객의 주요 이동수단

으로 파악했다.

 

1. 숙박 시설 선호도: 여행의 주요 목적이 가족 친지 방문이 아니라 일반 여행 비율이 70 프로가 넘음에도 여전히 숙박 유형은 가족 친지 방문이 가장 높음 (국민여행조사 분석을 해서 얻을 수 있는 데이터였지만, 근거는 타 보고서를 들어 작성했다. 시각화도 되어있고, 2024 데이터보다 확연히 차이나는 부분이 있어서 활용함)

2. 관광 소비 패턴: 주요 관광지로 유명한 강원, 제주보다 전북은 확실히 식음료 업에서 소비액이 발생한다.(타 보고서에서 인용)

3. 방문객의 거주지: 방문객 거주지 중 수도권 사람들의 비중이 높다.(일반적으로 주위 시/도에서 오는데 전북은 특이)

4. 인기 관광지: 인기 관광지가 한정되어있고, 그 수가 매우 적다.

5. 여행객의 주요 이동수단: 시/도 간 이동은 차가 95%정도 인데 반해, 지역 내에서 관광시(이동시) 도보가 20%에 육박.


3. 전략제안

전략 제안시 한가지 를 추가했다. 앞에서 확인한 지역 특성에 기반해서만 전략을 짜기에는 심심해 보여서, 그리고 근거도 좀 부족해 보여서, 전북과 특성을 공유하지만 인기 관광지인 지역의 예시를 들면 좋겠다고 생각했다. 그렇게 선택된 것이 경주!

경주는 전북의 특성을 많은 부분 공유를 하고 있다. 하지만 전통적인 관광지이기도 하고, 특히나 황리단길의 성장이 두드러져 지금은 인기 관광지로 톡톡히 자리매김하고 있다. 이에 각각의 관광활성화 전략을 제안할때, 전략을 제안한 후 경주의 사례를 들어 전략의 유효성을 검증하거나, 아이디어를 제시했다. 

 


내용은 이 정도로 진행하였고, 앞뒤 말 맞추고 형식 맞추고 주석달고 등등 하는 것도 정말 힘들었다. 앞으로는 보고서를 제시하는 곳은 하지 말아야 하나 싶은데, 이게 처음 하는 공모전이라 보통 어떤 형식으로 나오는지 몰라서 각오는 하고 있다. (공모전 해야 되는데 계속 이런 형식으로 공모전이 나온다면 보고서 써야지 뭐 어떡하겠습니까ㅠㅠ)

 

보고서 제출 후기 최종 소감 공유 그리고 좋은 동료에게 피드백을 받은 것까지 해서!! 다음 포스팅에서 작성하도록 하겠다. 아유 고생했다!!!!!!!

 

+) 아니 근데 데이터 분석이 왜 어려운지 알았다. 국민여행조사 분석을 하면서 가설을 한 10개 이상 세워서 막 분석을 진행하는데, 유효한 결과가 나오는 게 1개 가 될까 말까여서 그 부분이 정말 시간이 많이 쓰였고 골치 아팠다. 더 잘해져야지 뭐 별수있나;; 그래도 이 공모전 하면서 정말 많이 늘고 좋았다!! 증말 잘한듯 ㅎㅅㅎ 시작은 미약했고 끝도 꽤 미약하지만 그래도 시작할 때보다는 확실히 성장한 기분👏