주제 탐색
내가 평소에 관심있던 분야 위주로 탐색해보자.
1. 사람인 데이터 분석
- 가설/궁금증 :
- 데이터 분석가 직무 자체의 공고는 감소하고 있으며, 해당 직무는 마케터/기획자/데이터사이언티스트로 분산되고 있을 것이다
- (궁금증) 데이터 사이언티스트를 채용하는 회사의 규모는 얼마 정도 일까?
- (궁금증) 데이터 엔지니어, 데이터 사이언티스트 채용의 비중은 어느 정도?
- (궁금증) 개발자 채용 붐은 이제 끝난 걸까?
- 데이터 셋 :
- 사람인 채용 공고 크롤링 필요
: 채용 공고명, 회사, 복지, 연봉, 지원 자격 등
- 사람인 채용 공고 크롤링 필요
2. 흥행할 재개봉 영화 예측 / 재개봉할 가능성이 높은 영화 예측
- 가설/궁금증 :
- 최초 개봉 시 손익분기점을 1.5배 이상 넘은 영화가 재개봉할 것이다
- 개봉 후에도 SNS 언급량이 꾸준한 영화가 재개봉할 것이다
- 주연 배우의 최근 3년 이내 영화 출연작이 흥행했거나, 혹은 주연 배우의 최근 활동이 없는 영화가 재개봉할 것이다
- 데이터 셋 :
- CGV, 메가박스 등 영화관 개봉 이력 (구하기 어려울 것 같다😢)
- 네이버 뉴스에서 '재개봉' 키워드 포함된 기사 크롤링?
- 논의 후
- 영화 개봉 이력 데이터
https://www.kofic.or.kr/kofic/business/infm/introData.do - 재개봉 영화가 1년에 얼마나 되는지? 파악 필요
- 시점 예측 보다는 재개봉할 것인지 여부 정도 예측 가능할지도
- https://www.kmdb.or.kr/main
https://www.imdb.com/
- 영화 개봉 이력 데이터
'SideProject' 카테고리의 다른 글
데이터 분석 스터디_케글_20241115 (0) | 2024.11.15 |
---|