분류 전체보기 (5) 썸네일형 리스트형 [구글 빅쿼리 완벽 가이드] 1장. 구글 빅쿼리 새롭게 알게 된 개념 OLAP 데이터베이스 - 구글 빅쿼리는 OLAP (Online Transaction Processing) 데이터 베이스에 속한다.Ad-hoc 쿼리- 인덱스 같은 기능을 사용해 최상의 성능을 발휘하도록 미리 만들어 둔 데이터베이스에 쿼리하는 것이 아니라 필요에 따라 (성능이 조금 떨어져도) 즉석에서 작성해 실행하는 쿼리- OLAP 데이터베이스는 전체 데이터셋의 순회가 필요한 애드혹 쿼리에 적합하지 않다. 맵리듀스(Map Reduce) 패러다임- 대용량의 원시 데이터를 처리하기 위해 특수 목적의 연산을 두 단계로 추상화하여 복잡도를 낮추었음, - 두 단계 : 1) 키/값 쌍을 처리해 중간 키/값 쌍을 생성하는 map 함수, 2) 동일한 중간 키와 연관된 모든 중간 값을 병합하는 redu.. [구글 빅쿼리 완벽 가이드] 시작하며 학습기간 : 2024.12.31~학습목표 구글 빅쿼리 데이터 베이스에 대한 이해구글 빅쿼리에서 머신러닝 모델 수행 빅데이터 분석기사 스터디 - 6.1 기술통계 6.1 기술통계학습목표 : 통계학의 기초를 이해하고 표본의 특성을 파악하여 (데이터 요약 등) 데이터의 특징을 정리하는 기술 통계에 대해서 학습한다. 6.1.1 데이터 요약6.1.1.1 통계학의 이해통계학의 정의모집단(Population) : 관심 대상 전체 (예를 들면 유권자 전체)표본(Sample) : 모집단에서 추출한 부분집합관심 대상인 모집단(전체 대상)의 특성을 파악하기 위해 표본(일부 자료)를 수집한 후, 표본의 특성을 통해 모집단의 특성을 추론하는 학문표본추출(Sampling) : 모집단에서 특정 수만큼 표본을 추출하는 과정추론/추정(Inference) : 표본에서 모집단을 추론하는 과정 (ex. 추정, 가설 검정)표본오차(Sampling Error) : 모집단의 모수와 표본의 통계량의 차이.. 토이프로젝트_주제탐색_20241122 주제 탐색 내가 평소에 관심있던 분야 위주로 탐색해보자. 1. 사람인 데이터 분석가설/궁금증 :데이터 분석가 직무 자체의 공고는 감소하고 있으며, 해당 직무는 마케터/기획자/데이터사이언티스트로 분산되고 있을 것이다 (궁금증) 데이터 사이언티스트를 채용하는 회사의 규모는 얼마 정도 일까? (궁금증) 데이터 엔지니어, 데이터 사이언티스트 채용의 비중은 어느 정도?(궁금증) 개발자 채용 붐은 이제 끝난 걸까? 데이터 셋 :사람인 채용 공고 크롤링 필요 : 채용 공고명, 회사, 복지, 연봉, 지원 자격 등 2. 흥행할 재개봉 영화 예측 / 재개봉할 가능성이 높은 영화 예측 가설/궁금증 : 최초 개봉 시 손익분기점을 1.5배 이상 넘은 영화가 재개봉할 것이다 개봉 후에도 SNS 언급량이 꾸준한 영화가 재개봉할.. 데이터 분석 스터디_케글_20241115 주제 케글 스터디https://www.kaggle.com/code/janiobachmann/bank-marketing-campaign-opening-a-term-deposit Bank Marketing Campaign || Opening a Term DepositExplore and run machine learning code with Kaggle Notebooks | Using data from Bank Marketing Datasetwww.kaggle.com 숙제 confusion matrix 의 평가지표 각각 accuracy, precision, f1 score 가 중요한 케이스 외우기 DTW (Dynamic Time Wrapping)에 대해 공부하기 스터디 중 내용 imbalanced data .. 이전 1 다음