본문 바로가기

2024/12

(3)
[구글 빅쿼리 완벽 가이드] 1장. 구글 빅쿼리 새롭게 알게 된 개념 OLAP 데이터베이스 - 구글 빅쿼리는 OLAP (Online Transaction Processing) 데이터 베이스에 속한다.Ad-hoc 쿼리- 인덱스 같은 기능을 사용해 최상의 성능을 발휘하도록 미리 만들어 둔 데이터베이스에 쿼리하는 것이 아니라 필요에 따라 (성능이 조금 떨어져도) 즉석에서 작성해 실행하는 쿼리- OLAP 데이터베이스는 전체 데이터셋의 순회가 필요한 애드혹 쿼리에 적합하지 않다. 맵리듀스(Map Reduce) 패러다임- 대용량의 원시 데이터를 처리하기 위해 특수 목적의 연산을 두 단계로 추상화하여 복잡도를 낮추었음, - 두 단계 : 1) 키/값 쌍을 처리해 중간 키/값 쌍을 생성하는 map 함수, 2) 동일한 중간 키와 연관된 모든 중간 값을 병합하는 redu..
[구글 빅쿼리 완벽 가이드] 시작하며 학습기간 : 2024.12.31~학습목표 구글 빅쿼리 데이터 베이스에 대한 이해구글 빅쿼리에서 머신러닝 모델 수행
빅데이터 분석기사 스터디 - 6.1 기술통계 6.1 기술통계학습목표 : 통계학의 기초를 이해하고 표본의 특성을 파악하여 (데이터 요약 등) 데이터의 특징을 정리하는 기술 통계에 대해서 학습한다. 6.1.1 데이터 요약6.1.1.1 통계학의 이해통계학의 정의모집단(Population) : 관심 대상 전체 (예를 들면 유권자 전체)표본(Sample) : 모집단에서 추출한 부분집합관심 대상인 모집단(전체 대상)의 특성을 파악하기 위해 표본(일부 자료)를 수집한 후, 표본의 특성을 통해 모집단의 특성을 추론하는 학문표본추출(Sampling) : 모집단에서 특정 수만큼 표본을 추출하는 과정추론/추정(Inference) : 표본에서 모집단을 추론하는 과정 (ex. 추정, 가설 검정)표본오차(Sampling Error) : 모집단의 모수와 표본의 통계량의 차이..