엑셀 뿌시기 다양한 함수 활용!
엑셀 데이터 분석 도구
엑셀의 데이터 분석 도구를 활용하여 기초 통계량을 계산할 수 있다.
엑셀 피벗 테이블
피벗 테이블은 커다란 표의 데이터를 요약하는 통계표이다. 엑셀에서 [피벗 테이블 필드]의 필드를 필터/열/행/값 중 필요한 부분에 드래그해서 만들 수 있다.
데이터 정제
결측치
결측치는 말 그대로 데이터에 값이 없는 것을 의미한다. 결측치를 처리하기 위해서는 결측치가 발생한 행, 열을 삭제, 적당한 방법으로 대체, 결측치를 예측하는 새로운 모델 활용 등 결측치를 처리하는 방법이 존재한다.
이상치
이상치는 특정 지정된 그룹에 분류되지 못하는 값으로 정상군의 상한과 하한의 범위를 벗어나 있거나 패턴에서 벗어난 수치를 말한다. 이상치가 있다고 반드시 처리하는 것은 아니며 이상치의 발생원인을 파악하고 유의미한 이상치인지를 판단해야 한다.
엑셀 VLOOKUP 함수
VLOOKUP 함수는 원래 데이터의 공통 기준열을 1열이라고 가정하고 n번째 열의 데이터를 불러오는 함수이다.
lookup_value(찾을 기준 데이터), table_array(불러올 데이터 범위), col_index_num(불러올 데이터의 열 번호), range_lookup(정확히 일치하는지 여부) 이 인수로 들어간다. 여기서 불러올 데이터의 열 번호를 MATCH함수로 대체할 수 있다. MATCH(lookup_value, lookup_array, [match_type]) 를 사용하면 된다.
엑셀 INDEX 함수
기준열 왼쪽에 위치한 데이터는 불러올 수 없다는 VLOOKUP 함수의 한계를 극복하기 위해 INDEX 함수와 MATCH 함수를 함께 사용한다. INDEX 함수는 특정 범위에서 행 번호와 열 번호로 원하는 데이터를 불러온다.
t-test 시행 단계
t-test는 통계적 검정 방법 중 하나이다. 전수조사가 현실적으로 어렵기 때문에 모수 추정을 위해 표본의 통계량을 구하고 여러 통계량의 확률 분포를 통해 모수를 추정한다. F검정에서 두 집단의 분산에 통계적으로 유의미한 차이가 있는지를 검정하고 t-test에서 두 집단의 평균에 통계적으로 유의미한 차이가 있는지를 검정한다.