> 도서안내 > 분야별 도서
R 데이터 분석 기초에서 회귀까지
정상가 32,000원
판매가격 28,800원
출판사 한나래출판사
저자 윤지성
발행일 2020년 1월 20일
사이즈 B5
쪽수 664
ISBN 9788955662320 93310
수 량
  
스크랩
 
지은이 소개

윤지성

중앙대학교 일반대학원에서 통계학 석사 학위를 받았다. 대전대학교 경영학과 겸임교수를 지냈으며 현재 한남대학교 비즈니스통계학과 겸임교수로 재직 중이다. 통계 및 마케팅 전문 기업 ()에스에이컨설팅 공동 대표로서 데이터 분석 교육에 힘쓰고 있으며, 데이타솔루션 강의 파트너, 한국사회복지사협회 전문 보수교육(통계) 강사로도 활동 중이다.

함께 지은 책으로 속전속결 SPSS 통계분석이 있고 SPSS, R, Excel 데이터 분석과 관련해 다수의 전자책을 출판하였다(교보문고, 북큐브 등).

책 소개

세종도서 학술부문 선정 도서

R을 활용한 데이터 통계 분석, 보고서 작성의

지름길을 제시하는 가이드북!

다양한 학문과 산업 분야에서 데이터 분석의 중요성이 날로 확대되고 있는 오늘날, 분석 작업의 목표를 명확히 하고 그에 걸맞은 분석 프로그램을 선택활용하는 일은 매우 중요하다. 실무에서 데이터 분석을 필요로 하는 이들에게 통계 전공자 수준의 목표나 배움은 필요치 않다. 이 책은 데이터 통계 분석이 필요하지만 어디서부터 어떻게 시작해야 할지 모르는 이들에게 자신이 속한 분야의 데이터를 분석 목적에 맞게 다루고, 분석 결과를 문서화해 업무에 활용할 수 있도록 안내해주는 유용한 가이드북이다.

이 책은 뛰어난 접근성과 확장성을 지닌 R 프로그램을 활용한 데이터 통계 분석 방법을 체계적으로 소개한다. 특별히 파이썬(python)IDE(통합개발환경)로 널리 알려진 주피터 노트북(jupyter notebook)을 기반으로 각 분석마다 마크다운(markdown)을 사용한 표와 그래프를 활용하여 문서화하는 데 방점을 두고 있다. 아울러 심화 과정에서는 RStudio를 통해서도 문서화 작업을 해볼 수 있도록 관련 내용을 소개하고 있다.

 

주요 내용

 

도입 단계인 1부 기초 사용법 부분에서는 jupyter notebook 설치 및 사용법을 설명하고 기초통계량을 산출하는 내용을 담았다.

2부 통계분석 부분에서는 모수적 방법론을 중심으로 분석 목적과 목표를 수립하는 데 중요한 항목들을 정리하고, 실제 데이터를 분석하고 그래프와 markdown을 이용하여 결과를 표로 표현할 수 있는 방법을 기술하였다. 또한 각 분석의 끝에는 분석 결과에 대한 종합적 해석을 담았으며 사용한 패키지와 함수를 요약해 학습에 도움이 되고자 하였다.

3부 심화과정 부분에서는 R 분석 시 필요한 데이터에 대한 구조적 이해와 특징을 살펴보고 기본 패키지(base, stats )에 대한 내용을 자세히 다루었다. 아울러 인덱싱(indexing)과 조건문을 활용한 데이터 정제와 파생, 결측값과 대체, 패키지 관리와 외부데이터 불러오기/저장하기 등 데이터 분석을 위해 필요한 심화 내용까지 빠짐없이 다루고자 하였다. 또한 pythonjupyter notebookRStudio의 기능을 활용하여 다양한 문서로 변환하고 표를 작성해보는 등 실제 분석 결과를 공유하는 데 필요한 세부적인 내용들을 포함하였으며, 최근 널리 사용되고 있는 dplyr 패키지를 다루어 실전 감각을 익히고자 하였다. 덧붙여 비모수통계분석과 시각화에 필요한 색과 그래프의 기본 모양과 설정에 대해서도 자세히 설명하였다.

실전문제 부분에서는 서울시에서 2015년 실행한 사회복지실태조사 데이터를 활용하여 결과표를 요약하고 데이터 추출/파생 관련 문제를 제시하였다. 또 실제 사회과학 설문지를 제시하고 이를 일련의 과정으로 분석하도록 구성하였다.

 

이 책의 특징

 

RStudiojupyter notebook을 바탕으로 한 효율적인 문서화 작업 제시

외부 데이터 불러오기에서 이항 로지스틱 회귀분석까지 체계적인 R 통계분석 과정 제시

실전 데이터 분석에 필요한 결측값, 조건문, 반복문, dplyr 패키지 등 핵심 데이터 전처리 포함

데이터 분석을 위한 R 필수 패키지 사용법 소개

다양한 실습 사례, 코드, 실전문제 수록

 

차례

Part 1 기초 사용법

 

ch.1 사용 프로그램 소개

ch.2 프로그램 설치 

ch.3 jupyter notebook 실제 사용하기

ch.4 markdown 사용법

ch.5 설문 설계 기본 원칙

ch.6 올바른 통계분석의 해석과 적용

ch.7 데이터 코딩(입력)하기

ch.8 기술통계량

 

Part 2 통계분석

 

ch.9 요인분석

ch.10 신뢰도 분석

ch.11 카이제곱검정 (gmodels 패키지를 바탕으로)

ch.12 t검정

ch.13 일원배치분산분석

ch.14 이원배치분산분석

ch.15 공분산분석

ch.16 상관분석

ch.17 단순선형회귀분석

ch.18 다중선형회귀분석

ch.19 더미 회귀분석

ch.20 이항 로지스틱 회귀분석

 

Part 3 심화과정

 

ch.21 결측값 처리

ch.22 정규성 검정

ch.23 비모수 분석

ch.24 데이터 불러오기/저장하기

ch.25 jupyter notebook활용한 파일 변환

ch.26 R 패키지 관리

ch.27 최신 버전의 R 사용하기

ch.28 데이터에 대한 이해

ch.29 데이터의 구조

ch.30 데이터 추출

ch.31 dplyr 패키지를 이용한 데이터 조작 처리

ch.32 기본 함수를 이용한 데이터 결합

ch.33 dplyr 패키지를 이용한 데이터 결합

ch.34 apply() 함수

ch.35 함수 만들기

ch.36 색과 그래프 옵션

ch.37 RStudio 사용법

ch.38 jamovi 프로그램 소개

 

Part 4 실전문제