> 도서안내 > 새로 나온 책
R을 이용한 공공데이터 분석
정상가 28,000원
판매가격 25,200원
출판사 한나래출판사
저자 오대영
발행일 2021년 3월 1일
사이즈 B5
쪽수 384
ISBN 9788955662481 93310
수 량
  
스크랩
 
지은이 소개

오대영

가천대학교 미디어커뮤니케이션학과 교수. 저널리즘 이론, 데이터 저널리즘, 커뮤니케이션 이론, 언론과 국제사회를 강의한다. 융합전공 주임교수로서 빅데이터 분석과 활용 과목도 가르친다. 서울대학교 외교학과와 한양대학교 신문방송학과 대학원(문학 박사, 저널리즘 전공)을 졸업했다. 중앙일보에서 기자와 일본 특파원, 논설위원, 국제부장을 지냈다.
지은 책으로 《저널리즘 이론과 현장》, 《닛폰 리포트》, 《한국의 지하경제》(공저) 등이 있으며, 옮긴 책으로 《약자의 전략》, 《축의 이동》(공역), 《보수의 유언》(공역)이 있다.

책 소개
공공데이터에 특화된 풍부한 분석 사례와 예제를 담은 R 데이터 분석서

 

4.0산업 시대의 핵심 특징은 빅데이터다. 빅데이터는 새로운 정보를 제공하면서 경제적 가치인 동시에 사회적 파워가 되었다. 선진 8개국 정상들은 2013년 〈오픈 데이터 헌장(Open Data Charter)〉을 발표하고, 각국 정부의 공공데이터를 적극적으로 개방하기로 했다. 정부가 생산하는 수많은 데이터를 민간이 이용하면 정부의 투명성과 신뢰도 향상, 데이터를 활용한 부가가치 창출 등 장점이 많고, 데이터 분석은 개인과 국가에 새로운 자산이 된다는 사실을 깨달았기 때문이다. 우리나라도 2013년 〈공공데이터 제공 및 이용활성화에 관한 법〉을 제정하고 적극적으로 데이터 공개 정책을 시행하고 있다. 이제 누구나 정부가 운영하는 공공포털이나 홈페이지에서 귀중한 공공데이터를 무료로 받아서 보고서 작성, 정책 개발, 경영전략 수립, 앱 개발 등 다양한 용도로 활용할 수 있다.

그러나 이것도 공공데이터를 분석하는 능력이 있어야 가능한 일이다. 그래서 공공데이터 분석 역량은 전공에 관계없이 매우 중요한 기본 역량이 되었다. 이 책은 이런 관점에서 누구나 쉽게 공공데이터를 분석할 수 있는 기초 역량을 학습하도록 하기 위해 출간되었다. 이 책은 세 가지 특징을 갖고 있다.

 

• 첫째, 공공데이터 분석에 전문화하고, 사례를 풍부하게 제시하였다.

이 책은 누구라도 공공데이터 분석 역량을 갖추고 현업에서 활용할 수 있도록 공공데이터 분석에 전문화하고, 실제 공공데이터 분석 사례를 많이 수록하였다. 이 책의 분석 방법을 습득하면 웬만한 공공데이터 분석을 할 수 있는 역량을 습득할 수 있다. 특히 언론 및 사회 분석과 관련된 분야에서 널리 이용될 수 있다. 오늘날 탐사보도를 비롯한 언론 뉴스에서 데이터 분석은 매우 중요한 취재 방법이 되었다. 대학에서 데이터 저널리즘 학습이 한층 중요해지고 있는 것도 이 때문이다.

 

• 둘째, 통계 분석과 그래프 그리기 방법을 충실하게 기술하였다.

데이터 분석을 정확하게 잘 하기 위해서는 기본적인 통계 지식을 이해하고 있어야 한다. 그래야 집단간 평균의 차이가 없는데도, 있다고 하는 것과 같은 중대한 잘못을 범하지 않고 유의미한 데이터 분석 결과를 도출해낼 수 있다. 그래서 데이터 분석의 기본 바탕이 되는 통계 분석 방법을 독자들에게 쉽고 명확히 전달하고자 힘썼다. 아울러 대표적인 시각화 자료인 그래프 이용 방법을 충실히 기술하여 독자들이 데이터 분석의 핵심 내용을 효과적으로 전달할 수 있도록 안내하였다. 시각화 자료는 데이터 분석 결과를 짧은 시간에 효과적으로 전달할 수 있게 해주는 유용한 도구로 기사 자체가 될 정도로 중요해졌다.

 

• 셋째, 데이터 분석 초보자들도 쉽게 따라할 수 있도록 서술하였다.

이 책의 저자는 통계, 데이터 분석과는 거리가 있는 저널리즘 분야에서 오랫동안 일과 연구를 해왔다. 그러다가 빅데이터 분석의 가치에 눈뜨면서 많은 시행착오를 거치며 R 프로그램을 익히고, 데이터 분석을 저널리즘 분야에 적용하는 연구를 시작하게 되었다. 컴퓨터 언어를 접해본 적 없는 비전공자로서 새로운 언어와 코딩 문법의 세계를 이해하는 것이 결코 쉽지 않다는 점을 누구보다도 잘 알기에, 저자는 본문의 내용을 독자들이 최대한 쉽게 이해할 수 있도록 담고자 노력하였다. 실제 사례와 연습문제를 풍부히 넣은 것도 이러한 이유에서다.

 

이제 데이터 분석은 분야를 막론하고 대부분의 학문분과와 산업분야에서 과학적 의사결정을 지원하고, 변화를 모색하며, 의미 있는 가치를 창출해내는 데 꼭 필요한 과정이 되었다. 이 책을 읽는 다양한 분야의 독자들이 직접 분석을 실행하고 반복적으로 행하는 실제적 학습을 통해 데이터 분석의 가치를 경험하고 자신의 연구 분야로 확장해나갈 수 있기를 기대한다!

차례

 

1장 공공데이터 분석의 의미
1. 데이터의 힘
2. 데이터의 의미
3. 공공데이터 개방
4. 공공데이터 분석의 기초

 

2장 R과 RStudio 설치하기
1. R 설치하기
2. RStudio 설치
3. RStudio 인터페이스
4. 파일 저장하기
5. 환경설정

 

3장 데이터 구조
1. 용어의 이해
2. 데이터 구조 
    연습문제

 

4장 데이터 불러오고 저장하기
1. 내장 데이터 활용
2. 워킹 디렉터리 지정하기
3. 외부 데이터 불러오기
4. 데이터프레임을 csv 파일로 저장하기

 

5장 데이터 연산과 기본 함수
1. 데이터 연산
2. 데이터 구조를 알아보는 함수
3. 기본 통계 함수
4. 빈도분석
    연습문제

 

6장 데이터 가공
1. 데이터 전처리
2. 변수이름 바꾸기: rename( )
3. 빈도분석: count( ) 
4. 데이터세트에서 일부 열을 추출하기: select( )
    연습문제 6-1
5. 데이터세트에서 행 추출하기: slice( ), filter( ) 
    연습문제 6-2
    연습문제 6-3
6. 파생변수 만들기: mutate( )
7. 집단별 통계량 구하기: group_by(), summarise(), n()
    연습문제 6-4
8. 연속 데이터로 범주변수 만들기: mutate( ) + ifelse( )
    연습문제 6-5
9. 데이터 정렬하기: arrange( )
    연습문제 6-6
10. 데이터 결합하기
11. 알아두면 유용한 함수
     연습문제 6-7
     연습문제 6-8

 

7장 결측치, 이상치 처리
1. 결측치
2. 이상치
    연습문제

 

8장 통계 분석
1. 데이터

 

9장 그래프 그리기
1. 기본 지식
2. R 제공 그래프 함수: plot( ), barplot( ), hist( ), boxplot( )
3. ggplot 그래프
4. ggplot( ) 함수를 정교하게 그리기

 

10장 공공데이터 사례 분석

 

10-1: 서울 미세먼지 분석
1. 분석 개요
2. 분석 데이터
3. 엑셀 파일에서 데이터 구조 보기
4. 데이터 전처리
5. 데이터 분석
    연습문제 10-1


10-2: 수도권 지하철 승하차 인원 분석
1. 분석 개요
2. 분석 데이터
3. 엑셀 파일에서 데이터 구조 보기
4. 데이터 전처리
5. 데이터 분석

    연습문제 10-2


10-3: 한국인의 정신건강 분석
1. 분석 개요
2. 분석 데이터
3. 데이터 전처리
4. 데이터 분석
    연습문제 10-3


10-4: 서울의 음식점 창업 현황 분석
1. 분석 개요
2. 분석 데이터
3. 엑셀 파일에서 데이터 구조 보기
4. 데이터 전처리
5. 데이터 분석
    연습문제 10-4


10-5: 한국인의 임금 실태 분석
1. 분석 개요
2. 분석 데이터
3. R로 불러와서 분석 객체 만들기
4. 데이터 전처리
5. 분석하기
    연습문제 10-5