> 도서안내 > 새로 나온 책
R 기반 네트워크 분석: ERGM과 SIENA
정상가 30,000원
판매가격 27,000원
출판사 한나래출판사
저자 백영민
발행일 2023년 10월 20일
사이즈 B5
쪽수 520쪽
ISBN 9788955663075 93310
수 량
  
스크랩
 
지은이 소개

백영민

연세대학교 신문방송학과를 졸업하고 서울대학교 언론정보학과에서 석사학위를 받았다. 2011년 미국 펜실베이니아 대학교 아넨버그 스쿨에서 박사학위를 받았다. 한국과학기술원(KAIST) 조교수를 지내고 현재 연세대학교 언론홍보영상학부 부교수로 재직 중이다.

Journal of Communication, Communication Research, New Media & Society, Journal of Broadcasting & Electronic Media, Health Communication, PLOS ONE, American Politics Research, Political Studies, International Journal of Public Opinion Research, Nonprofit Management & Leadership, Journal of Social and Personal Relationships, Journal of Language and Social Psychology 등 언론학을 포함 다양한 학문분과 학술지에 현재까지 90편의 학술논문(2023년 6월 기준)을 출간하였다. 저술한 책으로 《R 기반 데이터 과학: 타이디버스 접근》, 《R 기반 성향점수분석: 루빈 인과모형 기반 인과추론》, 《R을 이용한 결측데이터 분석: 최대우도 및 다중투입기법을 중심으로》, 《R기반 복합설문 데이터 분석》, 《R를 이용한 텍스트 마이닝》, 《R 기반 제한적 종속변수대상 회귀모형》, 《R를 이용한 사회과학데이터 분석: 구조방정식 모형 분석》, 《방법론적 사유: 입말로 풀어쓴 사회과학 연구방법론》 등이 있으며, 번역한 책으로는 《국민의 선택: 대통령 선거캠페인 기간에 유권자는 지지후보를 어떻게 결정하는가?》, 《포퓰리즘》, 《퍼스널 인플루언스》, 《소셜미디어와 공익: 가짜뉴스 시대의 미디어 정책》 등이 있다.

책 소개

R 기반의 ERGM과 SIENA 모형을 이용하여

네트워크 데이터를 분석하고 모델링하는 과정을 안내한다!

 

‘네트워크’라는 개념은 현대인에게 매우 친숙하다. 일상적으로 접하는 소셜미디어, 수도, 전기, 인터넷, 도로망 등의 사회간접자본 시설은 물론, 국가 간 수출입, 산업생태계 등 경제구조 역시 네트워크 개념을 토대로 설계 및 운용되고 있다. 특히 최근에는 사회적 접촉 네트워크를 통해 전파되는 코로나19 바이러스를 겪으며, 감염병의 전파경로를 파악하고 예방하는 데에도 네트워크 개념이 매우 중요하다는 사실이 알려졌다. 그러나 이처럼 광범위하게 활용되는 네트워크 데이터를 분석하는 일은 생각보다 간단하지 않다. 네트워크 데이터 분석은 통상적인 데이터 분석방법과 달리 ‘관계(relation)’를 다루고 있어 전통적인 독립성 가정(independence assumption)에 부합하지 않기 때문이다. 이러한 점들이 네트워크 데이터를 분석하고 해석하는 과정을 까다롭게 만들고, 그 과정에서 당면하는 다양한 문제들 때문에 많은 연구자들이 네트워크 개념을 다루면서도 네트워크 분석이나 모델링을 외면하기도 한다. 본서는 이처럼 개념적으로 복잡하고 까다로운 네트워크 데이터 분석을 한결 수월하게 이해하고 관련 연구에 활용할 수 있도록 실질적인 도움을 주는 내용으로 구성되어 있다.

본서는 R을 이용하여 네트워크 데이터를 분석하는 방법을 소개하고, 연구가설 테스트를 위해 모형을 추정하고 해석하는 과정을 예시를 통해 설명한다. 네트워크의 특성과 개념, 학문적 배경에서부터 시작하여, 네트워크 데이터에 대한 전통적인 기술통계 분석기법들, 그리고 최근 각광받는 네트워크 모델링 기법인 ‘지수함수족 랜덤그래프 모형(ERGM, exponential random graph model)’과 ‘확률적 행위자중심 모형(SAOM, stochastic actor-oriented model)’ 중 가장 널리 사용되는 ‘시뮬레이션 기반 네트워크 분석(SIENA, simulation investigation for empirical network analysis) 모형’을 다룬다. 책의 말미에는 본서에서 다루지 못한 심화된 네트워크 분석방법을 소개하고 관련 참고문헌을 제시하여 더 깊이 있는 연구 활동에 참고할 수 있도록 하였다.

연구자들은 본서를 통해 R을 이용한 네트워크 분석을 충분히 이해하고, 이를 토대로 탐구하고자 하는 네트워크 현상을 적극적으로 탐구할 수 있는 계기가 될 것이다.

 

주요 내용

 

이 책은 다음과 같이 구성되어 있다.
• 1부에서는 ‘네트워크’의 특성과 등장 배경을 소개하고, 네트워크 데이터 분석에 필요한 기초용어와 R 패키지들을 다룬다. 또한, 본서에서 소개할 네트워크 데이터와 해당 데이터 분석을 위해 필요한 R 패키지들 및 각 패키지의 활용법을 설명한다.

• 2부에서는 네트워크 데이터를 대상으로 한 전통적인 기술통계분석 기법들을 소개한다. 먼저 통상적인 형태의 데이터와 네트워크 데이터의 차이를 예시를 통해 설명하고, 네트워크를 구성하는 노드(점, 행위자) 데이터와 링크(선, 연결, 유대) 데이터가 전체네트워크 데이터를 어떻게 구성하는지 설명한다. 이후 노드수준과 링크수준, 그래프 수준에서 계산할 수 있는 네트워크 통계치들을 알아보고, R을 이용한 네트워크 분석에서 많이 활용되는 네트워크 statnet 패키지와 igraph 패키지로 해당 네트워크 통계치들을 계산하는 방법을 실습한다. 아울러 네트워크를 시각화하는 방법과 전체네트워크를 여러 개의 하위네트워크로 나누는 기법들[파벌(cliques), 핵심집단(k-core), 콤포넌트(component) 분석, 위상분석(position analysis), 노드집단 탐색 알고리즘(community-detection algorithm) 등]에 대해서도 소개한다.

• 3부에서는 시뮬레이션이나 순열(permutation)을 토대로 네트워크 데이터에 적용할 수 있는 전통적 추리통계분석 기법들로 ‘조건부 단일 그래프(CUG, conditional uniform graph) 테스트’와 ‘이차순열할당과정(QAP, quadratic assignment procedure) 테스트’를 소개한다.

• 4부에서는 최근 인기를 얻고 있는 네트워크 모델링 기법인 ‘지수족 랜덤그래프 모형(ERGM)’과 ‘확률적 행위자중심 모형(SAOM)’ 중 가장 널리 사용되는 ‘시뮬레이션 기반 네트워크 분석(SIENA) 모형’을 소개한다. 

• 5부에서는 네트워크 분석 및 모델링과 관련하여 앞에서 다루지 않은 부분들을 간략히 소개하고, 관련 참고문헌들을 제시한다. 아울러 네트워크 분석과정에서 유의할 점을 정리하여 네트워크 분석 및 모델링 작업을 실시할 때 살펴볼 수 있도록 한다.

차례

1부 네트워크 분석의 소개와 실습준비

 

1장 네트워크 분석의 이론적 배경
1 사회과학 

  1-1 사회심리학의 소집단 연구

  1-2 사회학과 인류학의 대인관계 및 집단구조 연구

2 사회과학이 아닌 학문분과

  2-1 수학 

  2-2 문헌정보학

  2-3 네트워크 과학

 

2장 네트워크 분석 용어 정리
1 네트워크와 그 구성요소

2 노드유형 및 링크유형에 따른 네트워크 구분

3 네트워크 데이터의 구성과 분석단위

4 네트워크 행렬 데이터

5 네트워크 데이터 표기


3장 네트워크 분석을 위한 R 패키지 및 예시 데이터 소개
1 네트워크분석을 위한 R 패키지

  1-1 탐색적 네트워크 분석용 패키지(statnet/network, statnet/sna, igraph, tnet)

  1-2 네트워크 시각화용 패키지(statnet/network, igraph, ggraph)

  1-3 네트워크 모형 추정용 패키지(concoR, blockmodeling, statnet/sna, statnet/ergm, ergm.count, ergm.tapered, RSiena)

  1-4 네트워크 분석을 위한 기타 패키지(networkdata, intergraph, rucinet)

  1-5 기타 데이터 분석 패키지(tidyverse, Hmisc, patchwork, ggrepel, scales, pscl)

2 네트워크 분석 예시 데이터

 

2부 네트워크 데이터 기술통계분석

 

4장 R의 네트워크 데이터 오브젝트 및 관리
1 행렬 형태 네트워크 데이터 입력 및 관리

2 링크목록 형태 네트워크 데이터 입력 및 관리 

3 노드수준 데이터와 목록 형태 데이터를 네트워크 데이터로 입력 및 관리

4 이원네트워크 데이터 입력 및 관리 

5 이원네트워크를 일원네트워크로 변환

6 Pajek과 UCINET 네트워크 데이터 불러오기 

 

5장 노드수준 통계치
1 일원네트워크 노드수준 통계치: 링크가중치가 없는 경우 

  1-1 연결중심성 지수 계산

  1-2 근접중심성 지수 계산 

  1-3 사이중심성 지수 계산

  1-4 보나시키 권력중심성 지수 계산

  1-5 페이지랭크 중심성 지수 계산

2 이원네트워크 노드수준 통계치: 링크가중치가 없는 경우

3 이원네트워크 노드수준 통계치: 링크가중치가 존재하는 경우

4 기타 노드수준 중심성 지수들 


6장 링크수준 통계치
1 링크 사이중심성 지수 계산

2 노드속성 통계치 기반 링크수준 통계치(양자관계 통계치) 추출

 

7장 네트워크 시각화
1 네트워크 시각화 레이아웃 

2 R 베이스 시각화 방식

3 타이디버스 시각화 방식 

4 3차원 네트워크 시각화 


8장 그래프수준 통계치
1 네트워크 규모

2 네트워크 연결노드비율 및 그래프 밀도

3 그래프 중심성 지수

4 그래프 전이성 지수(군집계수) 

5 그래프 직경 

6 그래프 동류성 지수

7 기타 그래프수준 통계치

8 그래프수준 통계치를 활용한 네트워크 비교 

 

9장 하위네트워크 분석
1 연구자가 지정한 노드속성 혹은 링크속성을 기반으로 한 하위네트워크 추출 

2 응집력 강한 소집단 개념 기반 하위네트워크: 파벌, 핵심집단, 콤포넌트 

3 위상분석: 유사한 위상의 노드들로 구성된 하위네트워크들로 분류 

4 데이터 기반 노드집단 탐색 알고리즘 활용 하위네트워크

 

3부 네트워크 데이터 추리통계분석

 

10장 일변량 및 이변량 네트워크 데이터 분석
1 단일 네트워크 통계치 대상 CUG 테스트

2 비교 가능한 두 네트워크 관계에 대한 QAP 테스트 

 

11장 다변량 네트워크 데이터 분석
1 선형 네트워크 회귀모형 

2 로지스틱 네트워크 회귀모형 

3 선형 네트워크 자기상관 회귀모형 

  

4부 복합설문 데이터 심화 이슈

 

12장 지수족 랜덤그래프 모형(ERGM)
1 ERGM 개요 

2 ERGM 추정 시 고려사항: 추정항 및 모형퇴행 

3 이진형-ERGM 추정 및 추정결과 해석

  3-1 무방향 일원네트워크 대상 ERGM 추정 

  3-2 유방향 일원네트워크 대상 ERGM 추정 

4 정가-ERGM 추정 및 추정결과 해석

 

13장 시뮬레이션 기반 네트워크 분석(SIENA) 모형
1 확률적 행위자중심 모형(SAOM) 개요

2 네트워크 진화 SIENA 모형 

  2-1 데이터 준비 단계

  2-2 추정항 설정 단계 

  2-3 알고리즘 설정 단계 

  2-4 모형 추정·재추정 및 결과해석 

3 네트워크-개인행동 공진화 SIENA 모형 

  3-1 데이터 준비 단계 

  3-2 추정항 설정 단계 

  3-3 알고리즘 설정 단계 

  3-4 모형 추정·재추정 및 결과해석 

 

5부 마무리

 

14장 네트워크 분석 시 고려사항

1 다루지 못한 영역 

  1-1 네트워크 연구설계 

  1-2 네트워크 데이터 수집기법 

2 다루지 못한 기법들 

3 네트워크 분석 시 고려사항