로봇신문사
> 로봇컬처 > Books
R로 배우는 코딩빅데이터 분석의 첫걸음
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
승인 2018.01.29  00:14:27
트위터 페이스북 구글+ 밴드

코딩 학습의 시작으로 왜 R을 공부하면 좋을까?

사회는 점점 복잡해지고 다양해지고 있다. 그와 동시에 컴퓨팅 비용은 낮아지고 있어 기업들은 그동안 축적한 데이터를 기반으로 효과적인 의사 결정을 위한 분석적 환경을 더욱 필요로 하고 있다. 이에 따라 데이터 분석의 최적 환경을 자랑하는 R이 급부상하고 있으며, 많은 이들에게 각광받고 있다. R은 다른 프로그래밍 언어에 비해 자료를 처리하는 데 탁월한 기능을 가지고 있다. 또한 많은 연구 및 개발자들이 제공하는 수천 개의 라이브러리를 활용할 수 있으며, 간단히 몇 줄의 코딩만으로 표, 차트, 지도 등 다양한 시각화 자료를 쉽게 만들어 낼 수 있다. 이러한 강력한 데이터 처리 능력과 쉬운 프로그래밍 환경으로 인해 IT와 무관한 비전공 독자라 하더라도 R로 쉽게 코딩을 배울 수 있다.

학습하기 최적의 구성, R로 배우는 코딩

첫째, 이 책은 초보자의 코딩 학습 시작을 위해 흥미 있고 쉬운 내용으로 구성하였다.
둘째, 차트, 애니메이션, 지도, 텍스트 마이닝, 공공 데이터, 네이버 오픈 API, 웹 스크래핑 등 실용적이고 쉬운 예제 중심의 내용으로 구성하였다.
셋째, 네트워크 분석, 시뮬레이션, 인공 신경망 등 실용적이고 고급 예제 중심의 내용으로 구성하였다.
다섯째, 구문보다는 절차 위주의 문제 해결 학습을 지향하는 내용으로 구성하였다.
여섯째, 개념 설명 → 예시와 학습목표 → 플로차트/R스크립트/실행/문법 → 실습과제 순서의 체계적인 학습 절차를 통한 최적의 주제별 내용으로 구성하였다.

R로 배우는 코딩의 학습 내용

1장 왜 R인가?
R은 누구든지 자유롭게 사용할 수 있는 오픈 소스로 통계, 기계 학습, 금융, 생물정보학, 그래픽스에 이르는 다양한 통계 패키지를 갖추고 있어 바로 응용할 수 있다. 또한 쉬운 설치와 실습이 가능하고 어떠한 데이터라도 분석해내며 그래프로 그려낼 수 있어, 컴퓨터 공학뿐 아니라 생명과학이나 인문학 등 여러 분야에서도 손쉽게 사용할 수 있다. 이 장에서는 이러한 R의 장점과 왜 배워야 하는지를 설명하고 있다.

2장 R 환경 구축
R은 오픈 소스이기 때문에 CRAN(www.r-project.org) 사이트에서 누구든지 자유롭게 내려받아 설치할 수 있다. R은 기본적으로 패키지들의 모음으로, 현재 CRAN에는 패키지 3,759개가 등록되어 있으며, 계속 개발되고 있다. 이 장에서는 이러한 R을 설치 방법에 따라 설치한다.

3장 데이터 구조의 이해와 코딩의 시작
R 코딩을 잘하기 위해서는 데이터 구조를 정확히 이해해야 한다. R은 벡터(vector), 배열(array), 리스트(list), 데이터 프레임(data frame) 등 다양한 데이터 구조를 지원하기 때문이다. 이러한 데이터 구조는 데이터 분석을 위해 매우 유용하다. 이 장에서 데이터 구조를 이해했다면 R 코딩의 날개를 단 것이나 다름없다.
4장 무조건 해 보기
R은 누구나 쉽게 할 수 있는 프로그래밍 언어이다. 앞에서 배운 R의 기본 내용을 바탕으로 차트로 나타내기, 애니메이션 출력하기, 단양팔경을 구글 맵 위에 올려놓기, 연설문 키워드 분석하기, 동전 던지기 시뮬레이션 등의 기초 내용을 미리 익혀 본다.

5장 차트 프로그래밍
차트는 데이터 분석 결과를 효과적으로 전달하기 위해 매우 유용하다. 플로차트는 알고리즘을 도식으로 표현한 것으로, 프로그램을 기록하고 설명하는 데에 또한 매우 유용하다. 이 장에서는 플로차트로 데이터를 알맞게 순서대로 정리한 후 R 프로그래밍으로 데이터를 분석한 차트를 출력한다.

6장 애니메이션
애니메이션의 개념을 이해하고, 카운트다운, 움직이는 차트, 움직이는 그림 등을 반복문으로 만들어 본다. 또한 실제 애니메이션 시나리오를 만들고 여러 개의 이미지 프레임을 만들어 실행한다.

7장 지도 활용하기
구글맵은 위성 사진, 지도, 360도 거리 전망, 실시간 교통정보, 두 지점 간의 최적 경로 등의 서비스를 제공한다. 이러한 구글맵을 활용하여 지도와 그래프를 출력하고, R의 ggmap을 활용하여 특정 지역의 지도, 충청북도의 명소인 단양팔경의 위치, 지진의 위치와 지진 강도 등을 표시한다.

8장 텍스트 마이닝과 워드 클라우드 활용
벡터 데이터를 이용하여 워드 클라우드를 연습하고, 통계청 데이터를 이용하여 행정구역별 인구수를 한눈에 볼 수 있는 워드 클라우드를 만든다. 또한 대통령 연설문의 워드 클라우드를 만들어 키워드를 비교 분석한다.

9장 공공 데이터 활용
공공데이터포털 사이트를 방문해 공공 데이터를 이용하는 방법을 알아본다. 공공데이터포털에서는 파일 데이터, 오픈 API, 시각화 등의 다양한 방식을 제공하고 있으며, 회원 가입만 하면 검색을 통해 원하는 공공 데이터를 빠르게 찾아볼 수 있다. 이 장에서는 특히 오픈 API를 활용하는 방법을 알아본다.

10장 네이버 오픈 API 활용
네이버는 네이버 오픈 API를 통해 다양한 정보를 제공하고 있다. 이러한 API를 활용하기 위해 API 키를 발급받는 절차와 API의 기본 사항을 알아본다. 그리고 실제로 네이버 블로그를 검색하고 워드 클라우드를 만들어 어떤 키워드들이 강조되었는지 비교한다.

11장 웹 스크래핑의 활용
웹 스크래핑을 활용하여 상품 카탈로그를 제작하거나 뉴스 기사, 블로그와 카페의 게시물, 회사의 프로필과 금융 데이터 등을 수집할 수 있다. 이 장에서는 상품 정보의 웹 스크래핑과 구글 검색의 웹 스크래핑을 경험한다.

12장 네트워크 분석
네트워크 분석에 간단히 사용할 수 있는 igraph를 이용하여 간단한 네트워크 유형과 페이스북 사용자 네트워크의 사회 연결망을 분석한다.

13장 시뮬레이션
동전 던지기 시뮬레이션과 난수를 이용하여 원주율을 계산하는 예로 사용되는 몬테카를로 시뮬레이션에 대해 알아본다.

14장 인공지능과 인공 신경망
인공지능과 기계 학습 분야에서 연구되는 학습 알고리즘의 하나인 인공 신경망에 대해 알아보고, 인공 신경망을 이용해 과거 주가 시계열 데이터로부터 학습 과정을 거쳐 주가를 예측하는 방법을 살펴본다.

"R로 배우는 코딩"
장용식, 강희구 지음 | 436쪽 | 30,000원
생능출판사 펴냄

조규남  ceo@irobotnews.com
조규남의 다른기사 보기  
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
트위터 페이스북 구글+ 밴드 뒤로가기 위로가기
이 기사에 대한 댓글 이야기 (0)
자동등록방지용 코드를 입력하세요!   
확인
- 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
- 욕설등 인신공격성 글은 삭제 합니다. [운영원칙]
이 기사에 대한 댓글 이야기 (0)
최근인기기사
1
테크놀로지의 덫(THE TECHNOLOGY TRAP)
2
‘독도’ 주제로 AI작가와 인간작가의 콜라보 작품 선보인다
3
LIG넥스원, 서울대 BMRR과 생체 모방 로봇 연구 개발 협력
4
일본 라쿠텐-세이유, 자율배송 로봇 운영
5
미 조지아텍, '미니 트랜스포머' 군집 로봇 개발
6
中 상하이 정부 "장삼각 로봇 생태계 조성"
7
한중합작법인 '허궁현대', 산업용 로봇 출시
8
서울대 강유 교수팀, 인공신경망학회에 논문 게재
9
'에이아이트릭스-동아대병원, 의료 인공지능 연구 협력
10
한국동서발전, 위험 작업 '수중 로봇'으로 대체한다
로봇신문 소개기사제보광고문의불편신고개인정보취급방침이메일무단수집거부청소년보호정책    *국제표준간행물번호 ISSN 2636-0381 *본지는 인터넷신문위원회 자율심의 준수 서약사입니다
08298) 서울 구로구 공원로 41(구로동, 현대파크빌 427호)  |  대표전화 : 02)867-6200  |  팩스 : 02)867-6203
등록번호 : 서울 아 02659  |  등록일자 : 2013.5.21  |  발행인·편집인 : 조규남  |  청소년보호책임자 : 박경일
Copyright © 2013 로봇신문사. All rights reserved. mail to editor@irobotnews.com