빅데이터 프로그래밍

이클립스 환경에서의

황세규 저

[빅데이터 프로그래밍]은 Hadoop 프레임워크의 이론에 대한 설명과 더불어 예제를 Hadoop 2.2 용 Eclipse 플러그인을 사용하여 Eclipse 통합 환경의 맵리듀스 퍼스펙티브 환경에서 Hadoop 프로젝트를 개발, 구현하고 배포하는 데 목적을 둔다. 대표적인 NoSQL인 HBase와 MongoDB를 다루는 챕터에서도 NoSQL의 운영과 관리보다는 Hadoop을 다룬 챕터와 같이 Eclipse 환경의 맵리듀스 퍼스펙티브 환경에서 Java 프로그래밍에 초점을 맞추었다.


도서 상세

분야: [데이터베이스 & 빅데이터]

출간일: Jan 29, 2015

페이지: 400

도서정가: 25,000 원

ISBN: 9788993827897

N 초급 B 초/중급 능숙 C P 숙련 E 전문
부가 정보


출판사 서평

처음 빅데이터 프로그래밍에 발을 들이는 개발자는 맵리듀스 프레임워크의 개념 이해와 함께 개발 환경에서 어려움을 겪는 일이 있다. 주로 Java로 맵리듀스와 Hive, NoSQL인 HBase, MongoDB 등을 프로그래밍 하는데 이전에 익숙해져 있던 Eclipse 통합 개발 환경과의 연계가 명료하지 못하였다. 이 책은 Hadoop 프레임워크의 이론에 대한 설명과 더불어 예제를 Hadoop 2.2 용 Eclipse 플러그인을 사용하여 Eclipse 통합 환경의 맵리듀스 퍼스펙티브 환경에서 Hadoop 프로젝트를 개발, 구현하고 배포하는 데 목적을 둔다. 또한 대표적인 NoSQL인 HBase와 MongoDB를 다루는 챕터에서도 NoSQL의 운영과 관리보다는 Hadoop을 다룬 챕터와 같이 Eclipse 환경의 맵리듀스 퍼스펙티브 환경에서 Java 프로그래밍에 초점을 맞추었다. 

HBase와 MongoDB의 개념과 API를 이해한다면 이 책의 NoSQL 예제의 난이도는 Eclipse 환경에서 일반 관계형 데이터베이스의 Java 프로그래밍과 큰 차이를 보이지 않을 것이다. 또한 모든 예제는 프로젝트 생성 시 맵리듀스 퍼스펙티브가 자동으로 빌드 경로로 Hadoop 패키지를 추가한다. 따라서 예제에서 사용되는 클래스와 인터페이스를 Eclipse 개발 환경의 코드 어시스턴스(code assistance) 기능으로 손 쉽게 구현할 수 있다. 이전의 Eclipse 통합 개발 환경에서 Java 프로그래밍을 구현한 개발자는 동일한 환경에서 Hadoop 2.2의 파일 시스템과 맵리듀스의 개념을 이해하고 실습 및 배포를 할 수 있다. 그리고 Hive와 NoSQL의 HBase와 MongoDB에 대해서도 관계형 데이터베이스와 거의 비슷한 과정과 난이도로 Java를 이용한 맵리듀스 프로그래밍이 가능하다. 이 책은 Hadoop 2.2와 맵리듀스, Hive, 그리고 NoSQL의 HBase와 MongoDB의 초심자들과 대규모 프로젝트에 앞서 소규모 파일럿 프로젝트 수행자들에게 추천할 만한 내용이 될 것이다. 

저자 소개

황세규 : 연세대학교에서 기계공학을 전공하였고 대학원에서 석사학위를 취득하였다. 2000 년 부터 IT업무를 시작하였지만 현재는 재충전의 시간을 갖고 있다. 주로 Business Intelligence(BI) 솔루션 개발 경력을 가지고 있으며 지금도 새로운 개념의 BI 솔루션에 대해 연구하고 있다. DW/BI와 더불어 빅데이터와 클라우드 환경에 대한 솔루션을 계속 공부하고 있으며 이를 아우르는 비즈니스에 많은 관심을 가지고 있다. 한국 JBoss User Group의 회원으로 활동하고 있으며, 저서로 《Eclipse와 JBoss7을 이용한 Java 웹서비스 구축, 홍릉과학출판사》이 있다.

1장 빅데이터 개요

1.1 빅데이터 정의 및 배경

1.2 빅데이터 역사

1.3 빅데이터 기술

1.4 적용 사례

2장 Hadoop 2.0

2.1 Hadoop 2.0 특징

2.2 HDFS 2 

2.3 YARN

3장 Hadoop 2.2 개발환경

3.1 Hadoop 2.2 설치

3.2 Hadoop Eclipse Plugin 설치

3.3 실습 데이터 준비

4장 HDFS 프로그래밍

4.1 HDFS 명령어 설명

4.2 HDFS API 설명

4.3 실습

5장 기본 Map-Reduce 프로그래밍

5.1 개요

5.2 API 설명

5.3 기본 예제

6장 고급 Map-Reduce 프로그래밍

6.1 사용자 정의 복합키

6.2 다중 출력

6.3 Join

6.4 Chain Map/Reduce

7장 Hive 프로그래밍

7.1 개요 및 아키텍처

7.2 HiveQL

7.3 실습

8장 NoSQL 등장

8.1 NoSQL의 정의와 개요

8.2 NoSQL의 데이터 모델 및 종류

9장 HBase 프로그래밍

9.1 HBase 개요

9.2 HBase Java API

9.3 HBase Java 예제

10장 MongoDB 프로그래밍

10.1 MongoDB 개요

10.2 Mongo Java API

10.3 Mongo Hadoop API