본문 바로가기

☆ I T 분 야/  4) 데 이 터 베 이 스

통계학과 진로 빅데이터전문가 공부방법.



데이터는 이제 '새로운 원유' 라는 평가를 받고 있습니다.

인터넷에는 매일 대량의 정보가 쏟아져 들어오고 있습니다.

이런 정보들을 수집해서 상품성이 있는 하나의 데이터로

개발해내는 직업군이 '빅데이터' 입니다.




빅데이터


디지털 환경에서 생성되는 데이터로, 그 규모가 방대하며

생성 주기도 짧고, 형태도 수치 데이터뿐 아니라 문자와

영상 데이터를 포함하는 대규모 데이터를 말합니다.


빅데이터 환경은 과거에 비해 데이터의 양이 폭증했다는

점과 함께 데이터의 종류도 다양해져 사람들의 행동은 물론

위치정보와 SNS를 통해 생각과 의견까지 분석하고

예측할 수 있는 장점이 있습니다.

빅데이터 직업군은 2가지로 나뉩니다.


1. 빅데이터 전문가

2. 빅데이터 분석가


전문가는 정보 수집이 주 메인이고 분석가 같은 경우는

R로 시각화한 수치값까지 통계하고 기획하는 분야입니다.

때문에 분석가가 더 상위직종이라고 볼 수 있죠.




빅데이터는 IT업계에서도 수집, 통계, 분석을 하는 직업으로

통계학과, 경영학과를 나온 사람들이 유리합니다.


빅데이터 전문가 / 분석가를 희망한다면 주 전공은 통계학

을 전공하고 복수전공으로 컴퓨터공학을 전공하는게 좋습니다.





몇몇 분들이 빅데이터 전문가 / 분석가가 되기 위해서라면

'하둡', 'R프로그래밍' 을 배워야 한다고 합니다.



하둡


여러개의 컴퓨터를 하나인것처럼 묶어 대용량 데이터를

처리하는 기술로, 대용량 파일을 저장할 수 있는 기능을

제공하는 분산파일 시스템과, 저장된 파일 데이터를

분산된 서버의 CPU와 메모리 자원을 이용해 분석할 수 있는

컴퓨팅 플랫폼인 맵리듀스로 구성되어 있습니다.



R프로그래밍


오픈소스 프로그램으로 통계 / 데이터마이닝 및

그래프를 위한 언어로써 최근에 빅데이터 분석을

목적으로 주목받고 있는 언어입니다.




빅데이터가 목표라면 배워야 할 것은

JAVA, 하둡, DB입니다.

R은 그냥 통계용 프로그램입니다.


JAVA는 하둡에서 필요로하기에 쓰이는 것이지

R프로그래밍과는 관련이 없습니다.





R 프로그래밍을 배운다면 통계를 낼 데이터대상들이

있어야 하는데, R프로그래밍부터 배워봐야

프로그램을 다루는 법만 배울 뿐

R프로그래밍을 활용할 데이터는 없는 셈입니다.


배움의 과정에서 데이터들을 가지고 놀기위해

DB를 알아야 하고, 하둡을 배움으로써 R로 분석결과를

통계하는것이 핵심입니다.




하둡이라는 기술은 여러 서버를 합쳐

하나의 가상서버(클라우드)를 만들어

대량의 데이터를 수집, 처리, 분석하는 기술인데


여기서 여러대의 서버를 묶기 때문에 네트워크

알아야 하고, 리눅스에서 구현되기때문에 자바 코딩을

들어가기 전, 자바와 리눅스를 배우라고 하는 이유입니다.



그렇기에 현 단게에서 본인이 빅데이터 전문가 / 분석가

를 희망한다면, R프로그래밍, 하둡을 공부할 게 아니라,

JAVA부터 네트워크, 데이터베이스, 리눅스에 대한

공부를 해야 합니다.




빅데이터가 목표이신가요?

그 과정은 쉽지 않습니다.


기초부터 차근차근 배움으로써

빅데이터 전문가 / 개발자의 꿈을

이루어보십시오.