Skip to content

Latest commit

 

History

History
46 lines (25 loc) · 2.29 KB

r.md

File metadata and controls

46 lines (25 loc) · 2.29 KB

프로그래밍 언어 R 이란?

소개

R은 통계 계산과 그래픽을 위한 프로그래밍 언어이자 소프트웨어 환경이다.
R은 1960년대와 1970년대 Bell 연구소에서 개발된 S라는 데이터 처리 언어에 기반을 두고 있다.
1990년대 중반 뉴질랜드 오클랜드 대학의 로스 이하카와 로버트 젠틀맨에 의해 시작되어
현재는 R의 핵심 기능은 R 코어 팀이, 다양한 추가 기능은 자발적 기여자들에 의해 개발되고 있다.
R은 GPL 하에 배포되는 공개 소프트웨어로 누구나 자유롭게 이용할 수 있다.

R은 빅데이터 분석에 널리 사용되고 있으며, 패키지 개발이 용이하여 통계 분석가들 사이에서 통계 소프트웨어 개발에 많이 쓰이고 있다.

특1. 뉴질랜드 오클랜드 대학의 Robert Gentleman 와 Ross Ihaka이 1995년에 개발하였다.
특2. 이름이 R인 이유는 두 개발자의 이름 모두 R로 시작하기 때문이다.
특3. R은 데이터 분석을 위한 통계 및 그래픽스를 지원하는 자유 소프트웨어 환경이다.
특4. 문제가 생겼을 경우 작업자 스스로 찾아서 해결해야 하는 경우가 많다.

R의 용도 ( R을 사용한 데이터 분석은 각 단계별로 사용 가능 )

  • 프로그램: R은 명확하고 접근하기 쉬운 프로그래밍 도구임

  • 변환: R은 데이터 과학을 위해 특별히 설계된 라이브러리 모음으로 구성됨

  • 검색: 데이터를 조사하고, 가설을 다듬음

  • 모델: R은 데이터에 적합한 모델을 캡처할 수 있는 다양한 도구 제공

  • 통신: 코드, 그래프 및 출력을 R Markdown으로 보고서에 통합하거나 Shiny 앱을 구축하여 공유

R을 쓰는 주된 이유

  • 기본적인 통계와 시각화 가능 → 그래서 R에 통계용어가 매우 많다.

  • 다양한 통계, 시각화 패키지들이 존재하고 있다. → 코딩을 하지 않아도 다양한 기능을 구현 할 수 있다.

  • 복잡한 데이터들을 다양한 그래프로 표현 할 수 있다.

  • 어떠한 OS에서도 설치가 가능하다. 심지어 아이폰에도 설치 할 수 있다.

  • 직관적이고 쉽게 데이터 전처리를 할 수 있다.

  • hadoop과 연결하여 사용이 가능하다.