R이 무슨언어 인지 궁금하다면 나무위키를 참조하자.
빅데이터 관련 직업이나 일자리가 많이 생겨나면서 Hadoop 과 R 언어도 뜨고있는데
그중에서 R 언어는 분석한것을 손쉽게 시각화 할수 있다
R은 무료이며 내가 사용한 IDE 툴은 RStudio 이다 .
google에서 R download 검색해서 다운받을수 있다
cran.r-project.org/bin/windows/base/
마찬가지로 RStudio도 google에서 RStudio download 검색해서 설치가 가능하다
rstudio.com/products/rstudio/download/
RStudio 사용시 설치경로 혹은 사용자계정에 한글이 포함된다면 오류가 발생할수 있고
분명 정상적으로 설치했는데도 그런일이 생기면 관리자 권한으로 실행하면 된다.
R 에서 필요한 패키지는 tm : 텍스트 마이닝
plotly / ggplot2 / Golor : 시각화 패키지 등이 있다.
R 에서는 다른 언어와 다르게 할당연산자(=)가 <- 이런식으로 표현한다
R 버전 확인시
sessionInfo()
라이브러리 경로 확인시
.libPaths()
패키지에 대한 정보가 궁금하다면
library(help="패키지명")
별도의 탭이 열리면서 패키지 관련 정보가 출력됩니다.
RStudio 를 새로 열때마다 library를 로드해야한다.
library(ggplot2)
콤바인의 약자인 c() 는 벡터(Vector)로 만들어 주는 명령어이며
class()는 객체의 타입을 알려주는 함수이다.
a <- c(0,2,3,4)
a
컴바인시 c(0,2:4) 이렇게 하면 위의 결과가 똑같이 나온다
class(a) 는 데이터형을 알려준다 [1] "numeric"
as.logical(a) 는 로지컬형으로 형을 변환시킨다 .
ex) b <- as.logical(a)
b [1] FALSE TRUE TRUE TRUE
b <- as.logical(a)
b # [1] FALSE TRUE TRUE TRUE
as.numeric(b) 는 로지컬형인것을 숫자로 변환시킨다 False는 0 True는 1이다.
요소의 갯수를 나타낼때는 length() 함수를 사용한다
length()
a/2 는 자동적으로 모든 요소를 나누어준다.
컴바인의 연산도 가능하다 .
덧셈 c(1,2,3,4) + c(4,3,2,1)
c(1,2,3,4) + c(4,3,2,1)
실행결과 5 5 5 5 가 출력된다.
곱셈 c(1,2,3,4) * 2
c(1,2,3,4) * 2
실행결과 2,4,6,8이 출력된다.
컴바인끼리의 곱셈도 가능하다 .
c(1,2,3,4) * c(1,2)
c(1,2,3,4) * c(1,2)
실행결과 1 4 3 8 이 출력된다
요소갯수가 적은것을 반복한다 만약 두객체의 길이가 배수관계에 있지 않다면 에러가 발생한다 .
변수
a <- 1
b <- 2
c <- 3
즉 화살표가 (=) 연산작업을 하는데 a1 = 1 해도 똑같이 대입은 된다.
다만 <- 과 = 중에 우선순위는 화살표다 즉 이렇게 사용할수 있다.
#1월 14일
# 1월 15일
변수는 다양하게 값을 넣을수 있다
var1 <- c(1,2,3,4,5) # var1에 1 2 3 4 5 값을 넣는다.
var1 # [1] 1 2 3 4 5 # R에서는 #이 주석이다.
var2 <- c(1:5) # 1에서 5까지 숫자를 넣는다
var2 # 1 2 3 4 5
var3 <- seq(1,5) # 일련번호로 1~5 까지 연속된 수를 넣는다
var3 # 1 2 3 4 5
var4 <- seq(1,10,by=2) # 1부터 10까지 2간격으로 숫자를 넣는다
ar4 # 1 3 5 7 9
var1 + 2 # 결과는 1 3 5 7 9
var1 요소인 1 2 3 4 5 에 2씩 더한다.
문자열도 큰따옴표 혹은 작은따옴표 둘다 가능하다
str1 <- "a"
str1 # "a"
str2 <- 'a'
str2 # "a"
타입확인시 class(str2) 이렇게 하면 된다.
class(str2)
"character"
class(str2)
# "character"
컴바인 형식으로로 넣을수 있는데 마찬가지로 캐릭터형이다
str3 <- c('hello','대충','bug')
str3 # "hello","대충","bug"
class(str3) # "character"
인덱싱이 맞는지 모르겟는데 str3[1] 이렇게 하면 Hello가 출력이 된다. 아마 R에서는 1부터 인덱스 시작인거 같다.
최대값 , 최소값 , 중간값을 구할때는 기본적으로 있는 함수를 사용하면 된다.
mean() # 중간 값
max() # 최대 값
min() # 최소 값
문자열을 이어서 붙일때는 paste(컴바인문자열,collapse = '구분자') 이렇게 사용하면 된다.
str3 <- c('hello','대충','bug')
str3
paste(str3,collapse=",")
# ======= 실행 결과 =================
> paste(str3,collapse = ",") # "Hello,my,R"
[1] "hello,대충,bug"
'IT 기술 > R' 카테고리의 다른 글
R언어 공부 정리 [6] (0) | 2021.01.22 |
---|---|
R언어 공부 정리 [5] (0) | 2021.01.21 |
R언어 공부 정리 [4] (2) | 2021.01.20 |
R 언어 공부 정리 [3] (1) | 2021.01.19 |
R 언어 공부정리 [2] (2) | 2021.01.18 |