대충벌레 블로그
article thumbnail
728x90
반응형

R이 무슨언어 인지 궁금하다면 나무위키를 참조하자.

 

R(프로그래밍 언어) - 나무위키

데이터를 그래프 등 보기 좋게 시각화해주는 패키지들 ggplot2ggvisgoogleVisrChartsggiraphExtraplotlywordcloud

namu.wiki

빅데이터 관련 직업이나 일자리가 많이 생겨나면서 Hadoop 과 R 언어도 뜨고있는데 

그중에서 R 언어는 분석한것을 손쉽게 시각화 할수 있다

 

R은 무료이며 내가 사용한 IDE 툴은 RStudio 이다 .

google에서 R download 검색해서 다운받을수 있다

cran.r-project.org/bin/windows/base/

 

Download R-4.0.3 for Windows. The R-project for statistical computing.

If you want to double-check that the package you have downloaded matches the package distributed by CRAN, you can compare the md5sum of the .exe to the fingerprint on the master server. You will need a version of md5sum for windows: both graphical and comm

cran.r-project.org

마찬가지로 RStudio도 google에서 RStudio download 검색해서 설치가 가능하다

rstudio.com/products/rstudio/download/

 

Download the RStudio IDE

RStudio is a set of integrated tools designed to help you be more productive with R. It includes a console, syntax-highlighting editor that supports direct code execution, and a variety of robust tools for plotting, viewing history, debugging and managing

rstudio.com

RStudio 사용시 설치경로 혹은 사용자계정에 한글이 포함된다면 오류가 발생할수 있고 

분명 정상적으로 설치했는데도 그런일이 생기면 관리자 권한으로 실행하면 된다.

 

R 에서 필요한 패키지는 tm : 텍스트 마이닝

plotly / ggplot2 / Golor : 시각화 패키지 등이 있다.

 

 

R 에서는 다른 언어와 다르게 할당연산자(=)가 <- 이런식으로 표현한다 

 

R 버전 확인시 

sessionInfo()

라이브러리 경로 확인시

.libPaths()

 

패키지에 대한 정보가 궁금하다면

library(help="패키지명") 

별도의 탭이 열리면서 패키지 관련 정보가 출력됩니다.

 

RStudio 를 새로 열때마다 library를 로드해야한다.

library(ggplot2)

 

콤바인의 약자인 c() 는 벡터(Vector)로 만들어 주는 명령어이며

class()는 객체의 타입을 알려주는 함수이다.

 

a <- c(0,2,3,4)
a

컴바인시 c(0,2:4) 이렇게 하면 위의 결과가 똑같이 나온다

class(a) 는 데이터형을 알려준다  [1] "numeric"

 

as.logical(a) 는 로지컬형으로 형을 변환시킨다 .

ex) b <- as.logical(a)   

      b    [1] FALSE  TRUE  TRUE  TRUE

b <- as.logical(a)        
b   #  [1] FALSE  TRUE  TRUE  TRUE

 

as.numeric(b) 는 로지컬형인것을 숫자로 변환시킨다 False는 0 True는 1이다.

 

요소의 갯수를 나타낼때는 length() 함수를 사용한다

length()

a/2 는 자동적으로 모든 요소를 나누어준다.

컴바인의 연산도 가능하다 .

덧셈 c(1,2,3,4) + c(4,3,2,1)

c(1,2,3,4) + c(4,3,2,1)

실행결과 5 5 5 5 가 출력된다.

 

곱셈 c(1,2,3,4) * 2

c(1,2,3,4) * 2

실행결과 2,4,6,8이 출력된다.

 

컴바인끼리의 곱셈도 가능하다 . 

c(1,2,3,4) * c(1,2)

c(1,2,3,4) * c(1,2)

실행결과 1 4 3 8 이 출력된다  

요소갯수가 적은것을 반복한다  만약 두객체의 길이가 배수관계에 있지 않다면 에러가 발생한다 .

 

변수

a <- 1  
b <- 2  
c <- 3 

 

즉 화살표가 (=) 연산작업을 하는데 a1 = 1 해도 똑같이 대입은 된다.

다만 <- 과 = 중에 우선순위는 화살표다  즉 이렇게 사용할수 있다.

#1월 14일


# 1월 15일

 

변수는 다양하게 값을 넣을수 있다 

 

var1 <- c(1,2,3,4,5)   #   var1에 1 2 3 4 5 값을 넣는다.
var1  # [1] 1 2 3 4 5  #    R에서는 #이 주석이다.
var2 <- c(1:5)      #  1에서 5까지 숫자를 넣는다
var2  #  1 2 3 4 5 
var3 <- seq(1,5)     # 일련번호로 1~5 까지 연속된 수를 넣는다
var3  # 1  2 3 4 5    
var4 <- seq(1,10,by=2)  # 1부터 10까지 2간격으로 숫자를 넣는다
ar4   # 1 3 5 7 9

 

 

var1 + 2   # 결과는 1 3 5 7 9 

var1 요소인  1 2 3 4 5 에 2씩 더한다.

 

 

 

문자열도 큰따옴표 혹은 작은따옴표 둘다 가능하다

str1 <- "a" 
str1   # "a"
str2 <- 'a'
str2   # "a"

 

타입확인시 class(str2) 이렇게 하면 된다.

class(str2)  

"character"

class(str2) 
# "character"

 

컴바인 형식으로로 넣을수 있는데  마찬가지로 캐릭터형이다

str3 <- c('hello','대충','bug')
str3 # "hello","대충","bug"
class(str3) # "character"

 

인덱싱이 맞는지 모르겟는데 str3[1] 이렇게 하면 Hello가 출력이 된다. 아마 R에서는 1부터 인덱스 시작인거 같다.

 

최대값 , 최소값 , 중간값을 구할때는 기본적으로 있는 함수를 사용하면 된다.

mean()  # 중간 값
max()   # 최대 값
min()   # 최소 값

문자열을 이어서 붙일때는 paste(컴바인문자열,collapse = '구분자') 이렇게 사용하면 된다.

str3 <- c('hello','대충','bug')
str3
paste(str3,collapse=",") 


# ======= 실행 결과 =================
> paste(str3,collapse = ",") #  "Hello,my,R"
[1] "hello,대충,bug"

 

 

반응형

'IT 기술 > R' 카테고리의 다른 글

R언어 공부 정리 [6]  (0) 2021.01.22
R언어 공부 정리 [5]  (0) 2021.01.21
R언어 공부 정리 [4]  (2) 2021.01.20
R 언어 공부 정리 [3]  (1) 2021.01.19
R 언어 공부정리 [2]  (2) 2021.01.18
profile

대충벌레 블로그

@대충벌레

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!