install.packages("stringr")
#"stringr" package를 설치하기
library("stringr")
#설치한 "stringr" package library를 사용하겠다고 선언
TIP) 한 줄 실행 : Ctrl + Enter
여러 줄 실행 : 여러 줄 Drag 해서 Block 설정 후 Ctrl + Enter
# : 주석 (C/C++에서 //와 같은 기능)
1] str_extract(string, pattern)
: string data에서 pattern 조건에 해당하는 data 추출
ex) str_extract("abcd111aa3334", "[1-9]{2}")
# string data "abcd111aa3334"에서 숫자(1~9)형 data 연속으로 2개 나타는 data 추출(가장 먼저 발견되는)
결과 값 : "11"
# abcd111aa3334 중 숫자형 data 연속 2개 나타나는 값은 11, 33이 있는데 가장 먼저 발견되는 11만 나오게 됩니다.
2] str_extract_all(string, pattern)
: str_extract(string, pattern)과 비슷하지만, 가장 먼저 발견되는 pattern만 추출되는 것과 달리
pattern에 해당하는 모든 data를 추출합니다.
ex) str_extract_all("abcd111aa3334", "[1-9]{2}")
결과 값 : "11" "33" "34"
※ 모든 경우의 수를 고려하는 줄 알았지만, 한 번 검출된 data는 제외하고서 추출하는 것 같습니다.
예상했던 값은 "11" "11" "33" "33" "34"였지만, 한 번 추출된 data 제외하고서 "11" "33" "34"만 나옵니다.
3] str_replace(vector, pattern, replacement)
: string형 vector data 중, pattern 조건에 해당하는 data를 replacement에 입력한 값으로 바꾸겠다는 의미입니다.
ex) str_replace(c("한국", "USA", "JAPAN", "CHINA"), "한국", "KOREA")
결과 값 : "KOREA" "USA" "JAPAN" "CHINA"
평소에 자주 사용하는 Ctrl+F 단축키 이용하여 바꾸기 기능을 한다고 생각하시면 됩니다.
4] str_sub(string, start, end)
: string data에서 start 값(숫자)부터 end 값(숫자)까지 추출하겠다는 의미입니다.
학부시절, 자료구조시간에 character를 이용해서 string 만든 뒤,
특정 위치(pos) 지정하여 값 추출하는 함수 구현했던 기억이 나네요..
ex) str_sub("123456", 3, 6)
#string data "123456"에서 3번째 값부터 6번째 값까지 출력
결과 값 : "3456"
'컴퓨터공학 > R programming' 카테고리의 다른 글
[6] 사분위수 구하기 (9) | 2019.05.23 |
---|---|
[5] 반복문(for문) (0) | 2019.05.22 |
[3] R의 자료구조(R Data Structure) (0) | 2019.05.21 |
[2] R언어 Data type (0) | 2019.05.21 |
[1] R, RStudio 설치하기 (0) | 2019.05.21 |