데이터 처리 도구 30

R 기초 / 제어문, 사용자 정의 함수

조건문 1) if문 - 벡터 연산 불가. 스칼라 값만 가능 - 조건 하나만 사용: if + else - 조건 여러개 사용: if + else if + else rm(list=ls()) myweight 80) { print('비만입니다') # 조건이 TRUE일 때, 실행될 명령 } else { print('정상입니다') # 조건이 FALSE일 때, 실행될 명령 } # OUTPUT: "정상입니다" if (myweight > 80) { print('비만입니다') } else if (myweight < 40) { print('저체중입니다') } else { print('정상입니다') } # OUTPUT: "정상입니다" 2) ifelse문 - if문의 한계를 보완함 (벡터 연산이 가능함. 즉 벡터의 각 요소별 조..

R 기초 / 패키지 사용하기

패키지 설치하고 로드하기 install.packages('패키지 이름') # 패키지 설치 library('패키지 이름') # 패키지 로딩 설치할 때 - install.packages('reshape') : 따옴표 사용해서 문자열로 입력해야한다. 로드할 때는 둘다 가능 - library('reshape') : 따옴표 사용해서 문자열로 입력 가능 - library(reshape) : 따옴표 없이 패키지 이름을 바로 입력 가능 reshape 패키지: melt, cast 1) 패키지 및 데이터 불러오기 # 패키지 설치 및 로딩 install.package('reshape') library(reshape) # 예시 데이터 로딩 data(airquality) names(airquality) colnames(airq..

R 기초 / apply 함수

apply 함수 - for문 등 반복문 없이 짧은 코드로 빠르게 연산 가능하다. - split -> apply -> combine 기능 제공, (데이터 분할 -> 함수 적용 -> 재결합) apply 함수 유형 - apply 함수 유형에 따라, 입력 데이터(연산대상) 유형 / 결과 출력 데이터 유형 / 연산 단위 달라진다. 1) apply input: array, matrix, dataframe(단 모든 컬럼이 같은 데이터 타입을 가져야함) output:array, vector rm(list=ls()) a

R 기초 / 연산자

?Syntax 명령어를 입력하면 연산자 우선순위 정보를 볼 수 있다. :: ::: access variables in a namespace $ @ component / slot extraction [ [[ indexing ^ exponentiation (right to left) - + unary minus and plus : sequence operator %any% |> special operators (including %% and %/%) * / multiply, divide + - (binary) add, subtract = == != ordering and comparison ! negation & && and | || or ~ as in formulae -> ->> rightwards ass..

[MySQL] 조건문 (CASE문, IF함수, IFNULL함수)

CASE문CASE WHEN (A조건) THEN (A조건이 True 일 때 반환할 값) WHEN (B조건) THEN (B조건이 True 일 때 반환할 값) ELSE (위의 조건이 모두 False 일 때)END• ELSE에 값을 지정해주지 않으면 해당 값은 자동으로 NULL값 반환한다.• ELSE를 아예 생략하는 경우에도 ELSE NULL이 자동으로 지정된다. • WHEN절 두 개를 썼는데 두 조건에 전부 부합하는 값이 있는 경우, 그 값은 먼저 기재된 WHEN절에 부합되어 반환할 값이 정해졌기 때문에 다음 WHEN절 조건에는 걸리지 않는다.  CASE문 활용(1) 새로운 컬럼 만들기SELECT CASE WHEN Country = 'Germany' AND PostalCod..

[MySQL] 집계 함수와 GROUP BY절, HAVING절

그룹별로 데이터 꺼내오기 1. GROUP BY SELECT sports , AVG(height) FROM olympic GROUP BY sports GROUP BY "그룹핑할 기준 컬럼명" • GROUP BY는 주로 집계 함수와 함께 사용된다. • 그룹핑할 기준 컬럼명을 SELECT 바로 뒤에 써주면 보기 편하다. 만약 안써주었더라도 집계함수가 뒤에 써주었다면 실행되는데, 이때는 집계함수의 결과 값만 추출된다. 반대로 SELECT에 기준 컬럼명만 써주고 집계함수를 안써주면 기준 컬럼명만 출력된다. • 그룹핑할 기준 컬럼이 두개 이상이면 콤마로 나열해주면 된다. • ORDER BY의 위치는 GROUP BY 다음에 온다. 2. GROUP BY + HAVING SELECT sports , AVG(height)..

1 2 3 4 5