데이터 처리 도구 30

SQL 실행 순서 (= SQL 논리적 처리 순서)

더보기 FROM → WHERE → GROUP BY → HAVING → SELECT → ORDER BY "FROM부터 데이터 만든 후, 필터링하고, 그룹핑하고, 최종적으로 SELECT하고, 마지막에 정렬한다." 기본적으로 표준 SQL(ANSI SQL 표준)이 정의한 실행 순서:1. FROM2. WHERE3. GROUP BY4. HAVING5. SELECT6. ORDER BY 어떤 RDBMS이건(Oracle, MySQL, PostgreSQL, SQL Server 등) 이 기본 흐름을 따른다. GROUP BY절에서 SELECT절에 정의한 별칭(alias)을 바로 사용할 수 없다.왜냐하면, GROUP BY는 SELECT보다 먼저 실행되기 때문에 아직 SELECT에서 alias가 정의되기 전이라서 인식할 수가 ..

[SQL] 연산 종류와 우선 순위

일반적인 SQL 연산 우선 순위(RDBMS에 따라 약간의 차이는 있을 수 있음) 1. 괄호2. 산술연산 (단항 부호 > 곱셈,나눗셈,나머지구하 > 덧셈,뺄셈)3. 비교연산 (>=, between, In, Like, ISNULL)4. 논리연산 (NOT > AND > OR) 1. 괄호SELECT 2 + 3 * 4; -- 결과: 14 (괄호가 없어서 곱셈 먼저)SELECT (2 + 3) * 4; -- 결과: 20 (괄호가 있는 덧셈 먼저) 2. 산술 연산 우선 순위 연산자설명예시1-, + (단항)단일 값의 부호-a, +a2*, /, %곱셈, 나눗셈, 나머지a * b, b / c, a % b3+, - (이항)덧셈, 뺄셈a + b, a - c 3. 비교 연산 우선 순위연산자설명예시-..

[Python] 데이터프레임 생략없이 출력하기 (디스플레이 옵션 수정)

행(로우), 열(컬럼) 생략없이 출력하기# row 생략 없이 출력pd.set_option('display.max_rows', None) # 모두 출력pd.set_option('display.max_rows', 10) # 10개만 출력# col 생략 없이 출력pd.set_option('display.max_columns', None) # 모두 출력pd.set_option('display.max_columns', 10) # 10개만 출력   데이터 값(셀) 생략없이 출력하기pd.set_option('display.max_colwidth', None) # 모두 출력pd.set_option('display.max_colwidth', 50) # 문자열의 길이가 50일때 자른다pandas를 사용할 때 데..

[Python] for 문: 내장함수 enumerate() 활용하기

enumerate 함수- 순서가 있는 자료형(list, set, tuple, dictionary, string)을 넣어주면 => 기존 값에 인덱스를 추가해서 리턴해준다.- for문에서 활용도가 높다. (인덱스와 값을 동시에 접근하면서 루프를 돌리고 싶을 때 사용한다.) reviews = ["review1", "review2", "review3", "review4", "review5", "review6", "review7", "review8", "review9", "review10", "review11", "review12", "review13", "review14", "review15", "review16", "review17", "review18"..

[Python] 파이썬 라이브러리 종류

1. 기본적인 데이터 처리 (파이썬 기초)Pandas - 데이터 프레임NumPy - 수학적 계산  2. 데이터 시각화Matplotlib - 기본적인 시각화Seaborn - matplotlib 기반 시각화 -> Matplotlib의 부족한 심미성을 보완함Plotly -  인터랙티브한 고품질의 시각화Bokeh - 인터랙티브한 시각화로, 웹 브라우저에서 멋진 시각적 표현을 제작할 수 있음.  3. 통계 및 수학 계산SciPy - NumPy 기반 과학적 계산, 통계적 분석 (선형대수, 미적분 등 / stats라는 패키지를 사용하여 상관 분석, t-test, 분포의 정규성 테스트 작업)statsmodels - 통계적 모델링, 통계 테스트, 데이터 탐색 및 시각화 지원math -  수학적 연산과 관련된 다양한 함수..

[Python] pass, continue, break

대표적인 반복문인 for 와 while 을 통해서 루프(loop)를 만들 수 있고, 그 안에 조건문 if 를 넣을 수 있다.  1. Pass조건문에서 아무 일도 실행되지 않도록 하는 명령어. 즉, pass는 조건문에서 딱히 넣어줄 조건이 없는 경우, 작성할 코드가 없는 경우에 사용할 수 있다. pass는 반복문 수행에 있어서 아무런 영향을 끼치지 않는다. # Examplepocket = ['jelly', 'cellphone', 'mirror']if 'money' in pocket: pass else: print("가방에서 찾아라")# Output가방에서 찾아라주머니에 돈이 있으면 가만히 있고, 주머니에 돈이 없으면 가방에서 찾으라는 문구를 출력하고 싶은 경우에 위와 같이 작성할 수 있다. po..

[MySQL] 집합 연산(2): INTERSECT, EXCEPT

집합 연산(Set Operation)이란?SQL에서 집합 연산이란, 여러 쿼리 블록의 결과들을 하나의 결과로 결합하는 것. 여기서 '쿼리 블록'은 SELECT와 같이 어떤 결과 집합을 반환하는 모든 SQL 문(SQL statement)을 의미하며, 간단한 테이블이라고도 한다.  집합 연산은 3가지로 나눌 수 있다.  Set OperationDefinition1UNION두 쿼리 블록의 모든 결과를 중복을 생략하여 하나의 결과로 결합. ⇒ 합집합2INTERSECT두 쿼리 블록의 결과에서 공통된 행만을 중복을 생략하고 결합. ⇒ 교집합3EXCEPT두 쿼리 블록 A와 B에 대해, B에 존재하지 않는 A의 모든 결과를 중복을 생략하고 반환. ⇒ 차집합세 집합 연산자는 모두 기본적으로 중복을 생략하여 결과를 반환한..

1 2 3 4 5