코드스테이츠 AI 부트캠프/Section 1 10

AIB_113_복습정리 : Data Manipulation

문자열 나누기, 분리하기 1) Split bread = "my favorite bread is Kouign-amann" bread.split() # OUTPUT: ['my', 'favorite', 'bread', 'is', 'Kouign-amann'] metro = "jongro-euljiro-chungmuro" metro.split("-") # OUTPUT: ['jongro', 'euljiro', 'chungmuro'] - 문자열 나누기, 문자열 분리하기 함수 - bread.split( ) 와 같이 괄호 안에 아무것도 넣지 않으면, 공백 기준으로 문자열을 분리한다. - metro.split("-") 와 같이 괄호 안에 특정 값을 넣으면, 해당 값을 구분자로 문자열을 분리한다. - 분리된 결과 값은 리스..

AIB_112_복습정리 : Feature Engineering

Feature Engineering (특성 공학) 도메인 지식과 창의성을 바탕으로 데이터셋에 존재하는 feature들을 재조합하여 특정 어플리케이션에 가장 적합한 feature를 찾아내는 것. 구간을 분할하거나 통합할 수도 있고, 스케일을 조정할 수도 있고, 여러 특성을 조합하거나 연산을 적용해서 새로운 특성을 만들 수도 있다. 예를 들어 데이터셋에 '몸무게'와 '키' 라는 특성이 있는데, 이 두개의 특성을 재조합하여 새로운 특성으로 'BMI지수' 를 만드는 것은 feature engineering이라고 할 수 있다. DataFrame (데이터 프레임) Pandas의 DataFrame은 그냥 테이블 형태의 데이터다 정도로만 이해하기 (지금 내 수준에선,,) • Row(행)에는 observation dat..

AIB_111_복습정리 : EDA, 데이터 전처리

데이터 불러오기 1) Data Description을 통해 데이터셋에 대한 정보를 먼저 파악한다. 행과 열의 수 열에 헤더(컬럼이름)가 있는지 결측 데이터가 있는지 원본 데이터 형태를 확인하기(내가 기대하던 형태가 아닐 수도 있다.) 2) 데이터셋을 불러온다. 방법(1) 로컬에 저장된 파일 불러오기 from google.colab import files uploaded = files.upload() colab은 구글 드라이브를 파일 시스템으로 사용하기 때문에 로컬 파일 경로를 직접 사용할 수는 없다. 구글 드라이브에 파일을 업로드하여 불러올 수 있다. 방법(2) URL을 통해서 불러오기 csv, excel 파일 불러오기 aa = 'https://aa.com/aa.csv' bb = 'https://bb.c..

1 2