2.3 Lab: Introduction to Python


Sub-Chapters (하위 목차)

2.3.1 Getting Started (시작하기)

주피터 환경, 패키지 설치법 등 파이썬 시작을 위한 필수 설정 구조를 다룹니다. 분석의 베이스캠프 역할을 할 기본 인터프리터 경로를 이해할 수 있습니다.

2.3.2 Basic Commands (기본 명령어)

콘솔에서의 출력, 데이터 할당, 길이 반환 등 아주 기본적인 셸 단위 필수 명령어들을 빠르게 훑어봅니다. 문자형 또는 리스트 같은 기본 파이썬 자료형 구조와 호환성을 살펴볼 수 있습니다.

2.3.3 Introduction to Numerical Python (NumPy 소개)

다차원 데이터 배열(Array/Matrix)을 강력하고 빠르게 연산할 수 있게 해주는 핵심 기초인 NumPy 패키지의 사용법입니다. 랜덤 시드 지정과 랜덤 난수 생성 등에 익숙해지는 시간을 가집니다.

2.3.4 Graphics (그래픽 시각화)

Matplotlib 기능을 가져와 산점도, 윤곽 투영 플롯(Contour Plot) 등 복잡한 데이터 동향을 도표의 형태로 시각화합니다. 그래프를 통해 정보 구조나 상관성, 분포 양상을 직관적으로 포착하는 기술을 배웁니다.

2.3.5 Sequences and Slice Notation (시퀀스와 슬라이스 표기법)

파이썬의 행렬 객체 내부 원소들에 직접 접근하거나 특정 일련 구간만을 분리하는 인덱싱(Indexing) 기술을 다룹니다. 거대한 데이터 조각들을 필요한 시퀀스로 나누고 결합하는 문법적 숙달을 목표로 합니다.

2.3.6 Indexing Data (데이터 인덱싱)

원하는 범위의 인덱스를 수동으로 지정할 뿐만 아니라 논리적 진릿값(Boolean) 결과를 결합하여 필터링하는 기법입니다. 방대한 데이터프레임 안에서 특정 조건의 정보만을 걸러내는 필터 조건 지정을 훈련합니다.

2.3.7 Loading Data (데이터 로딩)

Pandas(판다스)의 read_csv 구문을 통해 외부 데이터를 실제로 파이썬 환경의 DataFrame으로 적재하는 방법을 배웁니다. 초기 데이터를 가져오며 열람하고, 존재하지 않는 Null 값 등을 확인하고 처리하는 기초 과정입니다.

2.3.8 For Loops (for 순환문)

반복적인 분석 파이프라인이나 스크립트를 작성할 때 반드시 쓰이게 되는 기본 제어 구문인 블록 처리 기술을 배웁니다. 리스트 컴프리헨션(List Comprehension) 및 벡터 연산 사용에 대비한 비교 문법으로 접근합니다.

2.3.9 Additional Graphical and Numerical Summaries (추가적인 그래픽 및 수치적 요약)

모든 데이터를 한눈에 담기 위한 describe 같은 수치 요약부터, 히스토그램이나 박스 플롯 등의 추가 그래픽 기법까지 학습합니다. 데이터셋 전체의 위치 및 산포도를 손발처럼 파악하게 됨으로서 향후 피처 엔지니어링 수행에 탄력을 더합니다.

서브목차