6주차: 파이썬
(대부분 라이브러리 설명 및 실습이라 많이 생략하였습니다)
파이썬 기초와 데이터분석
EDA: 데이터에서 분석에 필요한 통계량들을 계산하고, 시각화를 통해 이를 확인하는 작업.
- 데이터와 친해지는 과정으로, 데이터에서 확인하고 싶은 정보를 찾아내는 과정임.
- 자신만의 EDA 프로세스를 구축하는 것이 데이터를 다루는 사람으로서의 역량
- 분석 목표(어떤 인사이트를 이끌어내고 싶은가?), 분석 방법론(데이터 특성을 어떻게 파악할 것인가?), 분석을 위한 프로그래밍(EDA는 어떻게 수행할 것인가?) 세 가지에 대해 생각해 보아야 함
파이썬 기초 프로그래밍
파이썬 기초: 대소문자 구분, 들여쓰기(indent)에 민감(Tab 혹은 스페이스 바 4번), 첫번째 인덱스가 0부터 시작
- 자료형: 파이썬에서 데이터를 표현하는 형식.
- 변수: 자료형의 값을 담는 그릇. 일반적으로 '알파벳 소문자 + 숫자 혹은 언더바'로 명명.
* 리스트에는 파이썬의 모든 자료형(숫자, 문자열, 불린, 리스트, 튜플, 딕셔너리...)을 담을 수 있다.
* 튜플은 값의 수정(추가 및 삭제)이 불가능하기 때문에 변수를 읽기 전용으로 만들고 싶을 때 사용한다.
* 딕셔너리는 키와 값의 쌍 모음으로, 값을 찾고싶을 때 다른 자료형에 비해 속도가 매우 빠르다. 키에는 문자열만 올 수 있지만, 값에는 모든 자료형이 올 수 있다.
- 조건문: 프로그래밍에서 조건에 따른 참과 거짓을 판단하는 문장.
- 함수: 입력 값을 받아 출력 값을 반환해주는 것. 반복되는 작업을 묶어 재사용 할 수 있게 한다.
- 입력: input, 사용자의 키보드 입력을 받을 수 있음
- 출력: output, print로 변수 출력 가능
- 파일 읽고 쓰기: open으로 새 파일을 만들 수 있음. 한 번 open했으면 반드시 close도 필요(혹은 with open 사용). 읽기모드(r), 쓰기모드(w), (추가)쓰기모드(a) 설정 필요
파이썬 고급 기능
- 리스트 컴프리헨션: 파이썬의 고유 기능. 빠르고 쉽게 리스트 생성 가능. 일반적으로 for문을 사용할 때보다 훨씬 빠르다.
- 리스트명 = [변수 for 변수 in iteration객체 (if 조건문)]:: 조건문은 생략 가능
- 예외처리: 프로그램 동작에 오류가 발생했을 때 오류를 무시하거나 오류 유형에 따라 추가 조치를 수행할 수 있는 기능.
try:
우선 실행 구문
except:
오류 발생 시 실행 구문(예외처리)
- 예상되는 예외를 지정해 처리하여 이후 버그 발생 시 원인 파악이 용이하도록 하자!
- 프로그램 모듈화: 작성한 python코드를 실제 동작할 수 있는 프로그램처럼 만드는 방법. 모듈화가 이루어진 코드는 외부 장치에서 import 및 실행이 가능하다.
def main():
수행할 프로그램
if __name__ = "__main__":
main()
- 위 코드를 .py파일로 만들고 이를 실행시키면 된다.
'STUDY' 카테고리의 다른 글
취준로그 ver1.2 (1) | 2023.04.16 |
---|---|
취준로그 ver1.1 (0) | 2023.04.06 |
Newzoo PC & Console 게이밍 리포트 2023 (0) | 2023.03.28 |
취준로그 ver1.0 (3) | 2023.03.24 |
패스트캠퍼스 데이터분석 부트캠프 학습일지5 (0) | 2023.03.24 |