본문 바로가기

STUDY

(97)
파이썬 스터디 4주차(머신러닝)(2) https://book.naver.com/bookdb/book_detail.nhn?bid=16238302 파이썬 머신러닝 완벽 가이드 자세한 이론 설명과 파이썬 실습을 통해 머신러닝을 완벽하게 배울 수 있습니다!《파이썬 머신러닝 완벽 가이드》는 이론 위주의 머신러닝 책에서 탈피해 다양한 실전 예제를 직접 구현해 보면 book.naver.com 4. 분류 05. GBM(Gradient Boosting Machine) 부스팅 : 여러 개의 약한 학습기(weak learner)로 데이터에 가중치를 부여해 오류를 개선하며 학습하는 방식. AdaBoost(Adaptive boosting)와 GradientBoost가 있음. - 에이다부스트 : 오류 데이터에 가중치를 부여한 결정기준을 모두 결합해 예측 수행 (왼쪽..
파이썬 스터디 4주차(머신러닝)(1) https://book.naver.com/bookdb/book_detail.nhn?bid=16238302 파이썬 머신러닝 완벽 가이드 자세한 이론 설명과 파이썬 실습을 통해 머신러닝을 완벽하게 배울 수 있습니다!《파이썬 머신러닝 완벽 가이드》는 이론 위주의 머신러닝 책에서 탈피해 다양한 실전 예제를 직접 구현해 보면 book.naver.com 4. 분류 01. 분류의 개요 지도학습 : 레이블(Label), 즉 '정답'이 있는 데이터가 주어진 상태에서 학습하는 것. 대표 유형은 분류(Classification) 분류 : 학습 데이터로 주어진 데이터의 피처와 레이블값을 ML알고리즘에 학습시켜 모델을 생성한 뒤 새로운 데이터 값이 가질 (미지의)레이블 값을 예측하는 것. 즉 기존 데이터의 레이블 패턴을 인지한..
파이썬 스터디 7주차(캐글) 저 진짜 거짓말 안하고 머신러닝 공부 많이 했어요. ... 아니 그냥 그렇다구요. 곧 정리해 올리겠읍니다. https://youtu.be/mkytmstQKzI 캐글 타이타닉 13. Model development - Machine learning(Randomforest) 사이킷런 : 머신러닝의 A to Z를 가지고 있는 파이썬 라이브러리. from sklearn.ensemble import RandomForestClassifier from sklearn import metrics from sklearn.model_selection import train_test_split #사이킷런 관련 라이브러리 불러오기 X_train = df_train.drop('Survived', axis=1).values tar..
파이썬 스터디 6주차(캐글) ㅋㅋㅋㅋㅋ... ㅎ... 그냥 생각이 없다. 스터디 앞두고 부랴부랴 강의듣는 나 칭찬.....하지 않아 분명 뭔가 하고는 있는데 가시적으로 나타나는 결과는 하나도 없었던 일주일이다.. https://youtu.be/9GmeGAoBM7M 캐글 타이타닉 11. Feature Engineering - Changes string to categorical and Pearson coefficient - 각 값 아는법 : uniqe()는 각 값들의 종류를 알려주고, value_counts()는 각 값들과 도수를 같이 알려준다. df_train['Initial'] = df_train['Initial'].map({'Master': 0, 'Miss': 1, 'Mr': 2, 'Mrs': 3, 'Other': 4}) df_..
파이썬 스터디 5주차(캐글) https://youtu.be/_-N-kdodS0o 캐글 타이타닉 9. Feature Engineering - Fill Null in Age - ML을 할 때에는 데이터가 '좋아야'하므로 모델이 학습하기 좋은 피처를 만드는 작업인 Feature Engineering은 (특히 정형 데이터일때)매우 중요한 작업 df_train['Initial'] = df_train['Name'].str.extract('([A-Za-z]+)\.') df_test['Initial'] = df_test['Name'].str.extract('([A-Za-z]+)\.') #extract로 Name칼럼에서 '.'이 들어가는 것 추출 pd.crosstab(df_train['Initial'], df_train['Sex']).T #위에서 ..
파이썬 스터디 5주차(백준) 4주차 머신러닝 파트 분량이 너무너무 많다. 이해도 잘 안되는데 종류도 많고 양도 많아서 소화는 커녕 삼키는거라도 가능하면 다행... 루틴이나 순서가 깨지는 걸 좋아하진 않지만 이런 경우 어쩔 수 없다ㅠㅠ 브루트 포스 : 조합 가능한 모든 문자열을 하나씩 대입해 보는 방법으로 암호를 해독하는 방법. https://www.acmicpc.net/problem/2798 2798번: 블랙잭 첫째 줄에 카드의 개수 N(3 ≤ N ≤ 100)과 M(10 ≤ M ≤ 300,000)이 주어진다. 둘째 줄에는 카드에 쓰여 있는 수가 주어지며, 이 값은 100,000을 넘지 않는 양의 정수이다. 합이 M을 넘지 않는 카드 3장 www.acmicpc.net import sys from itertools import comb..
파이썬 스터디 4주차(캐글) https://youtu.be/TjcAtKuzVrg 캐글 타이타닉 7. EDA - FamilySize - Series 끼리는 더하고 빼는 등의 연산이 가능하다 #FamilySize라는 칼럼 만들기 df_train['FamilySize'] = df_train['SibSp'] + df_train['Parch'] + 1 df_test['FamilySize'] = df_test['SibSp'] + df_test['Parch'] +1 f, ax = plt.subplots(1, 3, figsize=(40, 10)) #도화지(f) 만들고 ax를 1x3으로 나눔(subplots) sns.countplot('FamilySize', data=df_train, ax=ax[0]) ax[0].set_title('(1) No. ..
파이썬 스터디 4주차(백준) https://www.acmicpc.net/problem/15596 15596번: 정수 N개의 합 C++17, Java 8, Python 3, C11, PyPy3, C99, C++98, C++11, C++14, Go, C99 (Clang), C++98 (Clang), C++11 (Clang), C++14 (Clang), C11 (Clang), C++17 (Clang) www.acmicpc.net def solve(n): ans = 0 for i in n: ans += i return ans 정수 n개가 주어졌을 때, n개의 합을 구하는 함수 작성. > ..? ??? 문제 자체를 이해하기 어려웠다.. 상상 속의 코드를 짜다가 제출란을 눌러보고 나서야 알았다. 아...ㅋ.. 이 뜻이었구나.. 받을 값인 n에..