본문 바로가기

분류 전체보기

(110)
파이썬 스터디 7주차(캐글) 저 진짜 거짓말 안하고 머신러닝 공부 많이 했어요. ... 아니 그냥 그렇다구요. 곧 정리해 올리겠읍니다. https://youtu.be/mkytmstQKzI 캐글 타이타닉 13. Model development - Machine learning(Randomforest) 사이킷런 : 머신러닝의 A to Z를 가지고 있는 파이썬 라이브러리. from sklearn.ensemble import RandomForestClassifier from sklearn import metrics from sklearn.model_selection import train_test_split #사이킷런 관련 라이브러리 불러오기 X_train = df_train.drop('Survived', axis=1).values tar..
파이썬 스터디 6주차(캐글) ㅋㅋㅋㅋㅋ... ㅎ... 그냥 생각이 없다. 스터디 앞두고 부랴부랴 강의듣는 나 칭찬.....하지 않아 분명 뭔가 하고는 있는데 가시적으로 나타나는 결과는 하나도 없었던 일주일이다.. https://youtu.be/9GmeGAoBM7M 캐글 타이타닉 11. Feature Engineering - Changes string to categorical and Pearson coefficient - 각 값 아는법 : uniqe()는 각 값들의 종류를 알려주고, value_counts()는 각 값들과 도수를 같이 알려준다. df_train['Initial'] = df_train['Initial'].map({'Master': 0, 'Miss': 1, 'Mr': 2, 'Mrs': 3, 'Other': 4}) df_..
파이썬 스터디 5주차(캐글) https://youtu.be/_-N-kdodS0o 캐글 타이타닉 9. Feature Engineering - Fill Null in Age - ML을 할 때에는 데이터가 '좋아야'하므로 모델이 학습하기 좋은 피처를 만드는 작업인 Feature Engineering은 (특히 정형 데이터일때)매우 중요한 작업 df_train['Initial'] = df_train['Name'].str.extract('([A-Za-z]+)\.') df_test['Initial'] = df_test['Name'].str.extract('([A-Za-z]+)\.') #extract로 Name칼럼에서 '.'이 들어가는 것 추출 pd.crosstab(df_train['Initial'], df_train['Sex']).T #위에서 ..
파이썬 스터디 5주차(백준) 4주차 머신러닝 파트 분량이 너무너무 많다. 이해도 잘 안되는데 종류도 많고 양도 많아서 소화는 커녕 삼키는거라도 가능하면 다행... 루틴이나 순서가 깨지는 걸 좋아하진 않지만 이런 경우 어쩔 수 없다ㅠㅠ 브루트 포스 : 조합 가능한 모든 문자열을 하나씩 대입해 보는 방법으로 암호를 해독하는 방법. https://www.acmicpc.net/problem/2798 2798번: 블랙잭 첫째 줄에 카드의 개수 N(3 ≤ N ≤ 100)과 M(10 ≤ M ≤ 300,000)이 주어진다. 둘째 줄에는 카드에 쓰여 있는 수가 주어지며, 이 값은 100,000을 넘지 않는 양의 정수이다. 합이 M을 넘지 않는 카드 3장 www.acmicpc.net import sys from itertools import comb..
파이썬 스터디 4주차(캐글) https://youtu.be/TjcAtKuzVrg 캐글 타이타닉 7. EDA - FamilySize - Series 끼리는 더하고 빼는 등의 연산이 가능하다 #FamilySize라는 칼럼 만들기 df_train['FamilySize'] = df_train['SibSp'] + df_train['Parch'] + 1 df_test['FamilySize'] = df_test['SibSp'] + df_test['Parch'] +1 f, ax = plt.subplots(1, 3, figsize=(40, 10)) #도화지(f) 만들고 ax를 1x3으로 나눔(subplots) sns.countplot('FamilySize', data=df_train, ax=ax[0]) ax[0].set_title('(1) No. ..
파이썬 스터디 4주차(백준) https://www.acmicpc.net/problem/15596 15596번: 정수 N개의 합 C++17, Java 8, Python 3, C11, PyPy3, C99, C++98, C++11, C++14, Go, C99 (Clang), C++98 (Clang), C++11 (Clang), C++14 (Clang), C11 (Clang), C++17 (Clang) www.acmicpc.net def solve(n): ans = 0 for i in n: ans += i return ans 정수 n개가 주어졌을 때, n개의 합을 구하는 함수 작성. > ..? ??? 문제 자체를 이해하기 어려웠다.. 상상 속의 코드를 짜다가 제출란을 눌러보고 나서야 알았다. 아...ㅋ.. 이 뜻이었구나.. 받을 값인 n에..
파이썬 스터디 3주차(머신러닝) 자 열쩡을 가지고 해봅시다.. 열쩡열쩡열쩡..!! https://book.naver.com/bookdb/book_detail.nhn?bid=16238302 파이썬 머신러닝 완벽 가이드 자세한 이론 설명과 파이썬 실습을 통해 머신러닝을 완벽하게 배울 수 있습니다!《파이썬 머신러닝 완벽 가이드》는 이론 위주의 머신러닝 책에서 탈피해 다양한 실전 예제를 직접 구현해 보면 book.naver.com 3. 평가 - 여러 방법으로 머신러닝 예측 성능 평가 가능. - 회귀 모델의 경우 실제 값과 예측 값의 오차 평균값 기반 - 분류 모델의 경우 정확도만으로 판단해선 안 됨 - 분류 성능 평가 지표 : 정확도, 오차행렬, 정밀도, 재현율, F1스코어, ROC AUC - 분류는 결정 클래스 값 종류 유형에 따라 이진 분..
파이썬 스터디 3주차(캐글) https://youtu.be/aeaEISnjH2I 캐글 타이타닉 5. EDA - Age, Sex, Pclass(violinplot) f, ax = plt.subplots(1, 2, figsize=(18,8)) #사이즈가 18, 8인 도화지(f)를 만들고 ax를 1x2로 나눔(subplots) sns.violinplot('Pclass', 'Age', hue='Survived', data=df_train, scale='count', split=True, ax=ax[0]) ax[0].set_title('Pcalss and Age vs Survived') ax[0].set_yticks(range(0, 100, 10)) #df_train 데이터의 Pclass를 x축, Age를 y축에 두고 Survived에 따라..