본문 바로가기
반응형
nltk 오류 발생 corpus 자료 download NLTK 패키지의 corpus 자료는 설치시 제공되지 않는다 따라서 download의 명령으로 사용자가 다운로드 받아야 한다. 이걸 몰라서.... from nltk.corpus import stopwords stop = stopwords.words('english') # LookupError: # ********************************************************************** # Resource stopwords not found. # Please use the NLTK Downloader to obtain the resource: # import nltk # nltk.download('stopwords') 해결방법 pip install nltk #nltk .. 2020. 5. 26.
데이터 중복 제거 duplicated() duplicated() - 각 로우의 중복여부 boolean Series 반환 data.duplicated() # 예시 # False # False # False # True # dtype: bool 2020. 5. 25.
NA(Not Available) 처리 메서드 dropna - 누락된 데이터가 있는 축 제외, 어느 정도의 누락 데이터까지 용인할 것인지 지정 가능 data.dropna() fillna - 누락된 데이터를 대신할 값을 채우거나 'ffill' , 'bfill'같은 보간 메서드 적용 data.fillna() 누락된 값을 제외시 다른 데이터도 함꼐 버려질 가능성이 있기 때문에 구멍을 메우고 싶은 경우 사용 fillna 함수 인자 value - 비어 있는 값을 채울 스칼라값이나 사전 형식의 객체 method - 보간 방식. 기본적으로 ffill 사용 axis - 값을 채워 넣을 축, 기본값은 axis=0 inplace - 복사본을 생성하지 않고 호출한 객체 변경, 기본값은 False limit - 값을 앞 혹은 뒤에서부터 몇 개까지 채울지 지정 isnull.. 2020. 5. 25.
pandas.read_csv 한글 깨짐 pd.read_csv('파일명','\t') 으로 csv파일을 열때 파일이 열리지 않는 문제 engine='python'추가로 해결했지만, 한글이 깨짐 pd.read_csv('파일명',sep='\t',engine='python',encoding='CP949') encoding='CP949' 추가로 해결 2020. 5. 13.
tensorflow 2.0 기초 분류 (가이드 기본 이미지 분류) # 파이썬 라이브러리 임포트 from __future__ import absolute_import, division, print_function, unicode_literals, unicode_literals import tensorflow as tf from tensorflow import keras import numpy as np import matplotlib.pyplot as plt # 패션 mnist 데이터 로드 fashion_mnist = keras.datasets.fashion_mnist (train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data() # 이미지 출력시 필요한 변수 저장 class_nam.. 2020. 1. 17.
tensorflow 2.0 mnist간단 모델(가이드 - 초보용) # 텐서플로 라이브러리 임포트 from __future__ import absolute_import, division, print_function, unicode_literals !pip install -q tensorflow-gpu==2.0.0-rc1 import tensorflow as tf # MNIST 데이터셋 로드, 샘플 값을 정수 -> 부동소수 mnist = tf.keras.datasets.mnist #mnist 로드 (x_train, y_train), (x_test, y_test) = mnist.load_data() x_train, x_test = x_train / 255.0, x_test / 255.0 #계산의 편의를 위해 실수로 # layer를 쌓아 모델 구축. optimizer, los.. 2020. 1. 17.
tensorflow 2.0 기본 사칙연산 tensorflow 2.0 기본 문자열 출력 import tensorflow as tf a = tf.constant('hello world') a a.numpy() type(a) type(a.numpy()) constant를 사용한 사칙연산 A = tf.constant(2) B = tf.constatn(3) C = A + B C = tf.add(A,B) C C.numpy() D = 5 E = C * D E = tf.multiply(C,D) E E.numpy() 행렬곱 계산 Matrix_A = [[1,2],[3,4]] Matrix_B = [[3,4],[4,5]] Matrix_C = tf.matmul(Matrix_A, Matrix_B) Matrix_C 2020. 1. 11.
반응형