본문 바로가기
반응형
AttributeError: module transformers.models.big_bird has no attribute BigBirdTokenizer import torch !pip install transformers==3.3.0 from transformers import BertTokenizer from transformers import BertForSequenceClassification, AdamW, BertConfig from transformers import get_linear_schedule_with_warmup # !pip install transformers[torch] # !pip install transformers[tf-cpu] # !pip install transformers[flax] !pip install sentencepiece # from transformers import BertTokenizer # from tr.. 2021. 6. 28.
list 중복 단어 체크하기(딕셔너리로) temp = ['a', 'a', 'b', 'c'] w_count= {} for lst in temp: try: w_count[lst]+= 1 except: w_count[lst]=1 print(w_count) # {'a' : 2, 'b' : 1, 'c' : 1} 2021. 6. 19.
프로그래머스 음양 더하기 음양 더하기 문제 설명 어떤 정수들이 있습니다. 이 정수들의 절댓값을 차례대로 담은 정수 배열 absolutes와 이 정수들의 부호를 차례대로 담은 불리언 배열 signs가 매개변수로 주어집니다. 실제 정수들의 합을 구하여 return 하도록 solution 함수를 완성해주세요. 제한사항 absolutes의 길이는 1 이상 1,000 이하입니다. absolutes의 모든 수는 각각 1 이상 1,000 이하입니다. signs의 길이는 absolutes의 길이와 같습니다. signs[i] 가 참이면 absolutes[i] 의 실제 정수가 양수임을, 그렇지 않으면 음수임을 의미합니다. 입출력 예 absolutessignsresult [4,7,12] [true,false,true] 9 [1,2,3] [false.. 2021. 6. 19.
프로그래머스 - 체육복 체육복 문제 설명 점심시간에 도둑이 들어, 일부 학생이 체육복을 도난당했습니다. 다행히 여벌 체육복이 있는 학생이 이들에게 체육복을 빌려주려 합니다. 학생들의 번호는 체격 순으로 매겨져 있어, 바로 앞번호의 학생이나 바로 뒷번호의 학생에게만 체육복을 빌려줄 수 있습니다. 예를 들어, 4번 학생은 3번 학생이나 5번 학생에게만 체육복을 빌려줄 수 있습니다. 체육복이 없으면 수업을 들을 수 없기 때문에 체육복을 적절히 빌려 최대한 많은 학생이 체육수업을 들어야 합니다. 전체 학생의 수 n, 체육복을 도난당한 학생들의 번호가 담긴 배열 lost, 여벌의 체육복을 가져온 학생들의 번호가 담긴 배열 reserve가 매개변수로 주어질 때, 체육수업을 들을 수 있는 학생의 최댓값을 return 하도록 solution.. 2021. 6. 19.
욕설 탐지 프로그램 보호되어 있는 글 입니다. 2021. 5. 28.
3. 한국어 전처리 지도 학습 기반 형태소 분석 언어 전문가들이 직접 형태소 경계나 품사 정보를 모델에 학습하는 방법 KoNLPy - 은전한닢, 꼬꼬마, 한나눔, Okt, 코모란 등 5개 오픈소스 형태소 분석기를 파이썬 환경에서 사용할 수 있도록 인터페이스를 통일한 한국어 자연어 처리 패키지 은전한닢 분석기 사용법 # 은전한닢 형태소 분석 결과 from konlpy.tag import Mecab tokenizer = Mecab() tokenizer.morphs("아버지가방에들어가신다") # ['아버지', '가', '방', '에', '들어가', '신다'] 은전한닢 품사 정보 확인 # 은전한닢 품사 정보 분석 결과 tokenizer.pos('아버지가방에들어가신다') # [('아버지', 'NNG'), ('가', 'JKS'), (.. 2021. 5. 20.
1장 나의 첫 딥러닝 학습 - 데이터가 입력되고 패턴이 분석되는 과정 loss(손실 값) : 예측에서 빗나간 정도 accuracy(정확도) : 폐암 수술 환자의 생존율 예측하기 from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense # 딥러닝 구조를 한층씩 쌓을 수 있도록 import numpy as np import tensorflow as tf np.random.seed(3) tf.random.set_seed(3) Data_set = np.loadtxt("/dataset/data.csv",delimiter=",") X = Data_set[:,0:17] Y = Data_set[:,17] model = Sequential(.. 2021. 5. 14.
숫자만 추출하기 number = re.findall("\d+",expression) 묶음단위로 number = re.findall("\d+",expression) 한글자 단위로 import re expression = "100-200*300-500+20" number = re.findall("\d+",expression) print('number :',number) # number : ['100', '200', '300', '500', '20'] number = re.findall("\d", expression) print('number :',number) # number : ['1', '0', '0', '2', '0', '0', '3', '0', '0', '5', '0', '0', '2', '0'] 2021. 3. 9.
멀쩡한 사각형 문제 설명 가로 길이가 Wcm, 세로 길이가 Hcm인 직사각형 종이가 있습니다. 종이에는 가로, 세로 방향과 평행하게 격자 형태로 선이 그어져 있으며, 모든 격자칸은 1cm x 1cm 크기입니다. 이 종이를 격자 선을 따라 1cm × 1cm의 정사각형으로 잘라 사용할 예정이었는데, 누군가가 이 종이를 대각선 꼭지점 2개를 잇는 방향으로 잘라 놓았습니다. 그러므로 현재 직사각형 종이는 크기가 같은 직각삼각형 2개로 나누어진 상태입니다. 새로운 종이를 구할 수 없는 상태이기 때문에, 이 종이에서 원래 종이의 가로, 세로 방향과 평행하게 1cm × 1cm로 잘라 사용할 수 있는 만큼만 사용하기로 하였습니다. 가로의 길이 W와 세로의 길이 H가 주어질 때, 사용할 수 있는 정사각형의 개수를 구하는 solutio.. 2021. 3. 3.
짝지어 제거하기 짝지어 제거하기는, 알파벳 소문자로 이루어진 문자열을 가지고 시작합니다. 먼저 문자열에서 같은 알파벳이 2개 붙어 있는 짝을 찾습니다. 그다음, 그 둘을 제거한 뒤, 앞뒤로 문자열을 이어 붙입니다. 이 과정을 반복해서 문자열을 모두 제거한다면 짝지어 제거하기가 종료됩니다. 문자열 S가 주어졌을 때, 짝지어 제거하기를 성공적으로 수행할 수 있는지 반환하는 함수를 완성해 주세요. 성공적으로 수행할 수 있으면 1을, 아닐 경우 0을 리턴해주면 됩니다. 예를 들어, 문자열 S = baabaa 라면 b aa baa → bb aa → aa → 의 순서로 문자열을 모두 제거할 수 있으므로 1을 반환합니다. 제한사항 문자열의 길이 : 1,000,000이하의 자연수 문자열은 모두 소문자로 이루어져 있습니다. 입출력 예 .. 2021. 2. 28.
반응형