숫자만 추출하기
number = re.findall("\d+",expression) 묶음단위로 number = re.findall("\d+",expression) 한글자 단위로 import re expression = "100-200*300-500+20" number = re.findall("\d+",expression) print('number :',number) # number : ['100', '200', '300', '500', '20'] number = re.findall("\d", expression) print('number :',number) # number : ['1', '0', '0', '2', '0', '0', '3', '0', '0', '5', '0', '0', '2', '0']
2021. 3. 9.
re.sub
text = re.sub('RT @[\w_]+: ', '', text) # enticons 제거 text = re.sub('@[\w_]+', '', text) # URL 제거 text = re.sub(r"http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+", ' ', text) # http로 시작되는 url text = re.sub(r"[-a-zA-Z0-9@:%._\+~#=]{1,256}\.[a-zA-Z0-9()]{2,6}\b([-a-zA-Z0-9()@:%_\+.~#?&//=]*)", ' ', text) # http로 시작되지 않는 url # Hashtag 제거 text = re.sub('[#]+[0-9a-zA-Z_..
2021. 2. 28.