본문 바로가기
반응형
c언어 이중for문으로 별찍기(2) -피라미드 #include int main(void) { int x,y; int i; printf("원하는 크기를 입력하세요:\n"); scanf("%d",&i); for(y=1;y 2020. 10. 19.
c언어 이중for문으로 별찍기(1) -상자만들기 #include int main(void) { int i; int j; int x; int y; printf("깊이를 결정하세요\n:"); scanf("%d",&x); printf("너비를 결정하세요\n:"); scanf("%d",&y); ​ for(j=0;j 2020. 10. 19.
fork 생성하여 원하는 크기의 트리만들기 #include #include #include int main() { int i,j; int n,m; int pid=0; printf("insert want level:"); scanf("%d",&n);//원하는 깊이를 받는다 printf("insert want extent:"); scanf("%d",&m);//원하는 너비를 받는다 printf("first pid [%d]\n ",getpid()); for(j=0;j 2020. 10. 19.
if문 if else 문 예제 2020. 10. 19.
네이버 인기검색어 크롤링 from urllib.request import urlopen from bs4 import BeautifulSoup from html2text import html2text import pprint if __name__ == "__main__": url = urlopen("https://www.naver.com/") bs = BeautifulSoup(url,'html.parser') rank = bs.find_all('span',class_='ah_k') list = [] dic = {} for val in rank: list.append(html2text(str(val)).replace("\n","",2)) for n in range(0,20): dic[n+1] = list[n] dic = pprint.. 2020. 10. 19.
6장 구문 분석 구문 분석 - 자연어 문장에서 구성 요소들의 문법적 구조를 분석하는 기술 규칙 기반 구문 분석 인간이 직접 정의한 문법 규칙을 적용하여 구문 분석을 수행하는 접근 방식 통계 기반 구문 분석 확률적인 문법 규칙을 통계적으로 계산하여 이를 바탕으로 구문 분석을 수행하는 접근 방법 딥러닝 기반 구문 분석 인간이 구축한 구문 분석 데이터셋으로부터 딥러닝 모델을 학습하여 구문 분석을 수행하는 접근 방법 구문 문법 언어학에서 문법적 구성 요소들로부터 문장 생성, 문장의 구성요소 분석하는 문법 자연어 문장의 문법적 구조를 구문 분법에 따라 자동으로 분석하고자 하는 목표를 가진다. 구구조 문법 구성소 관계에 기반하여 문장 구조 분석 의존 문법 의존 관계에 기반하여 문장 구조 분석 # 본 게시글은 자연어처리 바이블을 읽.. 2020. 10. 19.
5장 어휘 분석 어휘 분석 단어의 구조를 식별하고 분석함으로써 어휘의 의미와 품사에 관한 단어 수준의 연구 형태소 분석 형태소 - 더 이상 분해될 수 없는 최소한의 의미를 갖는 단위 최소한의 의미를 갖는 단위인 형태소를 사용해 단어가 어떻게 형성되는지에 대해 자연어의 제약 조건과 문법 규칙에 맞춰 분석하는 것 형태소 분석 절차 단어에서 최소 의미를 포함하는 형태소 분리 형태론적 변형이 일어난 형태소의 원형 찾기 단어와 사전들 사이의 결합 조건에 따라 옳은 분석 후보 선택 품사 태깅 품사 - 단어의 기능, 형태, 의미에 따라 나눈 것 태깅 - 같은 단어에 대해 의미가 다를 경우(중의성) 부가적인 언어의 정보를 부착하는 것 품사 태깅 - 문서 또는 문장을 이루고 이쓴 각 단어에 정확한 하나의 품사를 부여하는 것 # 본 게시.. 2020. 10. 19.
TypeError: expected string or bytes-like object for i in tqdm(range(len(label))): label[i] = re.sub('0',"-1",label[i]) list안의 0을 -1로 바꿔주는 작업중 에러 발생 for i in tqdm(range(len(label))): label[i] = re.sub('0',"-1",str(label[i])) label[i]의 값이 str이 아닌 경우 발생하는 에러로 str(label[i])로 변경하여 에러 해결 2020. 10. 19.
4장 텍스트의 전처리 정형 데이터, 비정형 데이터 정형 데이터 - 일정한 규격이나 형태를 지닌 숫자 데이터 ex) 숫자, 날짜 등 비정형 데이터 - 숫자 등의 비정형 데이터와 달리 구조화 되지 않은 데이터 ex) 언어, 영상, 그림 등 띄어쓰기 교정 기법 규칙기반 어휘지식, 규칙, 오류 유형 등의 휴리스틱 규칙 이용 비교적 복잡, 구축관리 비용 ↑ 통계, 확률 기반 말뭉치로부터 자동 추출된 음절 n-gram저오 기반 기계적 계산 과정을 거쳐 오류 교정 구현, 구축관리 용이 정확도↑, 오류율↑ # 본 게시글은 자연어처리 바이블을 읽고 게시하였습니다 # 2020. 10. 15.
3장 언어학의 기본 원리 언어학의 기본원리 음절 - 언어를 말하고 들을 때, 하나의 덩어리로 여겨지는 가장 작은 발화의 단위 ex) 아,오,이,에 형태소 - 언어에서 의미를 가지는 최소 단위 명사, 동사, 형용사, 부사 ex) '나', '컴퓨터', 어절 - 한 개 이상의 형태소가 모여 구성된 단위 품사 - 문장 내에서 해당 단어가 수행하는 역할 구구조 - 문장을 구성하고 있는 요소들이 서로 끌어당겨 한 덩어리가 됨으로써 형성되는 일정한 구조 한국어는 문장 안에서 단어의 배열이 비교적 자유롭기 때문에 보통 쓰이지 않음 # 본 게시글은 자연어처리 바이블을 읽고 게시하였습니다 # 2020. 10. 15.
반응형