Processing math: 100%
본문 바로가기
----------책----------/자연어처리 바이블

2장 자연어처리를 위한 수학

by 탶선 2020. 9. 13.
반응형

 

확률의 기초

  • 확률
    • 어떠한 사건이 발생할 수 있는 가능성을 수치로 나타낸 것

확률변수

  • 확률변수(random variable)
    • 특정 확률로 발생하는 각각의 결과를 수치적 값으로 표현한 값
    • ex) 두 개의 동전을 던질 때
      • Ω= { HH, HT,TH,TT
      • P(X=사건)=확률
  • 표본공간(samplespace)
    • 어떤 시행에서 일어날 수 있는 모든 결과들의 집합
    • ex) 두 동전이 모두 앞면이 나오는 확률
    • P(X=HH)=P(X=2)=14

 

확률 변수와 확률 분포

  • 이산 확률 변수(discrete random variables)
    • 확률 변수 X가 취할 수 있는 값들이 이산적으로 셀 수 있는 경우
  • 확률 분포(probability distribution)
    • 확률 변수가 특정한 값을 가질 확률을 나타내는 함수
  • 이산 확률 분포(discrete probability distribution)
    • 확률 변수가 이산 확률 변수인 경우
  • 연속 확률 변수(continuous random variable)
    • 확률 변수 X가 취할 수 있는 값들이 어떤 범위로 주어지는 경우
  • 연속 확률 분포(continuous probability distribution)
    • 확률 변수가 연속 확률 변수인 경우
  • 확률 밀도 함수(probability density function)
    • x에서의 확률이 아니라 상대적인 밀도를 나타내는 것

 

조건부 확률(conditional probability)

  • 조건부 확률
    • 어떤 사상 A가 일어났다고 가정한 상태에서 사상 B가 일어날 확률
      • P(B|A)=P(AB)P(A)

조건부 확률 ... 출처 : https://m.blog.naver.com/PostView.nhn?blogId=mykepzzang&logNo=220834864348&proxyReferer=https:%2F%2Fwww.google.com%2F

  • 사건이 3개 이상인 경우
    • P(ABC)=P(A)P(B|A)P(C|C|AB)
    • P(A1...An)=P(A1)P(A2|A1)...P(An|A1A2...An1)
    • 이러한 사상들의 표현을 연괘규칙(cain rule)이라 부른다.

 

기댓값과 분산

  • 기댓값
    • 일종의 평균
    • 각 확률변수가 특정 값을 가질 확률들을 가중치로 확률변수의 결과 값을 평균 낸 값
    • 이산 확률 변수의 기댓값
      • E(X)=Σxxp(x)
    • 연속 확률 변수의 기댓값
      • E(X)=+xf(x)dx
    • 분산(variance)
      • 확률 분포에서 확률 변수들의 퍼져있는 정도
        • 편차 제곱의 평균
          • $Var(X) = E[(X-E(X))^2]
        • 제곱의 평균-평균의 제곱
          • Var(X)=E(X2)E2(X)
    • 편차
      • 각각의 값이 그 평균값에서 얼마나 떨어져 있는지 
    • 표준편차(standard deviation)
      • 분산의 제곱근
    • 평균 - μ
    • 분산 - σ2
    • 표준편차 - σ

 

이항분포, 다항분포, 정규분포

  • 이항분포(binomial distribution)
    • 확률이 p인 베르누이 실행을 n번 반복시행할 때 출현 횟수를 나타내는 확률변수 X의 분포
    • 이항분포의 확률 질량 함수식
      • f(θ;n,p)=nCkPk(1p)nk,nCk=n!k!(nk!)
    • 이항분포의 표현, 평균, 분산
      • B(n,p), np , np(1p)
  • 다항분포(Mulinomial Distribution)
    • 이항분포의 일반화
    • 다항분포의 확률 질량 함수
      • F(x1,...,xk;n,p1,...,pk)=n!x1!,...,xk!px11...pxkk
        • 평균 - E(xi)=npi
        • 분산 - Var(xi)=npi(1pi)
  • 정규분포(Normal Distriution) - 가우시안 분포(Gaussiandistribution)
    • 연속 확률 분포중의 하나
    • f(x;μ,σ)=1σ2πe(xμ)22σ2
      • 평균 - μ
      • 분산 - σ2

 

  • Maximum Likelibood Estimation(MLE)
  • Maximum a Posteriori Estimation(MAP)

 

 

# 본 게시글은 자연어처리 바이블을 읽고 게시하였습니다 #

반응형

'----------책---------- > 자연어처리 바이블' 카테고리의 다른 글

6장 구문 분석  (0) 2020.10.19
5장 어휘 분석  (0) 2020.10.19
4장 텍스트의 전처리  (0) 2020.10.15
3장 언어학의 기본 원리  (0) 2020.10.15
1장 자연어처리의 기본  (0) 2020.09.10

댓글