반응형
확률의 기초
- 확률
- 어떠한 사건이 발생할 수 있는 가능성을 수치로 나타낸 것
확률변수
- 확률변수(random variable)
- 특정 확률로 발생하는 각각의 결과를 수치적 값으로 표현한 값
- ex) 두 개의 동전을 던질 때
- Ω= { HH, HT,TH,TT }
- P(X=사건)=확률
- 표본공간(samplespace)
- 어떤 시행에서 일어날 수 있는 모든 결과들의 집합
- ex) 두 동전이 모두 앞면이 나오는 확률
- P(X=HH)=P(X=2)=14
확률 변수와 확률 분포
- 이산 확률 변수(discrete random variables)
- 확률 변수 X가 취할 수 있는 값들이 이산적으로 셀 수 있는 경우
- 확률 분포(probability distribution)
- 확률 변수가 특정한 값을 가질 확률을 나타내는 함수
- 이산 확률 분포(discrete probability distribution)
- 확률 변수가 이산 확률 변수인 경우
- 연속 확률 변수(continuous random variable)
- 확률 변수 X가 취할 수 있는 값들이 어떤 범위로 주어지는 경우
- 연속 확률 분포(continuous probability distribution)
- 확률 변수가 연속 확률 변수인 경우
- 확률 밀도 함수(probability density function)
- x에서의 확률이 아니라 상대적인 밀도를 나타내는 것
조건부 확률(conditional probability)
- 조건부 확률
- 어떤 사상 A가 일어났다고 가정한 상태에서 사상 B가 일어날 확률
- P(B|A)=P(A∩B)P(A)
- 어떤 사상 A가 일어났다고 가정한 상태에서 사상 B가 일어날 확률

- 사건이 3개 이상인 경우
- P(A∩B∩C)=P(A)P(B|A)P(C|C|A∩B)
- P(A1∩...∩An)=P(A1)P(A2|A1)...P(An|A1∩A2∩...∩An−1)
- 이러한 사상들의 표현을 연괘규칙(cain rule)이라 부른다.
기댓값과 분산
- 기댓값
- 일종의 평균
- 각 확률변수가 특정 값을 가질 확률들을 가중치로 확률변수의 결과 값을 평균 낸 값
- 이산 확률 변수의 기댓값
- E(X)=Σxxp(x)
- 연속 확률 변수의 기댓값
- E(X)=∫+∞−∞xf(x)dx
- 분산(variance)
- 확률 분포에서 확률 변수들의 퍼져있는 정도
- 편차 제곱의 평균
- $Var(X) = E[(X-E(X))^2]
- 제곱의 평균-평균의 제곱
- Var(X)=E(X2)−E2(X)
- 편차 제곱의 평균
- 확률 분포에서 확률 변수들의 퍼져있는 정도
- 편차
- 각각의 값이 그 평균값에서 얼마나 떨어져 있는지
- 표준편차(standard deviation)
- 분산의 제곱근
- 평균 - μ
- 분산 - σ2
- 표준편차 - σ
이항분포, 다항분포, 정규분포
- 이항분포(binomial distribution)
- 확률이 p인 베르누이 실행을 n번 반복시행할 때 출현 횟수를 나타내는 확률변수 X의 분포
- 이항분포의 확률 질량 함수식
- f(θ;n,p)=nCkPk(1−p)n−k,nCk=n!k!(n−k!)
- 이항분포의 표현, 평균, 분산
- B(n,p), np , np(1−p)
- 다항분포(Mulinomial Distribution)
- 이항분포의 일반화
- 다항분포의 확률 질량 함수
- F(x1,...,xk;n,p1,...,pk)=n!x1!,...,xk!px11...pxkk
- 평균 - E(xi)=npi
- 분산 - Var(xi)=npi(1−pi)
- F(x1,...,xk;n,p1,...,pk)=n!x1!,...,xk!px11...pxkk
- 정규분포(Normal Distriution) - 가우시안 분포(Gaussiandistribution)
- 연속 확률 분포중의 하나
- f(x;μ,σ)=1σ√2πe−(x−μ)22σ2
- 평균 - μ
- 분산 - σ2
- Maximum Likelibood Estimation(MLE)
- Maximum a Posteriori Estimation(MAP)
# 본 게시글은 자연어처리 바이블을 읽고 게시하였습니다 #
반응형
'----------책---------- > 자연어처리 바이블' 카테고리의 다른 글
6장 구문 분석 (0) | 2020.10.19 |
---|---|
5장 어휘 분석 (0) | 2020.10.19 |
4장 텍스트의 전처리 (0) | 2020.10.15 |
3장 언어학의 기본 원리 (0) | 2020.10.15 |
1장 자연어처리의 기본 (0) | 2020.09.10 |
댓글