본문 바로가기
반응형
4장 확률과 확률분포 추측통계학 - 표본에 내포되어 있는 정보를 이용하여 모집단에 대한 과학적인 추론을 하는 학문 ex) 표본평균으로 모평균에 대한 추론 표본표준편차로써 모표준편차에 대한 추론 확률은 역사적으로 도박으로부터 유래되었다. 확률(probability) - 똑같은 실험을 무수히 많이 반복할 때 어떤 일이 일어나는 비율, 즉 상대도수의 극한적인 개념 표본공간(sample space) - 통계적 실험에서 모든 가능한 실험결과들의 집합 사건(event) - 관심있는 실험결과들의 집합 확률의 고전적 정의 표본공간의 모든 원소가 일어날 가능성이 다 같은 경우에 사상 A의 확률 $ {사상 A에 속하는 원소의 개수 \over 표본공간의 전체 원소의 개수} $ 사상 A가 일어날 확률은 P(A)라고 표기 조합 서로 다른 n개 중 .. 2020. 5. 6.
3장 자료의정리 2 중심위치의 측도 평균 산술평균을 의미, 중심위치의 측도로서 사용( 양적 자료에만 사용) $ 평균 = {x_1 + x_2 + ... + x_n \over n} $ 다른 대부분의 자료값보다 아주 크거나 작은 극단값이 있을 때, 극단값의 영향을 많이 받는다. 모평균 - 모집단의 평균 주어진 자료가 모집단일 경우 평균을 $\mu$ 로 표기 $\mu = {1 \over N}(x_1 + x_2 + ... + x_n) = {1 \over N}\Sigma^N _{i=1} x_i$ 표본평균 - 표본의 평균 $ \bar{x} $ 엑스바라고 읽음 $\bar{x} = {1 \over n}(x_1 + x_2 + ... + x_n) = {1 \over n}\Sigma^n _{i=1} x_i$ 이상점 - 극단값의 통계적 용어 평균.. 2020. 4. 28.
1장 통계학이란 무엇인가? / 2장 자료의 정리 1 통계학(statistics) 자료에 근거하여 자연 또는 사회 제현상에 대한 과학적인 추론과 불확실한 미래를 대비하기 위한 합리적인 의사결정을 하고자 하는 학문. 모집단과 표본 모집단 - 관심의 대상이 되는 모든 개체의 관측값이나 측정값의 집합 표본 - 통계적 처리를 위하여 모집단에서 실제로 추출한 관측값이나 측정값의 집합 유한모집단 - 원소의 수가 유한개일 경우 무한모집단 - 원소의 수가 무한개일 경우 기술통계학과 추측통계학 기술통계학 - 자료를 수집하고 표나 그림 또는 대표값, 변동의 크기 등을 통하여 수집된 자료의 특성을 쉽게 파악할 수 있도록 자료를 정리,요약하는 방법을 다루는 분야 추측통계학 - 정보를 분석하여 모집단의 여러 가지 특성에 대하여 과학적으로 추론하는 방법을 다루는 분야 자료의 종류 .. 2020. 4. 23.
제 3장 유통시장 유통시장 - 발행시장을 통하여 이미 발행된 주식이 거래되는 시장 구체적 시장 2차 시장(secondary market) 횡적 시장 : 자금이 투자자들 사이에서 횡적으로 이동 주식의 시장성과 유동성(언제든지 상환 가능)을 증진 주식의 담보가치를 증가 주식의 공정한 가격 형성 도모 -> 신규 발행 주식의 가치평가시 기초 정보 제공 유통시장의 종류 거래대상물에 따른 분류 주식시장 채권시장 시장조직 형태에 따른 분류 장내시장(stock exchange) 다수의 매매당사자들이 정해진 시간에 규칙에 일정한 규칙에 따라 계속적으로 주식을 매매하는 고도로 조직화된 시장(거래서 시장) - ex) 한국거래소,뉴욕증권거래소 장외시장(over the counter ; OTC) 거래소시장 밖에서 주식의 거래가 이루어지는 시장을.. 2020. 4. 7.
CHAPTER 3 입문용 예제 옵션 파생상품의 일종, 미리 결정된 기간 안에 특정기초자산(옵션을 행사할 때 매수/매도의 대상이 되는 상품, 자산, 물체)을 정해진 가격으로 사고 팔 수 있는 권리 콜 옵션(call option)과 풋 옵션(put option)으로 나뉜다. 내재 변동성(implied volatility) 옵션의 가치와 시장가격이 같도록 하는 sigma 현재 시장에 참여하는 투자자들의 합의 가격 현 시점의 옵션 프리미엄에 반영된 변화 추출 옵션의 시장 가격을 나오게 하는 변동성 값 함수의 입력 변수인 변동성 값을 구하는 작업 수치적 최적화 문제 내재 변동성 계산 블랙-숄즈-머튼 모형 옵션 가격 계산 공식 변동성 값을 입력하여 옵션의 가격 계산 가능 $ C(S_t,K,t,T,r,\sigma) = $ $S_t \cdot N(.. 2020. 3. 23.
파이썬을 활용한 금융공학 레시피 ch1~ch4 Chapter 1. 금융공학이란? 금융(finance) - 대가(이자)를 약속하고 돈을 빌려주거나 빌리는 모든 행위 금융공학(financial engineering) - 수학적 방법론을 이용해 금융시장을 분석하거나 투자처를 결정하는 학문 분야 Chapter 2. 돈의 시간가치(time value of money) 시간에 따라 돈의 가치가 달라지는 것 PV(present value) - 현재가치 FV(future value) - 미래가치 (현재가치 x (1+이자율)) 금융 활동은 돈을 빌려주고 돌려받는 일련의 행위가 포함, 또한 이자를 매개로 한 돈의 시간가치가 고려되어야 함 Chapter3. 파이썬 설치 생략 Chapter 4. 주식, 가격, 지수 롱(long) - 매수(buy) 숏(short) - 매도.. 2020. 3. 19.
CHAPTER 1_ 왜 금융 분석에 파이썬을 사용하는가 파이썬 고수준 객체지향 인터프리터 언어 동적 의미 구조 고수준의 자료구조, 동적 타이핑, 동적 바인딩 특성 - 고속 응용프로그램 개발에 적합 파이썬의 장점 오픈소스 파이썬, 라이브러리 툴 등 오픈 라이센스 아래 소스 코드를 구할 수 있다. 인터프리터 언어 표준 CPython 런타임시 실행 가능한 바이트 코드로 변환 멀티패러다임 객체지향, 명령형 프로그래밍, 함수형 프로그래밍 등 여러 프로그래밍 구현가능 다목적 저수준의 시스템 기능 구현, 고수준의 해석 업무 모두 이용 가능 크로스 플랫폼 윈도우, 리눅스, 맥 등 대부분에서 사용 가능 동적 타입 정적 선언이 아닌 실행 중에 결정되는 동적 데이터 타입 가비지 콜렉션 자동화된 메모리 관리 과학 기술용 표준 라이브러리 모음 NumPy(http://www.nump.. 2020. 3. 18.
CHAPTER 7 RNN을 사용한 문장생성 Language모델의 문장 생성 순서 확률이 가장 높은 단어 선택 결과 일정 확률적 선택 각 후보 단어의 확률에 맞게 선택 샘플링 되는 단어 매번 바뀜 확률분포 출력, 샘플링을 반복 import numpy as np def softmax(x): if x.ndim == 2: x = x - x.max(axis=1, keepdims=True) x = np.exp(x) x /= x.sum(axis=1, keepdims=True) elif x.ndim == 1: x = x - np.max(x) x = np.exp(x) / np.sum(np.exp(x)) return x class BaseModel: def __init__(self): self.params, self.grads = None, None def for.. 2020. 3. 9.
CHAPTER 6 게이트가 추가된 RNN 5장 RNN에서의 문제점 - 시계열 데이터의 장기 의존 관계 학습 어려움(원인 : BPTT에서의 vanishing gradient , exploding gradient ) RNN - 시계열 데이터 $x_t$ 입력시 $h_t$(은닉 상태) 출력 기울기(gradient) 학습해야 할 의미가 있는 정보 과거로 전달, 장기 의존 관계 학습 중간에 정보가 사라지면 가중치 매개변수의 갱신 불가 기울기 소실( vanishing gradient ), 기울기 폭발( exploding gradient )의 원인 기울기 소실 - 기울기가 빠르게 작아지며 일정 수준 이하로 작아지면 가중치 매개변수가 갱신되지 않는 문제 기울기 폭발 - 오버플로를 유발하여 NaN(Not a Number) 유발 해결 방법 기울기 클리핑(gradi.. 2020. 2. 27.
CHAPTER 5 순환 신경망(RNN) 4장까지의 신경망 - feed forward(흐름이 단방향인 신경망) 구성 단순 이해 쉬움 응용 쉬움 시계열 데이터를 잘 다루지 못함 순환 신경망(Recurrent Neural Network)(RNN) 순환하는 경로(닫힌 경로) 순환 경로를 따라 데이터 순환 과거의 정보를 기억 및 최신 데이터로 갱신 가능(시계열 데이터에 적합) $x_{t}$ - 각 시간에 입력되는 벡터( t : 시각 ) 입력 값 - $x_{0}, x_{1},x_{2}, ..., x_{t}, ...)$ 출력 값 - 입력에 대응하여 $(h_{0}, h_{1}, ..., h_{t}, ...) $ 각 시각의 RNN계층은 그 계층으로부터의 입력, 1개 전의 RNN계층으로부터의 출력을 입력받음 -> 두 정보를 바탕으로 현 시각의 출력을 계산 계산.. 2020. 2. 18.
반응형