2024/09 6

시계열_2주차 복습

1. 서론Box-Jenkins의 ARIMA방법: 시계열을 정상화시키고 자기회귀 모수에 이동평균 모수를 결합하여 예측에 적합한 하나의 통합모형을 구축하는 방법 *평활법/분해법은 고전적인 시계열 기법으로 13,14주차 강의에서 다룰 것임(평활법: 예측과 추세 계절 조정을 위한 이동평균 및 가중 이동평균에 근거한 외삽법)(분해법: 시계열을 추세 순환 계절 및 불규칙 성분으로 나누고 예측을 위해 계절 조정된 시계열을 얻기 위해 회귀분석 및 이동평균 기법들을 사용) 확률적 과정에 기초를 둠-> 구조적  변화보다는 점진적 변화를 공식화하는데 적합 ARIMA 모형의 기본전제 조건 [제약조건] 1. 충분한 자료 필요2. 약한 정상성3. 등간격으로 수집된 적어도 30-50개의 결측값이 없는 관측 값으로 구성 일부 자료 ..

탐자분_기말고사대비

1. 중간고사 부분 중에 계산 하는 거 다시 보기 # 다섯수치요약 summary(score)[-4] quantile(score,c(1/2,1/4,1/8,1/16),type=8) 2. 기말고사 코드 다시 보기  1)  attach(twoway.model1) comparison=matrix(row,ncol=1)%*%matrix(col,nrow=1)/overall 2)  attach(twoway.out) plot(residuals~comparison)  잔차를 비교값과 비교시 1의 기울기를 갖는 것으로 보아 승법적 모형이 적절 이를 가정하는 경우 로그변환 자료를 쓰면, 가법모형이 적절할 수 있을것임 > 로그변환  3)  과별로 성별 분포는? A,B과는 남성이/ C,E과는 여성이/ D,F는 비슷함 Tab1= U..

데이터마이닝_OT

데이터마이닝이란?대용량의 데이터로부터 데이터 내에 존재하는 관계, 패턴, 규칙 등을 탐색하고 모형화함으로써 유용한 지식을 추출하는 일련의 과정 활용분야1) 데이터베이스 마케팅 -목표 마케팅/고객세분화/고객성향변동분석/교차판매/시장바구니분석2) 신용평가-신용거래 대출한도를 결정하는 것이 주요 목표-신용카드/주택할부금융/소비자대출/상업대출3) 통계적 품질관리-불필요한 장기입원이나 보험료 과다청구를 탐지-제조업체에서 불량품 감소를 통한 이윤 증가 추구4) 부정행위 적발신용카드 사기 거래 탐지/부정수표 적발/전화카드 사기거래 탐지/부당 또는 과당 보험료 청구 탐지 관련분야1) 기계학습2) 패턴인식3) 통계학 기법1) 지도학습: 데이터에 목표변수가 존재할 경우2) 비지도학습(=자율학습): 데이터에 목표변수가 존재..

생물통계_OT

[강의 계획서]2. 생존분석의 기본원리3. 모수적 생존함수 추정4.5. 비모수적 생존함수 추정6.7. 비모수적 생존분포의 비교8.9. Cox 비례위험모형10.11. Cox 모형을 활용한 생존함수의 예측12. 시간의존 공변량을 위한 Cox 모형13. 생존분석의 기타 주제 [방법론]카플란-마이어(생존자료의 요약)로그순위 검정법(생존자료의 검정) Cox의 비례위험모형(생존자료의 회귀분석)  주교재http://chrome-extension://efaidnbmnnnibpcajpcglclefindmkaj/https://xsliulab.github.io/Workshop/2021/week3/survival-analysis-book.pdf

SQL_OT

SQL이란?Structured Queryy Language로 데이터베이스와 사용자가 소통하기 위한 언어 원하는 형태의 데이터 와 DB에 저장된 데이터는 같지 않음(원하는형태=structured data(especially, tabular), DB에 저장된 형태=relations(entities)) Q. SQL에는 왜 다른 형태로 저장할까?1) 중복성 & 종속성의 해결을 위해서2) Relational DB & Relational DBMS ?3)  한 가지 통이로딘 구조로 저장된 DB로 부터 다양한 사용자의 요구에 맞는 맞춤형 데이터 생성 가능 SQL은 DBMS와 소통할 때 사용하는 언어 (특히 RDBMS) *MySQL 설치 방법은 밑의 게시글과 동일하게 수행하였음.https://giveme-happyend..

시계열_1주차 복습

1. 이산시계열 vs 연속시계열 (이산시계열만 다룰 예정) 2. 시계열자료분석에서는 Yi가 아닌 Yt에 대해서 다루며, 관측값들이 서로 독립적이지 않고 연관이 되어 있다는 특징을 가진다.  3. 시도표(time series plot)를 그려 전체적인 모습을 확인한다.  4. SAS 문법 중 INTNX('interval',from,number) : from으로부터 number만큼의 interval에 해당하는 날짜값 반환 *초일자 반환예) INTNX('year','18MAR96',2); => 1998.01.01을 반환 참고) _N_ 은 1,2,3,4....을 의미하고, _N_-1은 0,1,2,3...을 의미한다. 5. 시도표의 x축을 꼭 정확한 시간(연도,월)을 기입할 필요는 없다. 따라서 t=_N_;이라고..