반응형

통계 3

회귀분석(1) - RSS가 최소가 되도록하는 OLS

회귀분석은 머신러닝을 배울 때 첫 날 배웠던 개념인데, 통계에서 배우면서 더 깊이 이해하게 되었다. 회귀분석은 지도학습 중 연속된 종속변수를 예측하는 분석이다. [머신러닝 참고] Orange3로 코딩없이 머신러닝 지도학습 실습해보기 이고잉님의 머신러닝 야학을 듣고 이해한 내용을 바탕으로 작성했습니다. 잘못된 부분은 댓글로 알려주세요. 머신러닝 야학 들으러가기 👉🏻 Orange3는 데이터분석을 쉽게 해볼 수 있도록 도와� hanawithdata.tistory.com 회귀분석이란 회귀분석의 목적은 주어진 독립변수(X) 로 종속변수(y)를 예측하는 것이다. 선형 회귀분석이란 직선형태의 추세선을 구하는 것이고 으로 표현할 수 있다. 위 이미지처럼 실제 값(빨간점)이 선형적으로 분포하지..

Excel 로 표본 데이터의 신뢰 구간 구하기

강의를 듣고 이해한걸 바탕으로 작성되었습니다. 잘못된 부분이 있으면 댓글로 알려주세요! 표본, 신뢰 구간 등의 관계 스토리 수식을 보기에 앞서 이 친구들의 관계를 보자. 표본은 모집단에서 추출한 샘플이라고 보면되는데, 모집단 전수조사가 어려운 경우가 많기 때문에 표본의 통계량으로 모집단을 추정한다. [과정 요약] 표본 통계량 (표본 평균, 표본 분산, 표본 표준편차 등 ) ----> 추정 -----> 모집단은 이런 특성을 가진 집단이래 이 때 오차범위를 함께 제공하는데 그 범위안에 모수가 들어갈 수 도있고, 아닐수도 있음 (신뢰 수준 0%~100%) 오차범위가 크면 신뢰수준이 커지고, 오차범위가 작으면 신뢰 수준도 낮아지는 관계이므로 신뢰 수준을 95% or 99%로 고정하고 오차범위를 구한다. * 오차..

행복 몰빵 vs 잔잔바리 행복

평균으로의 회귀 아주 극단적인 일이 한 번 발생하더라도 원래의 평균 값으로 돌아온다는 이론이다. 극단적으로 키가 큰 196cm 아빠한테 나온 자식의 키가 그 이상으로 나올 확률은 낮으며 평균보다는 크겠지만, 196cm 와 평균 사이의 키로 태어날 확률이 높다! 다른 예로는 로또를 맞은 사람의 행복이 2년이면 원래 그사람이 가지고 있던 행복에 다시 가까워진다는 것이다! 큰 수의 법칙 표본이 작을 때는 특이 값을 가지는 경우가 발생할 확률이 높지만, 표본이 커질 수록 원래의 확률을 따라간다는 법칙 예를 들어 주사위를 던질 때 초반에 10번 중에 갑자기 1이 6번이나 나올 수도 있다. 하지만, 1000번을 던진다면 1이 나올 확률은 1/6 에 가까워질 것이다. 느낀점 이걸 배우고 느낀 점은 평소에 잘하자..!..

반응형