반응형

안녕하세요 

이번 포스팅에서는 논문작성을 위한 통계학 관련 단어와 그 뜻을 알아보겠습니다.

 

 

  1. 조건부 확률 (Conditional probability): 한 사건이 일어났을 때 다른 사건이 일어날 확률을 나타냅니다. A가 일어난 조건하에 B가 일어날 확률을 P(B|A)라고 표기합니다.
  2. 표준 오차 (Standard error): 표본 통계량의 표준 편차를 나타내는 용어로, 표본의 크기가 커질수록 줄어드는 경향이 있습니다.
  3. 편향 (Bias): 예측치나 추정치가 계속해서 참값과 일정한 차이를 보이는 현상을 의미합니다. 이것은 측정 도구나 과정에서 오차가 발생했음을 나타냅니다.
  4. 중앙값 (Median): 자료를 크기 순으로 나열했을 때 가운데에 위치하는 값을 말합니다. 자료의 분포를 나타내는 좋은 지표입니다.
  5. 상관계수 (Correlation coefficient): 두 변수 사이의 상관 관계의 강도와 방향을 측정하는 통계적 지표입니다. -1에서 1 사이의 값을 가집니다.
  6. 정규 분포 (Normal distribution): 많은 자연현상에서 나타나는 확률 분포로, 평균 주위에 대칭적으로 데이터가 분포되어 있습니다.
  7. 변동계수 (Coefficient of Variation): 표준편차를 평균으로 나눈 값으로, 상대적인 데이터의 퍼짐 정도를 나타냅니다.
  8. 카이제곱 검정 (Chi-square test): 관찰된 빈도가 예상된 빈도와 의미있게 다른지를 검정하는 비모수 검정 방법입니다.
  9. 이상치 (Outlier): 대부분의 다른 관측치와는 많이 다른 관측치를 의미합니다. 이상치는 데이터 분석에 영향을 줄 수 있습니다.
  10. 유의수준 (Significance level): 귀무 가설을 잘못 기각할 확률을 나타내는 용어입니다. 일반적으로 0.05나 0.01을 사용합니다.
  11. 잔차 (Residual): 회귀분석에서 관찰값과 모델에 의해 예측된 값 사이의 차이를 의미합니다.
  12. 최대우도추정 (Maximum Likelihood Estimation, MLE): 주어진 데이터에서 모수를 추정하는 방법으로, 주어진 데이터에서 관찰될 확률(우도)이 최대가 되는 모수를 찾는 방법입니다.
  13. 베이즈 정리 (Bayes' theorem): 사전에 알고 있는 정보를 기반으로 특정 사건의 확률을 추정하는 방법입니다.
  14. 확률밀도함수 (Probability Density Function, PDF): 연속 확률 변수의 확률 분포를 나타내는 함수입니다.
  15. 집중 경향 척도 (Measures of central tendency): 데이터 집합의 중심이 어디에 있는지를 나타내는 척도로, 평균, 중앙값, 최빈값 등이 있습니다.
  16. 통계적 추정 (Statistical estimation): 모집단의 특성을 추정하기 위해 표본 데이터를 사용하는 과정을 말합니다.
  17. 분산분석 (Analysis of Variance, ANOVA): 두 개 이상의 그룹 간 평균의 차이가 통계적으로 유의미한지를 검정하는 방법입니다.
  18. 전체분산 (Total variance): 데이터의 전체 변동성을 나타내는 측정치로, 관측값과 평균값의 차이를 제곱하여 합한 값입니다.
  19. 자유도 (Degrees of freedom): 추정에 사용되지 않은 데이터의 개수 또는 독립적으로 변할 수 있는 관찰치의 수를 나타냅니다.
  20. 다중공선성 (Multicollinearity): 회귀분석에서 독립변수들 간에 강한 상관관계가 있는 현상을 의미합니다.
  21. 중심극한정리 (Central Limit Theorem, CLT): 동일한 분포를 가진 독립적인 확률변수들의 평균이 정규분포에 접근한다는 이론입니다.
  22. 확률변수 (Random variable): 확률적인 결과에 대한 수치적인 표현입니다.
  23. 일원 분산 분석 (One-way ANOVA): 한 가지 요인에 따른 평균의 차이를 분석하는 방법입니다.
  24. 최빈값 (Mode): 자료에서 가장 자주 나타나는 값을 의미합니다.
  25. 백분위수 (Percentile): 전체 데이터의 특정 백분율이 이 값 이하에 위치하도록 하는 값입니다.
  26. 사후 검정 (Post-hoc test): 분산분석 등에서 그룹 간 차이가 발견된 후, 어느 그룹이 다른 그룹과 다른지를 구체적으로 알아보기 위해 실시하는 검정입니다.
  27. 동질성 검정 (Homogeneity test): 두 집단 이상의 분산이 동일한지를 검정하는 방법입니다.
  28. 표본 (Sample): 모집단을 대표하는 일부 관찰값을 말합니다.
  29. 비율 (Proportion): 전체 중 특정 조건을 만족하는 경우의 비율을 말합니다.
  30. 카이제곱 분포 (Chi-square distribution): 카이제곱 검정에 사용되는 확률 분포입니다.
  31. 독립성 검정 (Independence test): 두 범주형 변수가 서로 독립적인지를 검정하는 방법입니다.
  32. 유의확률 (P-value): 귀무가설 하에서 현재의 표본 데이터가 관찰될 확률을 나타냅니다.
  33. 신뢰구간 (Confidence Interval, CI): 모수의 참값이 포함될 것으로 예상되는 구간을 말합니다.
  34. 확률분포 (Probability distribution): 확률변수의 가능한 모든 값과 그에 대응하는 확률을 나타낸 것입니다.
  35. 변량 (Variable): 값이 변할 수 있는 항목을 말합니다. 이는 수량적 변수(예: 키, 몸무게 등)와 범주형 변수(예: 성별, 직업 등)로 나뉩니다.
  36. 사분위수 (Quartile): 데이터를 크기 순서대로 정렬했을 때 4등분하는 위치의 값을 말합니다.
  37. 범위 (Range): 자료에서 최대값과 최소값의 차이를 말합니다.
  38. 외삽 (Extrapolation): 알려진 데이터의 범위를 벗어나서 예측값을 추정하는 과정을 말합니다.
  39. 사건 (Event): 특정 확률 실험에서 가능한 결과를 말합니다.
  40. 대표값 (Representative value): 대량의 자료를 대표하는 몇 가지 수치로, 중앙 경향성, 퍼짐 정도, 형태 등을 나타냅니다.
  41. 동일 분포 (Identical distribution): 여러 확률 변수들이 같은 확률 분포를 가지고 있는 것을 말합니다.
  42. 선형회귀 (Linear regression): 두 변수 사이의 관계를 선형 함수로 설명하는 통계적 방법입니다.
  43. 일치추정량 (Consistent estimator): 표본의 크기가 커지면서 참 값에 점점 가까워지는 추정량을 말합니다.
  44. 확률질량함수 (Probability Mass Function, PMF): 이산 확률 변수의 확률 분포를 나타내는 함수입니다.
  45. 변동 (Variation): 데이터가 얼마나 퍼져 있는지를 나타냅니다.
  46. 무작위 추출 (Random sampling): 모집단에서 표본을 무작위로 선택하는 방법입니다.
  47. 등간 척도 (Interval scale): 측정값 사이의 순서뿐만 아니라 차이에도 의미가 있는 척도입니다.
  48. 군집분석 (Cluster analysis): 비슷한 특성을 가진 관측값들을 같은 그룹으로 분류하는 분석 방법입니다.
  49. 로지스틱 회귀분석 (Logistic regression): 종속변수가 범주형 데이터인 경우에 사용하는 회귀분석 방법입니다.
  50. 대응비교 t-검정 (Paired t-test): 동일한 주체에 대한 두 번의 측정값이나 서로 관련된 두 주체의 평균의 차이를 검정하는 방법입니다.
  51. 독립 동일 분포 (Independent and Identically Distributed, IID): 확률변수들이 서로 독립이고 같은 확률 분포를 따르는 것을 말합니다.
  52. 표준화 (Standardization): 데이터의 평균을 0, 표준편차를 1로 만드는 변환 과정을 말합니다.
  53. 카테고리 변수 (Categorical variable): 여러 범주 중 하나에 속하는 값을 가지는 변수를 말합니다.
  54. 계수 (Coefficient): 모델의 각 변수에 대한 가중치를 말합니다.
  55. 원자료 (Raw data): 처리되거나 해석되지 않은 초기 데이터를 말합니다.
  56. 누적분포함수 (Cumulative Distribution Function, CDF): 확률변수가 특정 값 이하가 될 확률을 나타내는 함수입니다.
  57. 공분산 (Covariance): 두 변수가 함께 변하는 정도를 측정하는 통계량입니다.
  58. 최소제곱법 (Least squares method): 회귀선의 오차제곱합을 최소로 하는 선을 찾는 방법입니다.

 

반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기