데이터

50,60,40,30,70(점)

6개의 값 전체를 데이터라고 하며 조사항목이 변량(variate)

질적 데이터

카테고리컬 데이터라고도 불리며 혈액형,선호음식,지지정당처럼 헤아릴 수 없는 변량(질적)으로 이루어진것

예>  각 항목에 숫자를 붙였을때 이 숫자를 더하거나 빼는일이 무의미하다.

  1. A형
  2. B형
  3. O형
  4. AB형

양적데이터

숫자를 더하거나 빼는 것에 의미가 있는 변량(양적변량)

이산형데이터

이웃하는 두가지값 예를 들어 주사위 1과 ,주사위 2처럼 중간값이없고

듬성듬성한 값만 얻을 수 있는것

연속성데이터

키의 경우 170과 171사이에  170.2와같은 아무리 세분화를 시켜도

데이터가 모이는 경우


도수분포표

데이터 정리 순서

  • 도수분포표 정리
  • 히스토그램화

용어:


데이터정리예

Step1:정리되지 않는 데이터

수학학원에서 학생 40명에게 쪽지 시험(100점)을 실시하고 정리하였다.

쪽지시험결과





5160803970555196
9282544494774313
3444812888339765
8893884830289257
5221597865803768

하지만 데이터 전체의 경향이나 특징을 알수가 없다.


Ste2:데이터 정렬

그래서 도수분포표로 정리하기로 하였으며 우선 정렬을 하였다.

쪽지시험정렬





1321282830333437
3943444448515152
5455575960656568
7077788080818288
8888929293949697


Step3:계급 폭정라기 (JIS규격)

최대값97
최소값13
R(최대-최소)84
계급수가 5~20의 범위에 있게한다
범위-R계급폭폭(범위/폭)
84184
84242
84516.8
84108.4
84204.2
84501.68

지금 샘플의 크기는 40명이므로 99이하에서 계급의 폭이 큰쪽

10을 선택하는것이 JIS규격에 적합하다.


Step4: 쪽지시험 결과(도수 분포표)

계급(점)계급값(점)도수명상대도수누적상대도수
10~201510.0250.025
20~302530.0750.1
30~403550.1250.225
40~504540.10.325
50~605570.1750.5
60~706540.10.6
70~807530.0750.675
80~908570.1750.85
90~1009560.151
합계
401

참고링크 : http://minhyun0821.com/1-frequency-distribution-table-histogram/