Chwartel

Oddi ar testwiki
Neidio i'r panel llywio Neidio i'r bar chwilio

Yn ystadegaeth, mae chwartel yn fath o ganradd sy'n rhannu nifer y pwyntiau data yn bedair rhan, neu chwarteri, o faint mwy-neu-lau cyfartal. Er mwyn cyfrifo chwarteli, rhaid trefnu'r data o'r gwerth lleiaf i'r mwyaf. Y pum chwartel yw:

Plot bocs (gyda chwarteli ac amrediad rhyngchwartel) a ffwythiant dwysedd tebygolrwydd dosraniad Normal N(0,1)
  • Q0: y minimwm, neu'r isafbwynt. Does dim data sy'n llai na'r gwerth hwn.
  • Q1: y chwartel cyntaf, y chwartel isaf, neu'r 25eg canradd. Mae 25% o'r data yn llai na'r gwerth hwn.
  • Q2: y canolrif, yr ail chwartel, neu'r 50eg canradd. Mae 50% o'r data yn llai na'r gwerth hwn.
  • Q3: y trydydd chwartel, y chwartel uchaf, neu'r 75eg canradd. Mae 75% o'r data yn llai na'r gwerth hwn.
  • Q5: y macsimwm, neu'r uchafbwynt. Mae 100% o'r data yn llai na'r gwerth hwn.[1]

Mae'r pum chwartel a ddisgrifir uchod yn rhoi crynodeb pum rhif y data. Mae'r crynodeb hwn yn bwysig mewn ystadegaeth oherwydd ei fod yn darparu gwybodaeth am ganol, lledaeniad, a siâp y data. Mae gwybod y chwartel isaf ac uchaf yn darparu gwybodaeth ar ba mor fawr yw'r amrywiant ac os yw'r set ddata wedi'i sgiwio tuag un ochr. Gan fod chwarteli yn rhannu nifer y pwyntiau data yn gyfartal, nid yw'r amrediad yr un peth rhwng chwarteli (hy, Q3-Q2Q2-Q1), ac mae cymharu'r amrediadau hyn yn gallu rhoi gwybodaeth am sgiwedd y data. Mae'r amrediad rhyngchwartel (IQR), sef Q3-Q1, yn mesur arall o ledaeniad y data sy'n rhoi amrediad 50% canol y data. Mae cymharu hwn gyda'r amrediad Q5-Q0 yn gallu rhoi gwybodaeth am gwrtosis y data. Yn ogystal gall yr amrediad rhyngchwartel rhoi mwy o wybodaeth na'r amrediad ei hun, gan ei fod yn anwybyddu presenoldeb allanolion.[2]

Dulliau cyfrifo

Dosraniadau tebygolrwydd di-dor

Chwarteli ar ffwythiant dosraniad cronnus y dosraniad Normal

Os ydym yn diffinio dosraniad tebygolrwydd di-dor fel P(X) lle mae X yn hapnewidyn gwerth real, yna rhoddir ei ffwythiant dosraniad cronnus (CDF) gan,

F(x)=P(Xx).[1]

Mae'r CDF yn rhoi'r tebygolrwydd y bydd y newidyn ar hap X yn llai na'r gwerth x. Felly, y chwartel cyntaf yw gwerth x pan mae F(x)=0.25, yr ail chwartel yw x pan mae F(x)=0.5, a'r trydydd chwartel yw x pan mae F(x)=0.75.[3] Gallwn canfod y gwerthoedd x hyn gyda'r ffwythiant canradd Q(p), sef ffwythiant gwrthdro'r CDF, Q=F1. Yna'r chwartel cyntaf yw Q(0.25), yr ail chwartel yw Q(0.5), a'r trydydd chwartel yw Q(0.75).

Dosraniadau arwahanol

Ar gyfer dosraniadau arwahanol, nid oes cytundeb cyffredinol ar sut i ddewis y gwerthoedd chwartel.[4] Mae'n dibynnu os defnyddir anhafaleddau caeth neu beidio (⩽ neu <).

Dull 1

  1. Defnyddiwch y canolrif i rannu'r set ddata trefnedig yn ddau hanner.
    • Os oes odrif o bwyntiau data yn y set ddata trefnedig gwreiddiol, peidiwch â chynnwys y canolrif yn y naill hanner.
    • Os oes eilrif o bwyntiau data yn y set ddata trefnedig gwreiddiol, rhannwch y set ddata hon yn union yn ei hanner.
  2. Gwerth y chwartel isaf yw canolrif hanner isaf y data. Gwerth y chwartel uchaf yw canolrif hanner uchaf y data.

Dull 2

  1. Defnyddiwch y canolrif i rannu'r set ddata trefnedig yn ddau hanner.
    • Os oes odrif o bwyntiau data yn y set ddata trefnedig gwreiddiol, rhaid cynnwys y canolrif yn y ddau hanner.
    • Os oes eilrif o bwyntiau data yn y set ddata trefnedig gwreiddiol, rhannwch y set ddata hon yn union yn ei hanner.
  2. Gwerth y chwartel isaf yw canolrif hanner isaf y data. Gwerth y chwartel uchaf yw canolrif hanner uchaf y data.

Dull 3

  1. Os oes eilrif o bwyntiau data, yna mae Dull 3 yr un peth â'r naill ddull neu'r llall.
  2. Os oes (4n+1) o bwyntiau data, yna bydd y chwartel isaf yn 0.75 lluosi'r o'r nfed gwerth adio â 0.25 lluosi'r (n+1)fed gwerth; y chwartel uchaf yw 0.75 lluosi'r (3n+1)fed gwerth adio 0.25 lluosi'r (3n+2)fed gwerth.
  3. Os oes (4n+3) pwynt data, yna'r chwartel isaf yw 0.75 lluosi'r (n+1)fed gwerth adio 0.25 lluosi'r (n+2)fed gwerth; y chwartel uchaf yw 0.25 lluosi'r (3n+2)fed gwerth adio 0.75 lluosi'r (3n+3)fed gwerth.

Enghraifft 1

Set data mewn trefn: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49

Dull 1 Dull 2 Dull 3
C 1 15 25.5 20.25
C 2 40 40 40
C 3 43 42.5 42.75

Enghraifft 2

Set data mewn trefn: 7, 15, 36, 39, 40, 41

Gan fod yna eilrif o bwyntiau data, mae'r tri dull i gyd yn rhoi'r un canlyniadau.

Dull 1 Dull 2 Dull 3
C 1 15 15 15
C 2 37.5 37.5 37.5
C 3 40 40 40

Cyfeiriadau