Sunumdan Veri Dağıtım Ölçütlerine Öğrenme İstatistikleri

İstatistik, veri toplama, işleme, analiz ve sunumu inceleyen matematiksel bir bilimdir. İstatistikler, sigorta şirketlerinde yaygın olarak kullanılmaktadır ve bunlardan biri, bir sigorta poliçesindeki prim miktarını belirlemektir. Her sigortalı, prim adı verilen bir katkı payı ödemek zorundadır. Ödenen prim, aldığı sigorta teminatına uygundur.

Burada sigorta şirketi, prim miktarının sigortalıya sağlanabilecek teminat miktarına uygun olması için istatistik kullanır. Bu şekilde, her iki taraf da bundan faydalanır.

Daha önce de belirtildiği gibi, istatistikler yalnızca veri toplamak ve işlemekle kalmaz, aynı zamanda verileri sunar. İstatistikler ayrıca verilerin işlenmesinde çeşitli veri dağıtım önlemleri kullanır. Bugün, sunum türlerini ve verilerin istatistikteki yayılma boyutunu tartışacağız.

Veri Sunum Türleri

İstatistiklerdeki veri sunumu türleri arasında frekans dağılım tabloları, histogramlar, çokgenler ve öğeler bulunur.

Veri sunumunun ilk şekli, bir frekans dağılım tablosu kullanmaktır. Adından da anlaşılacağı gibi, elde edilen verilerin türünü ve miktarını görüntülemek için tablolar kullanıyoruz. Sıklık dağılım tablosunun ayrıca birkaç türü vardır, yani tek veri ve grup verileri için frekans dağılım tablosu.

(Ayrıca şunu okuyun: İstatistiklerde İki Ölçüm Verisi)

En az 30'dan az veri olmak üzere küçük miktarlarda veri sunmak için tek bir veri frekansı dağıtım tablosu kullanılır. Tek bir veri frekansı dağıtım tablosu kullanarak veri sunmanın bir örneği aşağıdaki gibidir.

Aşağıdaki veriler 30 öğrencinin test puanlarıdır. Tek bir veri frekansı dağıtım tablosunda sunun!

4 8 7 9 10 3 4 6 7 6 5 7 7 8 9 6 6 8 7 9 4 5 6 7 8 10 4 5 6 7

Dikkat edersek alınan en düşük test puanı 3, en yüksek puan 10'dur. Daha sonra bu puanlardan aldığı öğrenci sayısı hesaplanır. 3'lük bir not için, örneğin sadece 1 öğrenci. 4. sınıf için 4 öğrenci vesaire vardır. Bu rakam daha sonra aşağıdaki gibi bir tabloda sunulur.

açık deniz rüzgar çiftliği zeminindeki türbinler

Bir sonraki tip frekans dağılım tablosu, grup veri frekans dağılım tablosudur. Bu tablo, 30'dan fazla veri içeren çok sayıda veriyi sunmak için kullanılır. Aşağıdaki örneğe bakalım.

Aşağıdakiler, bir biber plantasyonundaki acı biber bitkilerinin yüksekliğidir (milimetre cinsinden). Verileri bir grup veri dağıtım tablosunda sunun!

123131120128126124125122

121126124123122120125126

123123134125125126128135

120126124133126127123126

122125123132124132128124

Tek verilerin aksine, burada tabloda gösterilecek sınıfların sayısını ve sınıf uzunluklarını hesaplamamız gerekiyor. Yukarıdaki verileri kullanarak, işte hesaplamalar.

Çok sayıda veri (n) = 40

Maksimum yükseklik (x maks ) = 135

Minimum yükseklik (x min ) = 120

Aralık (J) = x maks  - x min = 135 - 120 = 15

Sınıf sayısı (k) = 1 + 3,3logn = 1 + 3,3 log40 = 6,2868… ≈ k = 6

Sınıf uzunluğu (c) = J / k = 15/6 = 2.5 ≈ c = 3

Bu sonuçlardan grup veri dağılım tablosunu aşağıdaki gibi görüntüleyebiliriz.

açık deniz rüzgar çiftliği zeminindeki türbinler

Daha sonra, diğer gruplanmış veri sunum türlerini, yani histogramlar, frekans poligonları ve ogivler şeklinde tartışacağız. 80 spor kulübü üyesinin ağırlık bilgilerini içeren aşağıdaki frekans tablosuna bir göz atın.

açık deniz rüzgar çiftliği zeminindeki türbinler

Bir histogram grafiği kullanarak verileri sunmak için, önce bir Kartezyen grafik oluşturuyoruz. X ekseni, her bir sınıfın üst ve alt sınırlarını gösterirken, y ekseni frekansı gösterir.

istatistik4 (1)

Histogramdan farklı olarak, bir frekans poligon grafiği, sınıf aralığının ortalama değerini alır ve bunu frekansa göre çizgilerle görüntüler.

istatistik5 (1)

Son olarak, veri sunumu pozitif kümülatif veya negatif bir frekans eğrisi kullanır. İlk olarak, y eksenindeki her aralık sınıfının kümülatif frekans değerlerini işaretleyin. Ardından, aralık sınıfı ve kümülatif frekansın üst sınır çiftlerine göre noktaların koordinatlarını işaretleyin. Noktaları düzgün bir eğri halinde birleştirin.

Veri Yayılma Boyutu

İstatistikte, iki tür veri ölçümü vardır: veri konsantrasyonunun boyutu ve veri dağılımının boyutu. Açıklama ve fark nedir?

Veri merkezi boyutu, verilerin konumunu temsil eden bir değerdir. Veri merkezli ölçümde ortalama, mod ve medyan vardır.

Ortalama veya ortalama, çok sayıda veri içeren gözlemlenen tüm verilerin toplamı arasındaki bölümdür. Ortalamayı aşağıdaki gibi formüle edebiliriz.

Ortalama = (Tüm verilerin toplamı) / (Çok sayıda veri)

Daha iyi anlamak için aşağıdaki örnek problem üzerinde çalışalım. 5 kişinin çevrelerindeki sosyal aktiviteler için ihtiyaç duyduğu haftalık saat sayısı 10, 7, 13, 20 ve 15 saattir. Sosyal aktivitelere harcadıkları haftada ortalama saat sayısını belirleyin!

Yukarıdaki problemlerden yola çıkarak sayıları aşağıdaki gibi formüle girebiliriz.

Ortalama = (10 + 7 + 13 + 20 + 15) / 5 = 65/5 = 13

Bu, sosyal aktivitelere harcadıkları ortalama saatin 13 saat olduğu anlamına gelir.

Ortalama veya ortalamanın yanı sıra, modlar da vardır. Mod, verilerde en sık görünen değerdir. Aşağıdaki problemin bir örneğine bakalım.

Aşağıda bazı 7. sınıf öğrencilerinin ağırlık verileri (kilogram cinsinden) verilmiştir: Verilerin modunu belirleyin!

32, 35, 33, 32, 34, 31, 35, 35, 31, 34, 35, 3

Her şeyden önce, her bir değerin verilerde kaç kez göründüğünü saymalıyız. Bu verilere dayanarak 31 (x3), 32 (x2), 33 (x1), 34 (x2) ve 35 (x4) elde ederiz. En sık 35 meydana geldiğinden, yukarıdaki verilerin modu 35'tir.

Son veri merkezli ölçü türü medyandır. Medyan, verileri iki eşit parçaya böler, böylece medyan, sıralanan verilerin orta değeri olur.

Medyanı belirlemek için, önce tüm verileri artan veya azalan düzende sıralamamız gerekir. İkinci olarak, birçok veriyi tanımlayın ve "n" olarak sembolize edin. N tuhafsa, kullandığımız formül aşağıdaki gibidir.

Medyan = veri numarası - ((n + 1) / 2)

Bu arada, n çift ise aşağıdaki formülü kullanırız.

Medyan = (veri ith (n / 2) + veri ith (n / 2 + 1)) / 2

İstatistiklerdeki ikinci veri ölçümü, verilerin yayılmasının bir ölçüsüdür. Veri yayılımının boyutu, verilerin veri merkezinden ne kadar uzakta olduğunu belirten bir değerdir. Veri dağılımının boyutu, aralık, çeyreklik ve çeyrekler arası aralıktan oluşur.

Aralık, en büyük veri değeri ile en küçük veri değeri arasındaki farktır. En küçük veriden en büyük veriyi çıkararak ulaşabiliriz. Örneğin bir sınıfta en uzun öğrencinin boyu 160 cm, en kısa öğrencinin boyu 143 cm ise 23 cm uzanacağız.

Bu arada, çeyrek, istatistiksel verilerin dört eşit parçaya gruplandırılmasıdır. Çeyrek büyüklüğü 3'e bölünür, yani alt çeyrek (Q 1 ), orta çeyrek (Q 2 veya medyan) ve üst çeyrek (Q 3 ). Her çeyreği belirlemek için atmamız gereken birkaç adım var.

İlk olarak, verileri artan veya azalan düzende sıralayın. İkinci olarak, verilerin orta veya medyan değerini belirleyin. Üçüncü olarak, medyanın (Q 2) altındaki veri grubunun ortalama değeri olan alt çeyrekliği (Q 1 ) belirleyin . Son olarak, medyanın (Q 2) üzerindeki veri setinin ortalama değeri olan üst çeyreği (Q 3 ) belirleyin .

Son veri dağıtım ölçüsü türü, çeyrekler arası aralıktır. Çeyrekler arası aralık, üst ve alt çeyrekler arasındaki farktır. Formül aşağıdaki gibidir.

Q d = Q 3 - Q 1