Sampling Distributions & Central Limit Theorem, Normal Approximation terhadap Binomial Distributions

Nama : Diotama Saputra

Npm : 19316034






Mengapa dilakukan pengambilan sampel ?


Motivasi


Kamu bekerja di bagian marketing sebuah perusahaan skin care di negara X. Ingin membuat strategi marketing yang baru. Kamu ingin mengetahui berapa uang yang dikeluarkan oleh wanita di negara X per bulannya untuk skin care. Apa yang akan kamu lakukan ?




Collect data




Sampling Distribution



Bagaimana melakukan interpretasi dari hasil sampel ?

Populasi 

Parameter: ukuran yang sesungguhnya. Nilainya tidak berubah. Contoh: μ,σ, dll


Sampel 

Statistik: ukuran yang diperoleh dari sampel. Contoh: x ̅, s, dll. Nilainya dapat berubah untuk setiap random sampel yang diambil




Menentukan Distribusi Sampel



Lakukan pengambilan sebanyak 1 kali

  • Tentukan semua kemungkinan hasil
  • Hitung peluang semua kemungkinan hasil
  • Buatlah plot untuk peluang semua kemungkinan hasil


Lakukan pengambilan sebanyak 2 kali

  • Tentukan semua kemungkinan sampel mean (x ̅)
  • Hitung peluang semua kemungkinan sampel mean (x ̅)
  • Buatlah plot untuk peluang semua kemungkinan sampel mean (x ̅)


Lakukan pengambilan sebanyak 3 kali

  • Tentukan semua kemungkinan sampel mean (x ̅)
  • Hitung peluang semua kemungkinan sampel mean (x ̅)
  • Buatlah plot untuk peluang semua kemungkinan sampel mean (x ̅)






Central Limit Theorem



Contoh 1

Durasi seorang penderita penyakit Alzheimer sejak ditemukannya gejala hingga kematian memiliki rata-rata 8 tahun dan standar deviasi 4 tahun. Seorang administrator dari sebuah medical center mencatat 30 record dari penderita Alzheimer. Tentukan peluang :

  • Rata-rata durasi mereka lebih sedikit dari 7 tahun
  • Rata-rata durasi mereka melebihi 7 tahun
  • Rata-rata durasi mereka berjarak kurang dari 1 tahun dari rata-rata populasi


Contoh 2


Misalkan X menyatakan durasi waktu (dalam menit) kedatangan seorang calon penumpang di halte bus setelah pukul 12.00. X berdistribusi uniform di antara 0 hingga 3 menit. Misalkan sebuah sampling dilakukan terhadap 40 calon penumpang dengan mencatat waktu kedatangan mereka.

  • Buatlah sketsa distribusi dari rata-rata sampel waktu kedatangan penumpang X ̅ 
  • Berapakah peluang rata-rata waktu kedatangan dari 40 sampel tersebut berada di antara 1 hingga 2 menit. 


Distribusi Sampel Untuk Proporsi



Contoh : 

Ingin mengetahui berapa proporsi wanita di negara Indonesia





Properti dari Distribusi Sampel untuk Proporsi Sampel (p ̂)




Random sampel dengan ukuran n dipilih dari populasi dengan parameter proporsi p. Distribusi sampel untuk proporsi sampel p ̂=x/n memiliki rata-rata: p

Dan standar deviasi 



Jika n besar, maka distribusi sampling p ̂ akan mendekati distribusi normal. (penghampiran ini cukup baik jika np>5 dan nq>5)

Distribusi Binomial

Variabel acak dengan distribusi binomial diketahui bersifat diskrit. Ini berarti bahwa ada sejumlah hasil yang dapat dihitung yang dapat terjadi dalam distribusi binomial, dengan pemisahan di antara hasil tersebut. Misalnya, variabel binomial dapat mengambil nilai tiga atau empat, tetapi bukan angka di antara tiga dan empat.

Dengan karakter diskrit dari distribusi binomial, agak mengejutkan bahwa variabel acak kontinu dapat digunakan untuk mendekati distribusi binomial. Untuk banyak distribusi binomial , kita dapat menggunakan distribusi normal untuk memperkirakan probabilitas binomial kita.

Hal ini dapat dilihat saat melihat lemparan koin n dan X adalah jumlah kepala. Dalam situasi ini, kami memiliki distribusi binomial dengan probabilitas keberhasilan sebagai p = 0,5. Saat kita meningkatkan jumlah lemparan, kita melihat bahwa histogram probabilitas memiliki kemiripan yang semakin besar dengan distribusi normal.

Pernyataan Pendekatan Normal

Setiap distribusi normal sepenuhnya ditentukan oleh dua bilangan real . Angka-angka ini adalah mean, yang mengukur pusat distribusi, dan deviasi standar , yang mengukur penyebaran distribusi. Untuk situasi binomial tertentu, kita perlu menentukan distribusi normal mana yang akan digunakan.

Pemilihan distribusi normal yang benar ditentukan oleh jumlah percobaan n dalam pengaturan binomial dan probabilitas konstan keberhasilan p untuk masing-masing percobaan ini. Perkiraan normal untuk variabel binomial kita adalah rata-rata np dan deviasi standar ( np (1 - p ) 0,5 .

Misalnya, kita menebak masing-masing dari 100 pertanyaan tes pilihan ganda, di mana setiap pertanyaan memiliki satu jawaban yang benar dari empat pilihan. Jumlah jawaban benar X merupakan variabel acak binomial dengan n = 100 dan p = 0,25. Jadi variabel acak ini memiliki mean 100 (0,25) = 25 dan standar deviasi (100 (0,25) (0,75)) 0,5 = 4,33. Distribusi normal dengan mean 25 dan deviasi standar 4,33 akan bekerja untuk mendekati distribusi binomial ini.

Kapan Pendekatannya Sesuai?

Dengan menggunakan beberapa matematika dapat ditunjukkan bahwa ada beberapa kondisi yang kita perlukan untuk menggunakan pendekatan normal terhadap distribusi binomial . Jumlah pengamatan n harus cukup besar, dan nilai p sehingga np dan n (1 - p ) lebih besar dari atau sama dengan 10. Ini adalah aturan praktis, yang dipandu oleh praktik statistik. Pendekatan normal selalu dapat digunakan, tetapi jika kondisi ini tidak terpenuhi maka perkiraan tersebut mungkin tidak sebaik perkiraan.

Misalnya, jika n = 100 dan p = 0,25 maka kita dibenarkan menggunakan aproksimasi normal. Hal ini karena np = 25 dan n (1 - p ) = 75. Karena kedua bilangan ini lebih besar dari 10, distribusi normal yang sesuai akan cukup baik dalam memperkirakan probabilitas binomial.

Mengapa Menggunakan Approximation?

Probabilitas binomial dihitung dengan menggunakan rumus yang sangat mudah untuk mencari koefisien binomial. Sayangnya, karena faktorial dalam rumus, sangat mudah mengalami kesulitan komputasi dengan rumus binomial . Perkiraan normal memungkinkan kita untuk melewati salah satu masalah ini dengan bekerja dengan teman yang sudah dikenal, tabel nilai distribusi normal standar.

Seringkali penentuan probabilitas bahwa variabel acak binomial berada dalam kisaran nilai yang membosankan untuk dihitung. Ini karena untuk mencari probabilitas variabel binomial X lebih besar dari 3 dan kurang dari 10, kita perlu mencari probabilitas bahwa X sama dengan 4, 5, 6, 7, 8, dan 9, lalu menjumlahkan semua probabilitas ini. bersama. Jika aproksimasi normal dapat digunakan, kita perlu menentukan skor-z yang sesuai dengan 3 dan 10, dan kemudian menggunakan tabel probabilitas skor-z untuk distribusi normal standar .




Komentar

Postingan populer dari blog ini

Analisis dan pemodelan perangkat lunak

penelitian