Postingan

Menampilkan postingan dari Oktober, 2021

Pengukuran Tendensi Sentral, Keberagaman Data dan Posisi Data.

Gambar
A. Tendensi Sentral Measure of Central Tendency dapat didefinisikan sebagai suatu pengukuran nilai yang dapat digunakan untuk merepresentasikan nilai tipikal atau sentral dari suatu dataset.   1. Mean Penjumlahan dari keseluruhan entri. mean memperhitungkan setiap entri dari dataset yang kita miliki. 2. Median Suatu dataset merupakan nilai yang berada di tengah dengan mengacu pada nilai dataset yang sudah terurut. 3. Mode Nilai dari dataset yang memiliki frekuensi kemunculan paling tinggi B. Keberagaman Data Suatu pengukuran nilai yang dapat digunakan untuk merepresentasikan keberagaman atau sebaran data. 1. Range Hasil perhitungan selisih antara nilai tertinggi dengan nilai terrendah pada dataset tersebut. Range  memiliki kelemahan di mana  hanya menyertakan dua nilai saja  dalam proses pengukuran. Contoh : 2. Variansi Hasil perhitungan rerata simpangan tiap entri data pada dataset terhadap nilai mean dari dataset tersebut.   Contoh :  3. Pengukur Deviasi Standar Statistik yang menguk

conditional probability dan aturan perkailan, pengenalan probabilitas dasar dan aturan penjumlahan

    Conditional Probability adalah probabilitas kemunculan suatu event, dengan mengetahui bahwa event lain sudah muncul atau terjadi. P ( B/A) probability of B given A. - Independent Events Dua events adalah independent bila kemunculan dari event yang satu tidak mempengaruhi probability kemunculan event kedua. P(B/A) = P (B) P(A/B) = P(A) - Dependent Events Events yang tidak independent dikenal sebagai dependent events. P(B/A) /= P (B) - The Multiplication Rule Untuk mencari probability dari dua events yang muncul secara berurutan, kita bisa memanfaatkan Multiplication Rule. 1.Probability untuk dua buah events (A dan B) untuk muncul secara berurutan 2 Bilamana kedua events (A dan B) tersebut independent, maka bisa disederhanakan  Probabilitas  Probabilitas adalah sebuah kemungkinan atau peluang yang diperoleh dari suatu peristiwa, ukuran probabilitas atau tingkat ketidakpastian suatu peristiwa yang terjadi di masa depan.  Rentangan dari peluang atau kemungkinan antara 0 hingga 1. Apabi

Visualisasi data dalam statistika

Gambar
  1. Grafik Perbandingan   terdiri dari dua kategori yaitu  Bar Chart  dan  Line Chart Bar Chart  (Diagram Batang) terdiri dari sedikit kategori, bentuknya mudah dipahami dan sifatnya fleksibel atau menyajikan banyak hal. contoh Line Chart ( Diagram Garis), digunakan untuk  non-cyclical data  atau tidak mengandung unsur siklus dan digunakan untuk menyajikan data yang berkesinambungan atau data yang bersifat kontinu. contoh  BACA JUGA K-Means Clustering in Machine Learning : Konsep Dasar Aplikasi atau Tools Machine Learning yang sering digunakan oleh para Data Scientist Jenis-Jenis dan Tipe Machine Learning Serta Cara Kerjanya 2. Grafik Distribusi  terdiri dari  Bar Histogram  dan  Line Histogram .  Bar Histogram  terdiri dari atas  satu variabel  dan memiliki sedikit data poin yang berfungsi untuk menunjukkan frekuensi. Line Histogran  terdiri atas  Satu variabel,  memiliki  banyak  data poin dan memudahkan untuk melihat apakah data berdistribusi normal atau tidak. 3. Grafik Komposisi 

pengumpulan data dalam statistika

 Pengumpulan Data (Data Collection) Census Pengumpulan data dilakukan pada tingkat populasi. Alhasil, akan diperoleh informasi yang sifatnya lengkap. Hanya saja ketika ukuran populasinya sangat besar, maka seringkali census menjadi pilihan yang mahal dan sulit untuk dilakukan Sampling Pengumpulan data dilakukan pada sub bagian dari populasi. Alhasil, informasi yang diperoleh sifatnya tidak lengkap. Pendekatan semacam ini cukup umum ditemui dalam studi statistik. Di sini sample yang baik adalah sample yang dapat merepresentasikan populasinya. Dibutuhkan teknik sampling yang tepat untuk mendapatkan sample yang representatif terhadap populasinya Sampling Error Karena sample merupakan sub bagian dari populasi, maka selisih atau perbedaan nilai antara data sample dan data populasi akan selalu ada. Perbedaan atau selisih nilai ini dikenal dengan istilah sampling error. Bahkan dengan teknik sampling sebaik apapun, sampling error ini tidak dapat dihindarkan Sampling: with/without Repla

Klasifikasi data dalam statistika

  Data dalam statistik dapat dibagi menjadi 3 kelompok, yaitu : Berdasarkan sumber data terbagi data primer dan data sekunder. Berdasarkan jenis data, terbagi menjadi Data Kualitatif dan Kuantitatif, data kuantitatif terbagi menjadi data Diskret dan Kontinu. Berdasarkan skala pengukuran, terbagi menjadi Data Nominal, Data Ordinal, Data Interval dan Data Rasio. Data Berdasarkan Skala Pengukuran Data Nominal : Data berskala nominal adalah data yang diperoleh dengan cara kategorisasi atau klasifikasi. Ciri-cirinya adalah posisi data setara tidak bisa dilakukan operasi matematika (+, -, x, :). Contoh : jenis kelamin, jenis pekerjaan. Data Ordinal : Data berskala ordinal adalah data yang dipeoleh dengan cara kategorisasi atau klasifikasi, tetapi di antara data tersebut terdapat hubungan. Ciri-cirinya adalah posisi data tidak setara dan tidak bisa dilakukan operasi matematika (+, -, x, :). Contoh : kepuasan kerja, motivasi. Data Interval : Data berskala interval adalah data yang diperoleh de