Pelatihan K3, Konsultan MEP & Infrastruktur
0858-9365-2156
Kebun Jeruk Jakarta Barat

ANALISIS STATISTIK DESKRIPTIF DAN DISTRIBUSI FREKUENSI

  • Home
  • Artikel
  • ANALISIS STATISTIK DESKRIPTIF DAN DISTRIBUSI FREKUENSI

Latar Belakang

Statistika adalah ilmu eksak yang mempelajari bagaimana merencanakan, mengumpulkan, menganalisis, mengolah, menginterpretasi, dan mempresentasikan data. Dengan kata lain, statistika adalah ilmu yang berkenaan dengan data. Istilah ‘statistika’ (bahasa Inggris: statistics) berbeda dengan ‘statistik’ (statistic). Statistika merupakan ilmu yang berkenaan dengan data, sedang statistik adalah data, informasi, atau hasil penerapan algoritma statistika pada suatu data. Dari kumpulan data, statistika dapat digunakan untuk menyimpulkan atau mendeskripsikan data; ini dinamakan statistika deskriptif. Sebagian besar konsep dasar statistika mengasumsikan teori probabilitas. Beberapa istilah statistika antara lain: populasi, sampel, unit sampel, dan probabilitas.

Statistika banyak diterapkan dalam berbagai riset ilmu pengettahuan, dalam berbagai disiplin ilmu, baik ilmu-ilmu alam seperti biologi, pertanian, kedokteran dan ilmu sipil, teknik industri. Selain itu juga pada ilmu-ilmu sosial dan bisnis seperti ekonomi, manajemen, akuntansi sosiologi, komunikasi, hukum dan psikologi. Dalam pemerintahan, statistika memegang peranan sangat penting untuk berbagai macam tujuan seperti grafik pertumbuhan penduduk, jejak pendapat, sensus penduduk, sensus ekonomi dan pertanian. Permanfaatan ilmu statistika di lapangan misalnya peramalam ekonomi, prosedur jajak pendapat atau polling (misalnya dilakukan sebelum pemilihan umum), serta hitung cepat (perhitungan cepat hasil pemilu) atau quick count. Di bidang komputasi, statistika dapat pula diterapkan dalam pengenalan pola maupun kecerdasan buatan.

Penggunaan istilah statistika berakar dari istilah istilah dalam bahasa latin modern statisticum collegium (“dewan negara”) dan bahasa Italia statista yang berarti negarawan atau politikus (Wikipedia.com). Gottfried Achenwall (1749) menggunakan Statistik dalam bahasa Jerman untuk pertama kalinya sebagai nama bagi kegiatan analisis data kenegaraan, dengan mengartikannya sebagai “ilmu tentang negara (state)”. Pada awal abad ke-19 telah terjadi pergeseran arti menjadi “ilmu mengenai pengumpulan dan klasifikasi data”. Sir John Sinclair memperkenalkan nama (Statistics) dan pengertian ini ke dalam bahasa Inggris. Jadi, statistika secara prinsip mula-mula hanya mengurus data yang dipakai lembaga-lembaga administratif dan pemerintahan. Pengumpulan data terus berlanjut, khususnya melalui sensus yang dilakukan secara teratur untuk memberi informasi kependudukan yang berubah setiap saat.

Pada abad ke-19 dan awal abad ke-20 statistika mulai banyak menggunakan bidang- bidang dalam matematika, terutama peluang. Cabang dari ilmu matematika ini sangat luas digunakan untuk mendukung metode ilmiah, statistika inferensi, dikembangkan pada paruh kedua abad ke-19 dan awal abad ke-20 oleh Ronald Fisher (peletak dasar statistika inferensi), Karl Pearson (metode regresi linear), dan William Sealey Gosset (meneliti problem sampel berukuran kecil). Penggunaan statistika pada masa sekarang dapat dikatakan telah menyentuh semua bidang ilmu pengetahuan, mulai dari astronomi hingga linguistika. Bidang-bidang ekonomi, biologi dan cabang-cabang terapannya, serta psikologi banyak dipengaruhi oleh statistika dalam metodologinya. Akibatnya lahirlah ilmu ilmu gabungan seperti ekonometrika, biometrika (atau biostatistika), dan psikometrika.

 

Dasar Statistika

Data dalam statistika mempunyai sifat yang perlu diketahui yaitu:

  1. Fakta berupa angka-angka dalam bentuk kumpulan data, maka ini sudah masuk dalam katgori statistika, dan dapat ditarik suatu kesimpulan. Pada sifat kualitatif seperti kecantikan, kebugaran, kenakalan, kejahatan ketampanan, kekayaan bukan merupakan data angka, dan bukan merupakan data statistika
  2. Data statistika dikumpulkan dengan maksud dan tujuan tertentu dan bisa saja tidak cocok bila untuk maksud tujuan lain. Penggunaan data A yang berada di lokasi kota B, bisa saja tidak cocok bila diterapkan di kota C.
  3. Statistika tidak bermain dengan data individu, melainkan dengan data yang berasal dari kelompok tertentu. Statitika tidak tertarik untuk mengukur tinggi, berat badan, IQ dan kecepatan lari dari seorang individu, namun statistika baru bermakna bila ia mengukur rata-rata tinggi badan, berat badan, dan IQ sejumlah mahasiswa dalam kelas Teknik kampus A.
  4. Hasil statistika adalah hasil yang mendekati kebenaran, bukan 100% kebenaran Kebenaran mutlak 100% hanya milik Allah SWT. Hasil kesimpulan yang ditarik dalam ilmu statistika biasanya hanya dalam bentuk angka dengan ketelitian yang mendekati kebenaran, bukan mutlak karena bensar.
  5. Statistika dapat pula disalahgunakan oleh orang yang tidak bertanggung jawab untuk kepentingan Misalnya dalam tayangan iklan disebutkan bahwa 8 dari 10 orang memakai sabun cair merk A. Bila diperhatikan secara seksama, seringkali kesimpulan itu tidak ditunjang oleh informasi yang memadai seperti lokasi penelitian, jumlah populasi, jumlah sampel, metode yang digunakan dan sebagainya. Kadang juga diberikan informasi, namun kalimat informasi tersebut terlalu kecil di layar TV dan tidak terbaca jelas oleh para pemirsa TV. Dapat pula hasil analisis kurang meyakinkan karena data yang dipakai adalah data tidak jujur, penuh dengan kebohongan dan manipulasi

 

Data Statistika

Data merupakan nilai jamak dari datum. Dalam statistika data adalah sekumpulan informasi yang diperoleh dari suatu pengamatan. Informasi yang diperoleh dari pengamatan itu dapat berupa angka-angka (misalnya tinggi tanaman, lingkar batang tanaman, berat badan, tinggi badan, nilai siswa, nilai proyek, suhu ruangan, nilai perdagangan dan lain-lain) maupun bukan angka (seperti misal data golongan darah, profesi pedagang, mahasiswa, dokter, insinyur, pengacara, dosen, petani, TNI dan lain- lain). Datum ialah nilai tunggal atau elemen-elemen dalam data. Misal informasi yang diperoleh tentang tinggi badan 5 orang siswa dalam cm terdekat ialah 170, 162, 166, 175 dan 164

Skala Pengukuran/Penilaian adalah satuan – satuan ukuran yang digunakan untuk mengolah data mentah (raw data) secara statistika. Skala pengukuran menentukan kesimpulan data setelah diobservasi.

 

A. Pembagian Data Berdasar Sifatnya

Data dapat dibagi menjadi 2 bagian berdasarkan sifatnya yaitu:

  1. Data Kualitatif : Data kualitatif disajikan bukan dalam bentuk bilangan-bilangan (non-numerik) seperti golongan darah, budaya nusantara, bahasa daerah, suku bangsa, ketampanan, kecantikan, jenis kelamin, agama, dan lain-lain
  2. Data Kuantitatif: Data kuantitatif disajikan dalam bentuk angka atau numerik seperti: nilai produk yang dijual, persentase pangsa pasar, nilai proyek yang akan dikerjakan, jumlah fakultas di Universitas X, anggran belanja iklan, jumlah mahasiswa pada program studi ekonomi, data ekspor-impor suatu negara.

 

B. Pembagian Data Menurut Cara Memperolehnya

  1. Data Primer : Data primer merupakan data yang langsung diperoleh peneliti dari lapangan melalui pengamatan, percobaan, pengukuran, survei, dan pengamatan di suatu tempat, lapangan atau laboratorium. Misalnya seorang peneliti ingin mengetahui persentase kenaikan penjualan produk unggulan sebelum dan sesudah tayang iklan di sebuah stasiun televisi.
  2. Data Sekunder : Data sekunder adalah data yang diperoleh secara tidak langsung oleh peneliti, tetapi melalui perantara orang / lembaga lain. Data ini biasanya dalam bentuk grafik, tabel-tabel, data harga produk dan jasa, data nilai proyek dan data produksi. Data yang dipublikasikan oleh lembaga penelitian misalnya LIPI merupakan data sekunder.

 

C. Pembagian Data Menurut Waktu

  1. Data Silang : Data silang merupakan data yang dikumpulkan dalam waktu yang sifatnya sementara. Misalnya data hasil penelitian penjualan kendaraan niaga di kota Semarang tahun 2013, penjualan sepatu sport anak-anak di Kota Bandung.
  2. Data Berkala : Data berkala merupakan data yang dikumpulkan setiap periode tertentu. Misalnya jumlah impor hand phone android layar lebar dari tahun 2010 s/d 2013, jumlah dan nilai import komoditas pertanian tahun 2000 – 2013.

 

D. Pembagian Data Menurut Sumbernya

  1. Data Internal : Data internal merupakan data yang dikumpulkan oleh karyawan atau seksi kerja tertentu dalam lingkungan perusahaan untuk keperluan sendiri. Misalnya data karyawan marketing, mahasiswa, dosen, pegawai, keuangan dan peralatan Universitas X, dan lain-lain.
  2. Data Eksternal : Data eksternal merupakan data yang diambil dari bagian seksi lain, misalnya data Fakultas Y, lalu digunakan oleh lembaga lain, maka data tersebut merupakan data eksternal bagi Lembaga tersebut.

 

Analisis Deskriptif

Deskripsi adalah pemaparan atau penggambaran dengan kata-kata secara jelas dan terperinci (KBBI, 2001:258). Sedangkan statistik deskriptif merupakan alat analisis untuk menjelaskan, meringkas, mereduksi, menyederhanakan, mengorganisasi dan menyajikan data ke dalam bentuk yang teratur, sehingga mudah dibaca, dipahami dan disimpulkan (Wiyono, 2001). Statistik deskriptif digunakan untuk mendeskripsikan suatu keadaan atau masalah agar lebih mudah dipahami.

Analisis deskriptif merupakan analisis yang paling mendasar untuk menggambarkan keadaan data secara umum. Analisis deskriptif ini meliputi beberapa hal, yakni distribusi frekuensi, pengukuran tendensi pusat, dan pengukuran variabilitas (Wiyono, 2001)

Distribusi frekuensi. Distribusi frekuensi merupakan susunan data-data mentah yang acak dan sulit dibaca yang kemudian disusun berdasarkan kategori tertentu dalam suatu daftar secara sistematis agar mudah dipahami. Distribusi frekuensi dibagi menjadi beberapa jenis yaitu distribusi frekuensi secara tidak berkelompok, distribusi rank order, distribusi frekuensi secara berkelompok, dan grafik distribusi.

Pengukuran Tendensi Pusat. Ukuran tendensi pusat merupakan suatu ukuran yang merupakan wakil kumpulan data untuk mendapatkan gambaran yang lebih jelas mengenai data tersebut baik mengenai sampel ataupun populasi. Beberapa macam ukuran tendensi sentral yaitu rata-rata (mean), median dan modus. Tendensi pusat digunakan untuk melihat letak bagian terbesar dalam distribusi.

Pengukuran Variabilitas. Pengukuran variabilitas untuk menggambarkan derajat berpencarnya data kuantitatif. Ukuran ini terdiri atas rentang antarkuartil, simpangan kuartil, rata-rata simpangan, simpangan baku dan koefisien variasi, serta varian. Pengukuran variabilitas berfungsi untukcmengetahui homogenitas atau heterogenitas data. Suatu data bisa saja memiliki nilai tendensi pusat yang sama namun memiliki nilai variansi yang berbeda

Dalam analisis deskriptif, data-data disajikan dalam bentuk tabel, diagram, grafik, dan lain-lain. Hal ini ditujukan untuk mempermudah memahami data-data yang disajikan. Dalam ilmu perencanaan, penggunaan statistik deskriptif dapat dilakukan untuk mempermudah penyampaian informasi agar mudah diterima dan dipahami.

Analisis deskriptif terdiri dari mean, median, modus, simpangan baku dan varian. Terdapat empat data yang digunakan yaitu data nominal, data ordinal, data interval dan data rasio. Namun, terdapat batasan dalam penggunaan data dengan skala-skala tertentu. Data nominal hanya dapat digunakan untuk mengetahui modus karena data nominal merupakan data yang paling sederhana. Data ordinal dapat digunakan untuk mengetahui modus dan median.

Sedangkan data interval dan rasio digunakan untuk mengetahui baik modus, median, mean maupun simpangan baku. Hal ini dikarenakan untuk menghitung mean hanya dapat dilakukan dengan menggunakan data yang bisa dilakukan operasi matematik seperti tambah, kurang, kali, bagi dan lain-lain.

Dalam analisis deskriptif, terdapat dua cara yaitu secara manual dan menggunakan software SPSS. Untuk cara manual, dapat digunakan rumus-rumus matematis sebagai berikut.

 

  • Rata-rata (Mean) Rumus data tunggal: Rumus data berkelompok:

Untuk data tunggal, nilai yang paling banyak jumlahnya merupakan modus. Misalnya dari data x1, x2, x3…. xn, xi adalah yang paling banyak muncul, maka xi adalah modus. Dengan kata lain, modus adalah frekuensi yang paling banyak.

 

Rumus data berkelompok:

  • Median

 

Untuk data tunggal, median terletak pada pertengahan data yang sudah diurutkan. Data yang berjumlah ganjil, maka nilai tengah dapat langsung ditentukan. Namun, untuk data yang berjumlah genap, nilai median adalah rata-rata dari dua datum yang berada di pertengahan.

Rumus data berkelompok:

 

  • Simpangan baku dan varian

Rumus data tunggal:

Rumus data berkelompok:

 

Sumber :

Agung Wahyudi Biantoro, Muh. Kholil.  2020.  Statistika Penelitian : Analisis Manual dan IBM SPSS.  Publisher El Markazi – Waru Sejahtera Press. ISBN : 978-623-6865-73-6.  https://scholar.google.com/citations?view_op=view_citation&hl=en&user=uxBYmnsAAAAJ&pagesize=80&sortby=pubdate&authuser=2&citation_for_view=uxBYmnsAAAAJ:Y0pCki6q_DkC