Koori Nagawa Network. Powered by Blogger.

SAMPLING

By |


The basic idea behind sampling:
        We seek knowledge or information about a whole class of similar objects or events (usually called population)
        We observe some of these (called a sample)
        We extend our findings to the entire class.

Why Sample?
Satu kasus susah digunakan sebagai basis generalisasi karena banyaknya variasi dalam suatu populasi. Contoh: persepsi tiga orang buta yang memegang gajah.
Ada pula pertimbangan praktis yang bikin perlu sampling. Researchers often want to know something about a specific social group or population that, for reasons of size, time, cost, or inaccessibility, cannot be studied in its entirety. Kalo punya waktu dan dana tak terbatas, boleh lah diteliti setiap kasus/item dari populasi.

Why Sample?
Bisa makan waktu terlalu lama
Data bisa obsolete
Respon awal dengan respon akhir bisa beda karena ada suatu kejadian, gosip, dan sebagainya.
Perlu biaya yang besar, juga buat interviewer. Perlu pelatihan yang efektif dan supervisi yang cukup ketika pengambilan data.
Alasan lain: mempelajari populasi malah bisa jadi hasilnya ngga akurat, terutama populasinya besar.
Manajemen proyeknya lebih gampang dengan sampling:
        bisa ada waktu tambahan untuk memperbaiki interview/questionnaire design
        prosedur mendapatkan responden-yang-sulit-ditemukan
        rekrutmen, pendidikan dan latihan, serta supervisi data collectors.

Definisi Populasi
Setelah menentukan unit analisis, definisikan populasi yang mau diteliti  deskripsi dari sekumpulan unit yang membentuk populasi.
Top-down, tentukan populasi dulu kemudian turun ke sampel. Hal yang tidak jarang terjadi: memilih sampel yang gampang dulu kemudian mengasumsikan sampel tersebut representatif terhadap populasi (bottom-up)  belum tentu!
Memilih “acak” seperti itu, populasi  mana yang terwakili? Misalnya di mal hari sabtu memilih sampel secara acak:
        Kemungkinan overrepresent weekdays worker dan underrepresent kelompok lain seperti anak2, pensiunan, pengangguran.
        Pemilihan mal, mal “elit”  sampel lebih representatif ke golongan A, mal “kurang elit”  sampel lebih representatif ke golongan menengah ke bawah

Akibatnya populasi yang direpresentasikan hanya bisa: para pengunjung mal “X” hari Sabtu  Nilai generalisasi yang rendah.
Pendefinisian populasi:
1.       Mengidentifikasi populasi target.
2.       Menentukan sampling frame.

Populasi target: tentukan kriteria yang digunakan untuk menentukan kasus2/item2 apa yang masuk populasi dan kasus2/item2 mana yang tidak masuk. Seringkali ikut menentukan populasi target: lokasi dan waktu.

Kenapa memilih target populasi “A”? Tujuan dan pertimbangan praktis mempengaruhi (seperti setiap hal lainnya, apa reasoning-nya).

Contoh: “Mahasiswa Fisip”, apakah memang program S1 saja? S2? S3?
Sampling frame: definisi operasional dari populasi target. Sampling frame bukan sampelnya sendiri, tapi cara mengambil sampel dari populasi yang sudah ditentukan.

Sampling frame:
        Me-list semua kasus
        Menentukan suatu aturan; kasus2/item2 kemudian dihadapkan pada aturan tersebut untuk menentukan masuk atau tidaknya.

Misalnya: e-mail survey sampling frame: pake “list e-mail di bagian akademis”, atau list-nya si Fulan aja.

List tidak selalu ada/bisa dipakai.
Idealnya sampling frame identik dengan populasi target  permasalahan dalam pembuatan definisi operasional, tidak bisa 100% tepatnya penerjemahan. Semakin tidak tepat penerjemahan, perlu dipertimbangkan sampling frame yang lain.

Penarikan kesimpulan seharusnya hanya berlaku pada populasi yang direpresentasikan sampling frame.

Sampling Designs

Idealnya sampel yang didapat  representatif.
Misalnya: populasi = mahasiswa program S1 Fisip berarti sampel ada mahasiswa dari tiap-angkatan-yang-ada-di-populasi dengan proporsi yang sama, jumlah pria dan wanita yang proporsinya sama, yang kos, di rumah, lainnya, dan seterusnya sesuai karakteristik populasi. Sangat susah.

Dapat dilihat sangat kecil kemungkinan bisa didapat sampel yang 100% representatif terhadap sampel karena populasi target tidak diketahui semua karakteristik dari populasi (parameter2).

Oleh karena itu istilah “representatif” kemudian mengacu pada karakteristik2 populasi yang spesifik yang mau diteliti dan tidak pada kualitas sampel secara keseluruhan.
Kualitas sampel dilihat dari prosedur yang digunakan yaitu sampling design-nya (seperti juga bagian2 lain, prosedur benar  hasil pasti benar).

Sampling design mengacu pada bagian dari rencana penelitian yang menjelaskan bagaimana kasus2 dipilih untuk diteliti.
Sampling design:
        Probability sampling
        Non-probability sampling

Probability sampling:
        setiap anggota populasi memiliki known probability untuk terpilih menjadi sampel dan
        setiap sampel diambil secara acak.

Lebih dapat diterima daripada nonprobability sampling.
Nonprobability sampling: peluang anggota populasi tidak diketahui karena pengambilan sampel tidak dilakukan secara acak.

Kelebihan probability sampling:
        Tidak ada investigator biases dalam pemilihan sampel
        Hukum probabilitas dapat dipakai untuk menghitung estimasi keakuratan sampel, generalisasi dapat dilakukan dan batas2 generalisasi dapat diketahui.

With nonprobability sampling, the population itself is undefined and the laws of probability do not apply.

Probability sampling always involves the process of random selection at some stage.

Probability Sampling
Probability sampling:
        Simple random sampling
        Stratified random sampling
        Cluster sampling
        Systematic sampling

Probability Sampling: Simple random sampling (1)
Simple random sampling: setiap anggota populasi punya kesempatan sama untuk terpilih. Misalnya mengambil secara acak dari suatu daftar.
Sampling error, standard error, confidence level, confidence interval, principles of probability sampling theory:
        Menggunakan data brapa jumlah rata2 silverqueen yang dimakan mahasiswa dalam satu hari sebagai ilustrasi.
        Populasi: delapan mahasiswa. Jumlah sampel: dua mahasiswa (bisa lebih).
        Kemungkinan pasangan tertentu (dua mahasiswa) terpilih jadi sampel: 1/28



                                                                                                                                                                        
Ada 18 kasus yang mean-nya antara 2.0 sampai 4.0 (3, 4, 4, 4, 3); jadi probabilitas mendapatkan mean sampel dalam range 2.0-4.0 adalah 18/28 = .64

Untuk jumlah sampel empat (tidak diperlihatkan perhitungannya di sini), probabilitas dapat a mean sampel dalam range 2.0-4.0 adalah 62/70 = .89, untuk jumlah sampel enam, probabilitasnya 1.0.
Semakin besar sampel Þ semakin dekat mean sampel-nya dengan population mean.

Selisih antara sample statistic (misalnya mean) dengan population parameter disebut sampling error. Contoh dalam kasus ini, mean sampel 0.5 nilai sampling error-nya 2.5 karena mean populasi (kebetulan diketahui) 3.0. Mean sampel 1.5, sampling error-nya 1.5. Satuan pengukuran untuk “rataan” dari error2 dari seluruh distribusi sampel disebut standard error.

Semakin besar sampel Þ semakin kecil standard error-nya (semakin besar sampel Þ semakin dekat mean sampel-nya dengan population mean Þ semakin kecil standard error-nya).
Probability Sampling: Stratified random sampling

“Mean populasi adalah antara 2.0 sampai 4.0 (confidence interval) dengan probability or level of confidence (tingkat kepercayaan) 89%”

Untuk penelitian biasanya 99% atau 95%, untuk bisnis 90% kadang2 sudah bisa diterima.
Sering confidence level tidak disebut, hanya confidence interval (sampel precision)-nya saja, misalnya “margin of error +/- 4% dengan N = 750”.

Sampel precision bisa ditingkatkan dengan sampling design stratified random sampling.
Populasi dibagi menjadi dua segmen atau lebih yang mutually exclusive yang disebut strata, berdasarkan kategori2 dari satu atau lebih variabel yang relevan, baru kemudian dilakukan simple random sampling.

Stratifying by variables correlated with the dependent variable increases the precision of estimates because it systematically introduces relevant sources of variability (or heterogeneity) in the population into the sample.

Untuk n yang sama, stratified random sampling lebih efisien dibanding simple random sampling.
Selain meningkatkan efisiensi, stratified random sampling juga digunakan untuk memastikan kategori-kategori yang proporsinya kecil dalam populasi cukup terwakili.

Contoh lain: Hulk music by Danny Elfman
        Biasa:
          Movie Music UK: ***
          Music from the Movies: ***
          Music on Film: ***
          Soundtrack Review Central: ***
          Soundtrack Express: ***
          Movie Wave: ***
        Bagus: Film Music Review: ****

Secara rata2 “tenggelam” tapi bisa jadi Film Music Review memberikan valid points dalam penilaian. Misalnya bukan soal banyak2an tapi inventori permasalahan.

Misalnya di populasi, orang jawa 90%, orang sunda 5%, orang bali 5%. Sampel 100 orang berarti 90 orang jawa, 5 orang sunda, 5 orang bali. Kedua kelompok terlalu sedikit sehingga dalam statistical estimates, “tenggelam”.

Bisa saja digunakan sampel 30 orang jawa, 30 orang sunda, 30 orang bali Þ disproportionate stratified random sampling. Perlu statistical adjustment sebelum mengestimasi parameter populasi.

Probability Sampling: Cluster sampling

Simple random sampling dan stratified random sampling berasumsi ada list lengkap dari anggota populasi. Kalau tidak ada? Þ Cluster sampling bisa digunakan. Pertimbangan biaya juga merupakan alasan lainnya.

Populasi dibagi-bagi menjadi sekelompok kasus yang disebut clusters biasanya berdasarkan pembagian alami seperti lokasi, golongan sosioekonomi, dsb.

Beda dengan stratified: stratified mengambil sampel dari tiap strata, cluster sampling tidak mengambil sampel dari tiap cluster, hanya cluster yang dipilih saja.

Jika semua anggota cluster menjadi sampel Þ single-stage cluster sample. Jika suatu cluster terdiri dari clusters lagi dan sampel diambil dari clusters di bawahnya Þ multistage cluster sampling.
Primary sampling units Þ secondary sampling units dst.

Kurang akurat dibandingkan dengan simple random sampling atau stratified random sampling untuk jumlah n yang sama.

Akurasi dapat ditingkatkan dengan mengambil sampel dari cluster2 lain.
Probability Sampling: Systematic sampling

Systematic sampling: memilih kasus setiap interval dari list lengkap anggota populasi. Syaratnya dua:
        Sampling interval (K)
        Dan lokasi start.

Misalnya perlu sampel 100 dari 2500 orang, inter val = 2500/100 = 25 (sampling interval). Kemudian tentukan nomor secara acak dari 1 sampai 25. Misalnya 19, berikutnya berarti 44, 69, dan seterusnya.

Nonprobability Sampling

Semua proses pemilihan kasus yang bukan dengan cara random selection.
Kelemahan:
        Tidak ada kontrol terhadap investigator bias dalam pemilihan sampel
        Variabilitasnya tidak bisa dihitung menggunakan probability sampling theory Þ tidak bisa menghitung sampling error atau sample precision.

Dalam banyak kasus, cara sampling ini lebih tepat atau praktis:
        Situasi di mana jumlah kasus yang bisa diteliti terlalu sedikit, misalnya karena biaya terlalu besar untuk menyelidiki banyak kasus (misalnya unit analisa kota, negara, atau yang besar-besar lainnya), sementara probability sampling kurang reliabel untuk jumlah kasus yang terlalu sedikit.
        Peneliti hanya bisa bekerja dengan kasus yang ada saja
        Di awal penelitian suatu permasalahan, di mana tujuannya baru mengumpulkan informasi mengenai gejala (tujuan eksploratif), cukuplah menggunakan nonprobability sampling, belum diperlukan generalisasi statistik yang akurat.
        Kalau populasinya sendiri jumlah anggotanya kecil (misalnya di bawah 100).

Tiga tipe utama nonprobability sampling:
        Convenience sampling
        Purposive sampling
        Quota sampling

Nonprobability Sampling: Convenience sampling

Alias: incidental, accidental, haphazard, fortuitous sampling
Peneliti memilih sejumlah kasus yang conveniently/readily available.
Metode ini cepat, mudah, dan murah.

Kalau penelitian permasalahan baru tahap awal dan generalisasi bukan masalah, metode ini boleh2 saja.

Tapi karena sampel yang cuma “sedapatnya”, tidak bisa ditentukan hasil penelitian ini bisa diterapkannya ke mana kecuali ke sampel itu sendiri.

In attempting to make inferences from such a sample, “one can only hope that one is not being to grossly misled” (sangat sinis)

Nonprobability Sampling: Purposive sampling

Peneliti menggunakan expert judgement untuk memilih kasus2 yang “representatif” atau “tipikal” dari populasi.

Pertama, identifikasi sumber2 variasi yang penting dari populasi. Berikutnya memilih kasus2 sesuai sumber2 variasi tersebut.

Bisa dipilih satu kasus atau satu subpopulasi yang dianggap “representatif” atau “tipikal” yang memiliki karakteristik tertentu. Atau memilih beberapa kasus yang mewakili perbedaan2 utama dalam populasi.

Teknik purposive sampling lainnya, biasanya untuk prediksi hasil election, adalah memilih propinsi tertentu yang telah bertahun-tahun memprediksikan hasil penghitungan suara nasional secara tepat.
Misalnya kalau di propinsi A partai X menang maka diprediksikan dengan sangat yakin (keyakinan sebesar korelasi historisnya) bahwa secara nasional partai X bakal menang.

Tetap kurang bisa diterima dibandingkan probability sampling jika diperlukan generalisasi yang tepat dan akurat. Tetapi kalau berbagai hal membatasi, ya boleh lah.

Secara umum lebih “kuat” dibandingkan convenience sampling tapi sangat tergantung expert judgement-nya peneliti.

Kelemahan utama: informed selection seperti itu memerlukan pengetahuan yang cukup mengenai populasi.

Nonprobability Sampling: Quota sampling

Quota sampling adalah sejenis purposive sampling yang ada kemiripan dengan proportionate stratified random sampling:
        Pertama, populasi dibagi-bagi menjadi strata yang relevan seperti usia, jenis kelamin, lokasi, dsb.
        Proporsi tiap strata diperkirakan atau ditentukan berdasarkan data eksternal kemudian total sampel dibagi-bagi sesuai proporsi ke tiap strata (kuota).
        Untuk memenuhi jumlah sampel untuk tiap strata, peneliti menggunakan expert judgement-nya.

Misalnya populasi 55% pria 45% wanita. Sampel 100 orang berarti 55 pria dan 45 wanita. Pemilihan sampelnya sendiri tergantung penilaian peneliti.

Bedanya dengan stratified random sampling, sampel diambil secara acak sedangkan dalam quota sampling, sampelnya dipilih berdasarkan pendapat subjektif peneliti pokoknya kuotanya terpenuhi (mirip2 convenience sampling).

Total sampel juga a convenience sample tapi ada kemiripan dengan populasi dalam karakteristik2 penting tertentu (karena pembuatan stratanya).
Bias peneliti sangat mempengaruhi: pemilihan teman sebagai sampel, milih lokasi2 yang nyaman, dan sebagainya.

Keuntungan:
        tidak perlu membuat sampling frame
        kalau perlu konfirmasi tinggal cari lagi yang baru asal kuota terpenuhi, tidak perlu menghubungi responden yang telah diwawancarai.

Cepat, mudah dan murah.

Other Sampling Designs

Gabungan dari probability dan nonprobability sampling
Referral sampling:
        Network sampling: responden diminta mengidentifikasi anggota2 dari target populasi yang ada hubungan dengan dirinya
        Snowball sampling: chain referral, responden diminta memberikan nama dan kontak dari anggota lain dari target populasi. Asumsinya sesama anggota saling mengenal. Misalnya: hackers.

Faktor2 yang Mempengaruhi Sampling Design
Tergantung pada:
        What is the stage of research?
        How will the data be used?
        What are the available resources for drawing the sample?
        How will the data be collected?

Stage of research and data use
        Akurasi tidak terlalu penting kalau baru eksplorasi gejala, hal yang penting adalah menemukan pola2 tertentu dulu dan membuat hipotesis2 untuk penelitian lanjutan.
        Peneliti perlu menggunakan good judgement mereka untuk mendapatkan sampel yang tepat Þ nonprobability sampling bisa digunakan.
        Kalau cuma pingin me-list semua varians, cukup dengan sejumlah sampel dengan pendekatan nonprobability.
        Kalau hasil penelitian akan menjadi bahan decision making pemerintah misalnya, presisi diperlukan. Perlu probability sampling yang terkontrol dan jumlah sampel yang relatif banyak.

Available resources
        Jika akurasi menjadi pertimbangan utama, perlu digunakan sampling design yang menghasilkan sampel yang paling presisi. Tapi biayanya bisa jadi sangat mahal.
        Waktu, uang, bahan2 yang diperlukan, lokasi melimitasi sampling design.
        Sampling design disesuaikan kemampuan, kecil tapi jika prosedur-nya bagus Þ hasilnya pun bagus.

Method of data collection
        Keempat pendekatan (eksperimen, field research, survey research, documentary research) masing-masing berurusan dengan sampel.
        Eksperimen biasanya pakai convenience sampling, survai biasanya probability sampling, field research biasanya convenience atau purposive, documentary research sering menggunakan probability sampling.

Faktor2 yang Mempengaruhi Sample Size
Antara lain:
        Heterogenitas dari populasi
        Tingkat presisi yang dikehendaki
        Tipe sampling design yang digunakan
        Resources availability
        Number of breakdowns planned in data analysis

Heterogenitas populasi
        Heterogenitas mengacu pada derajat perbedaan di antara kasus dalam suatu karakteristik.
        Semakin heterogen, jumlah kasus yang diperlukan semakin besar agar estimasinya reliabel. Ekstrimnya, kalau semua kasus sama (homogen, unidimensional), jumlah sampel cukup satu, kalau tidak ada yang sama, harus sensus.
        Satuan pengukuran statistik terbaik untuk heterogenitas populasi adalah standard deviation (s) Þ berhubungan dengan standard error yang tadi dibahas. Rumus standard error = s/√(N).

Semakin besar heterogenitas populasi, perlu semakin banyak sampel agar lebih presisi
Tingkat presisi yang dikehendaki
        Secara teknis mengacu pada standard error (seperti dijelaskan di atas). Tapi lebih mudah diilustrasikan dengan confidence interval.
        Pernyataan “rata2 populasi ada di antara 2-4” lebih presisi dibandingkan “rata2 populasi ada di antara 1-5”.
        Rumus standard error s/√(N), sampel perlu diperbesar agar standard error-nya mengecil. Agar standard error turun 1/2, N perlu naik empat kali lipat.
        Law of diminishing return, setelah terus2an, dibutuhkan jumlah N yang sangat besar agar standard error bisa turun.
w  N = 100 Þ s = 5
w  N = 400 Þ s  = 2.5
w  N = 2500 Þ s  = 1
w  N = 10000 Þ s  = 0.5
        Sample size 2000-3000 sebenarnya standard error-nya sudah cukup kecil dan menambah jumlah sampel lagi Þ “is not worth the additional cost”.

Sampling design
        Misalnya tanpa menambah jumlah sampel presisi sampel bisa ditingkatkan dengan menggunakan stratified random sampling dan bukan simple random sampling, tapi cluster sampling perlu lebih banyak sampel.

Resources availability
Number of breakdowns planned. Contoh:
        Sampel 500
        Angkatan baru 100
        Kos 20
        Pria 10

Jumlah kasus terlalu sedikit untuk menghasilkan analisis yang reliabel

Catatan
w  Sample bias: nonrandom, difficult to detect, damaging to sample accuracy.
w  Dua sumber yang paling umum:
        Coverage error: sampling frame yang tidak komplit meng-cover semua populasi
        Nonresponse bias: pengumpulan data tidak lengkap.
w  Rate of response dan rate of nonresponse 





































Newer Post Older Post Home