Bagaimana bisa kamu melewatkan penerbangan lanjutan itu saat kamu akan pergi berlibur? Akankah kamu berhasil datang tepat waktu jika keadaan dan situasinya berbeda? Strategi apa yang bisa kamu terapkan agar kamu tak melewatkan hal-hal yang telah direncanakan di lain waktu? Ketika kamu mencoba untuk menjawab pertanyaan-pertanyaan seperti ini, pada dasarnya kamu telah berurusan dengan hukum sebab dan akibat (atau faktor-faktor yang berbeda dapat menyebabkan hasil yang berbeda pula). Saat kamu melihat pengalaman personal dan anekdot seperti di atas dari sisi matematika dan statistik, akan ada sebuah pola yang dapat kamu temukan. Namun dalam menganalisanya, kamu harus membedakan antara faktor sebenarnya yang mempengaruhi hasil, dan faktor-faktor yang terlihat mempengaruhi hasil namun pada kenyataannya tidak. Dengan kata lain, penulis meminta kita untuk membedakan antara causation (hal yang menyebabkan) dan correlation (korelasi yang menampakkan adanya semacam hubungan antara dua variabel, namun sebenarnya tak saling memengaruhi).
Menggunakan Data namun Mengabaikan Asas Kausalitas dapat Menghasilkan Kesimpulan yang Menyesatkan
Sudah menjadi pemahaman umum bahwa jika kamu ingin memahami akar penyebab dari sesuatu, maka kamu harus mengumpulkan data tentang hal tersebut. Akan tetapi, satu hal yang perlu diperhatikan: jika data tidak dianalisa dengan cara yang benar, sangat mungkin jika data tersebut disalahartikan. Mari kita lihat apa yang terjadi dengan kasus vaksin cacar (smallpox). Saat vaksin diperkenalkan pertama kali pada abad ke-18, hasil dari analisa data menunjukkan bahwa seakan vaksin tersebut mengakibatkan lebih banyak kematian jika dibandingkan dengan kematian yang diakibatkan oleh cacar itu sendiri.
Mari kita gunakan angka-angka hipotesis untuk mendemostrasikan kasus tersebut. Bayangkan dari satu juta anak, 99% nya telah menerima vaksin cacar (sekitar 990.000 anak). Ada 1% kemungkinan bahwa vaksin menimbulkan efek samping, yang berarti dirasakan oleh 9.900 anak. Dan 1% dari efek samping itu adalah kematian, atau sekitar 99 anak meninggal akibat vaksin. Lalu bandingkan data tersebut dengan 1% dari satu juta anak yang tidak mendapatkan vaksin. 10.000 anak ini mempunyai 2% kemungkinan untuk terjangkit cacar, sekitar 200 anak. 20% dari yang terjangkit cacar akan meninggal, yang berarti meninggalnya 40 anak. Ketika kamu membandingkan antara 99 kematian yang diakibatkan oleh vaksin dengan 40 kematian yang disebabkan oleh cacar, kamu mungkin mulai bisa melihat mengapa orang-orang berpikir bahwa vaksin lebih mematikan dari pada cacar itu sendiri.
Maka dari itu, jika kita ingin benar-benar memahami data, kita perlu untuk melihat lebih dari “kulit”nya saja. Dalam kasus data vaksin cacar ini kita harus menjadi kritis dan mengajukan pertanyaan medasar seperti, “Berapa banyak anak yang akan meninggal jika tak ada satupun dari mereka yang menerima suntikan vaksin?” Jika kamu menggunakan asumsi yang sama seperti di atas maka sekitar 4.000 anak akan meninggal jika tak ada satupun dari mereka yang menerima vaksin. Maka dari itu, hanya melihat data itu sendiri dapat mengaburkan fakta dan manfaat dari vaksin. Ini menunjukkan bahwa data yang sama dapat digunakan untuk membuktikan sudut pandang yang berbeda.
Kamu mungkin akan terkejut saat mengetahui bahwa data menunjukkan adanya hubungan antara ukuran sepatu dari anak dan kemampuannya dalam membaca. Barangkali ini terdengar tidak masuk akal, akan tetapi terdapat penyebab umum yang menjadi jawaban atas kedua variabel yakni usia. Secara rata-rata, anak yang lebih tua akan memiliki ukuran kaki yang lebih besar, dan tentu saja memiliki kemampuan membaca yang lebih baik. Sebagai solusi atas permasalahan ini, penulis telah mengembangkan sebuah proses yang dapat membantu kita untuk melihat lebih dari sekedar data observasi, yang disebut dengan “The Ladder of Causation”.
Anak Tangga Pertama dari “The Ladder of Causation” terkait dengan Asosiasi dan Probabilitas
Sejak dilahirkan, secara alami kita berintuisi untuk melihat dunia yang ada di sekeliling kita dan mulai mempelajari hubungan-hubungan antara satu hal dengan hal lainnya. Kemampuan ini adalah anak tangga pertama yang menjadi dasar dari The Ladder of Causation. Sebagian besar hewan dan program-program kecerdasan buatan yang manusia ciptakan baru menguasai level pertama dari The Ladder of Causation.
Contohnya, seekor burung hantu mengetahui jejak dari mangsanya dengan memonitor pergerakannya; ia mencoba untuk memprediksi kemana arah yang akan diambil oleh mangsa di momen berikutnya. Pertanyaan tentang “mengapa mangsa incarannya bergerak begitu cepat?” bukanlah hal yang menjadi perhatian dari sang burung hantu.
Teknologi mobil tanpa pengemudi mungkin terdengar sangat futuristis, namun mereka juga tak mampu melewati anak tangga pertama dari The Ladder of Causation. Karena mereka hanya diprogram untuk bereaksi terhadap hasil observasi, mobil tersebut tak akan mampu untuk menerka beragam reaksi potensial yang akan dikeluarkan oleh penyebrang jalan yang sedang mabuk saat klakson mobil dibunyikan. Semua skenario potensial harus diprogramkan terlebih dahulu kedalam sistem komputer mobil agar ia mampu memberikan reaksi yang tepat untuk tiap skenario.
Pengumpulan data juga dikategorikan sebagai aktivitas pada anak tangga pertama karena ini melibatkan kegiatan observasi yang pasif. Bayangkan seorang direktur pemasaran yang diminta untuk menemukan seberapa besar kemungkinan dari seorang pelanggan pembeli pasta gigi, juga membeli benang gigi (dental floss)? Dia mungkin akan mengumpulkan data terkait pelanggan pembeli pasta gigi dan pembeli floss terlebih dahulu. Secara simbolis, ilmu statistik menyatakan pertanyaan ini dalam bentuk P(floss|pasta gigi), atau dengan kata lain “Apa probabilitas dari floss, saat kamu melihat pasta gigi?”
Pertanyaan semacam itu merupakan fondasi dasar dari statistik. Tetapi dengan mengetahui probabilitas saja tak memberi tahu kita apapun tentang sebab dan akibat (cause and effect) tentang terjadinya sesuatu. Bagaimana bisa seorang manajer pemasaran menentukan apakah dengan melihat pasta gigi atau floss dapat menyebabkan seseorang untuk membeli kedua produk tersebut? Jelas bahwa pada sebagian besar peristiwa, mengobservasi probabilitas saja tak dapat memberikan informasi yang cukup untuk mengetahui sebab dan akibat dari sesuatu.
Anak Tangga Kedua dari “The Ladder of Causation” adalah Intervensi
Untuk menapaki “The Ladder of Causation”, mengobservasi jalannya dunia saja tidak cukup, tetapi kita perlu juga untuk mengubahnya; dan hanya manusia yang dapat melakukan perubahan secara reguler. Anak tangga kedua bisa dikemas dalam pertanyaan “Bagaimana jika kita melakukan...?”. Melakukan sesuatu atau mengambil aksi dalam rangka secara aktif memengaruhi hasil adalah hal yang mendefinisikan anak tangga kedua. Bayangkan kamu sedang sakit kepala dan kemudian meminum obat pereda rasa sakit; itu adalah sebuah sebuah intervensi aktif yang kamu lakukan untuk menghilangkan rasa sakit yang kamu alami.
Mari kembali pada contoh pemasaran produk-produk kebersihan gigi di bab sebelumnya. Sang manajer mungkin bisa mengajukan pertanyaan berupa, “akankah penjualan floss terpengaruh saat kami mengubah harga dari pasta gigi?” Ya, manusia mampu memikirkan pertanyaan semacam ini, namun untuk saat ini komputer belum terprogram secara otomatis untuk menanyakan pertanyaan seperti ini; inilah alasan mengapa komputer tak bisa menaiki anak tangga selanjutnya.
Salah satu cara terbaik untuk menguji efek dari sesuatu adalah dengan mengadakan percobaan terkontrol (controlled experiment). Dalam percobaan yang terkontrol, peneliti melibatkan kelompok-kelompok yang mempunyai karakter yang mirip antara satu dengan lainnya, namun perlakuan yang mereka berikan kepada tiap kelompok akan berbeda. Diharapkan, dengan praktik ini, peneliti dapat mengetahui apakah sebuah variabel dan efeknya dapat diukur secara objektif dan terisolasi.
Percobaan terkontrol semacam ini bukanlah hal yang baru, dan sebenarnya pernah diceritakan dalam Alkitab. Dalam kisah Daniel, Raja Babylonian Nebuchadnezzar mencari-cari beberapa orang terpandang di Yerusalem untuk dipekerjakan di istananya sebagai bagian dari budaya. Mereka juga diberi edukasi tentang makan-makanan kaum elite yang terdiri dari bermacam daging dan anggur (wine). Akan tetapi, demi mengikuti hukum yang mengatur tentang makan pada agama Yahudi, beberapa dari pria tersebut tak mau mengonsumsi daging, Dan Daniel merupakan salah satu dari mereka. Daniel menyarankan agar ia dan tiga temannya diberikan diet vegetarian, sementara beberapa kelompok pria-pria lainnya diberi makanan layaknya sang raja. Kita bisa menganggap kelompok kedua ini sebagai control group. 10 hari kemudian, mereka akan membandingkan hasilnya. Ternyata, kelompok dari Daniel berkembang dengan lebih baik sehingga Nebuchadnezzar memberi mereka posisi yang lebih tinggi di kerajaan.
Contoh yang lebih mewakili masa kini adalah Facebook. Perusahaan tersebut sangat suka ber- eksperimen dengan penataan tombol dan fitur-fitur yang ada pada halaman web dan membandingkan reaksi dari tiap kelompok terhadap penataan yang berbeda.
Anak Tangga Ketiga dari “The Ladder of Causation” Berurusan dengan Gagasan yang Kontra- Faktual
Anak tangga ketiga dari The Ladder of Causation yang hanya dikuasai oleh manusia adalah: kemampuan untuk mengimajinasikan bagaimana intervensi yang berbeda akan berujung pada hasil yang berbeda pula. Salah satu cara yang paling umum digunakan untuk membuat nyata imajinasi ini adalah dengan menggunakan model-model yang kontra-faktual. Para ahli iklim melakukannya setiap saat dengan menanyakan pertanyaan seperti, “Akankah kita tetap mengalami pemanasan bumi yang intens jika saja tingkat karbon dioksida di atmosfir saat ini sama dengan di zaman praindustri?” Pertanyaan-pertanyaan yang kontra-faktual seperti ini merupakan hal yang asing bagi mesin atau komputer.
Jika sebuah rumah terbakar setelah seseorang menyalakan korek api, sebagian besar orang akan dengan mudah menyatakan bahwa rumah akan tetap berdiri jika saja korek api tak dinyalakan. Namun secara logika, rumah juga akan tetap berdiri tegak jika saja tak ada oksigen saat korek dinyalakan. Karena oksigen merupakan seustau yang normal dan ada dalam keseharian, sementara menyalakan korek api tidak, maka kita mengabaikan hubungan sebab akibat antara oksigen dan api. Sementara komputer tidak berpikir dengan cara tersebut; baginya korek api dan oksigen dianggap sebagai faktor yang sama kuatnya. Dalam bahasa matematika, keduanya adalah “penyebab yang diperlukan” (necessary causes). Maka dari itu, sama mungkinnya bagi komputer untuk menyimpulkan bahwa oksigen juga dapat disalahkan atas kebakaran yangt terjadi.
Sebuah komputer juga mungkin untuk mengalkulasi apakah korek api menjadi “penyebab yang cukup” (sufficient cause) atas kebakaran yang terjadi. Dengan kata lain, walaupun terdapat faktor-faktor mendasar lain yang mengakibatkan kebakaran, komputer tetap saja mencoba untuk melihat apakah korek api menjadi penyebab yang cukup (sufficiently responsible) untuk memulai kebakaran.
Memahami tiga anak tangga dari Ladder of Causality (Tangga Kausalitas) sangat krusial dalam membantu kita memahami pertanyaan-pertanyaan kausal, dan ini memunculkan pertanyaan “dalam penelitian ilmiah, faktor-faktor kompleks apa saja yang seharusnya diidentifikasi pada anak tangga yang berbeda?”
Mengendalikan Pengganggu (Confounders) itu Penting untuk Menetapkan Kausalitas
Kita sudah lihat bagaimana percobaan terkontrol dapat digunakan dalam penelitian. Namun dalam skenario-skenario yang terkontrol pun kita tetap perlu berhati-hati; hasil dari penelitian dapat menjadi sesuatu menyesatkan jika saja faktor-faktor yang berpengaruh, yang sering juga disebut dengan pengganggu (confounder), tidak diidentifikasi.
Menurut penulis, confounders mempengaruhi dua elemen dalam sebuah penelitian, yakni peserta dan hasil dari penelitian itu sendiri. Confounder juga secara umum ada kaitannya dengan anak tangga kedua dari The Ladder of Causality karena menyesuaikan penelitian dalam rangka “mengendalikan” confounders memerlukan intervensi.
Contohnya, ketika sebuah kelompok uji memiliki anggota yang usianya lebih muda dari kelompok control secara rata-rata, maka variabel usia ini menjadi pengganggu (confounder). Untuk mengendalikan variabel usia, maka peserta dengan usia yang mirip sebaiknya dibandingkan pada seluruh kelompok.
Namun variabel pengganggu (confounders) ini adalah sesuatu yang rumit karena cukup sulit untuk mengeliminasi keberadaan mereka. Bahkan, ini alasannya mengapa pernah terdapat perdebatan yang sangat panas seputar hubungan antara merokok dengan kanker paru-paru di tahun 1950-1960an. Mustahil bagi para orang-orang yang skeptis untuk mengabaikan bahwa variabel ketiga seperti genetik juga memiliki pengaruh terhadap kanker.
Salah satu cara lain untuk mengendalikan confounder adalah dengan memperkenalkan pengacakan (randomization) pada penelitian. Bias dari para peneliti itu sendiri dapat menjadi pengganggu (confounder). Namun bias-bias ini bisa dikendalikan dengan mengelompokkan peserta secara acak kedalam kelompok control atau treatment (perlakuan). Dengan begitu, baik peserta maupun peneliti tidak tahu pada kelompok mana tiap peserta tergabung; ini juga merupakan alasan mengapa placebo diberikan kepada kelompok control pada percobaan medis.
Akan tetapi randomisasi tak selalu praktis atau etis. Contohnya, tak etis bagi peneliti untuk meminta sekelompok orang secara acak untuk merokok selama 30 tahun dalam rangka menguji hubungan antara merokok dengan kanker. Praktik ini tentu dapat membunuh mereka.
Sama halnya, percuma saja mengabaikan pengujian yang terkontrol dalam rangka mengumpulkan data dari orang yang, misalkan, meminum obat atas kehendak mereka sendiri. Data tersebut hanya akan mendatangkan hasil yang benar-benar menyesatkan. Ini karena keputusan orang-orang untuk mengonsumsi obat atau tidak tergantung pada berbagai macam alasan, seperti seberapa terjangkau harga dari obat tersebut. Dalam kasus ini, hanya orang- orang yang berada dalam golongan pendapatan tertentu saja yang mampu memberikan data dalam percobaan. Salah satu cara bagi peneliti untuk mengendalikan ini adalah intervensi dengan mengadakan percobaan yang terkontrol. Penulis menyebut aksi ini dengan “do- factors”.
Identifikasi Mediator yang Tepat Penting untuk Menetapkan Kausalitas yang Akurat
Mengetahui bahwa terdapat hubungan sebab akibat (causation) antara satu hal dengan yang lain hanyalah separuh dari pertarungan; yang benar-benar menentukan adalah menemukan alasan mengapa satu hal menyebabkan hal lain. Jika kamu berhasil memecahkan teka-teki mengapa sebuah penyakit disebabkan oleh satu hal tertentu, maka ini akan membuat tindakan pencegahan dan proses penemuan obat jauh lebih mudah dilakukan.
Mediator adalah sebuah variabel yang memberi tahu kita mengapa sebuah faktor dapat mendatangkan hasil tertentu. Mari kita lihat bagaimana mediator bekerja dari sebuah contoh. Gedung-gedung saat ini dilengkapi dengan alarm pendeteksi kebakaran untuk mengingatkan kita saat kebakaran terjadi. Akan tetapi yang sebenarnya alat detektor periksa setiap saat adalah apakah terdapat asap di lingkungan sekitar. Asap adalah mekanisme, atau mediator, yang mana melaluinya kita tahu bahwa ada api yang berpotensi untuk membesar dan menjalar. Sebuah diagram kausal untuk memperlihatkan hubungan ini diekspresikan dalam api > asap > alarm.
Posisi mediator berada pada anak tangga ketiga dari The Ladder of Causality karena mereka berjalan beriringan dengan kontra-faktual. Contohnya kita bisa menanyakan “Akankah kebakaran memicu alarm jika bukan karena asap yang timbul?” Ya, mediator adalah hal yang berguna, namun kita dapat mengalami masalah saat kita salah dalam mengidentifikasi mereka.
Salah satu contoh klasiknya adalah penyakit skorbut (scurvy), sebuah penyakit yang menghantam para pelaut selama berabad-abad. Kita sekarang tahu bahwa skorbut dapat dicegah dengan mengonsumsi vitamin C. Akan tetapi, di tahun 1747, diamati bahwa buah dalam keluarga citrus (seperti jeruk, lemon, dsb.) dapat menangkal skorbut pada tubuh, sehingga orang-orang berasumsi bahwa keasamaan buahlah yang menjadi penangkal. Lagi pula, keberadaan vitamin belum diketahui hingga tahun 1912. Jejak kausal yang bisa digambarkan adalah buah citrus > tingkat vitamin C pada tubuh > skorbut.
Walapun para pelaut telah salah dalam mengidentifikasi mediator, skorbut dapat dibasmi pada jajaran Angkatan laut inggris berkat dibagikannya buah jeruk secara merata. Akan tetapi, kesalahan yang sama menyebabkan bencana yang menimpa British Arctic Expedition di tahun 1875. Dalam pelayaran tersebut, jus jeruk nipis yang mereka konsumsi dapat dipastikan berasa asam, namun tidak mengandung banyak vitamin C. Tak lama kemudian, serangan skorbut mulai nampak. Namun, di saat yang sama, mereka juga mengonsumsi daging kaleng. Akibatnya dokter menyimpulkan bahwa daging tersebut merupakan penyebab dari skorbut.
Faktor-Faktor dan Hubungaan Antar Faktor Dapat Diekspresikan dengan Formula Matematika yang Dapat Diubah Menjadi Algoritma
Sejauh ini kita telah melihat cukup banyak contoh dari sebab akibat (causation). Namun apakah perenungan ini membantu kita untuk menemukan jika korelasi berimplikasi terhadap kausalitas (causation)?
Hal pertama yang bisa kita lakukan adalah dengan menggambar diagram kausal. Setelah itu, sangat mungkin untuk menciptakan sebuah formula matematika yang memperlihatkan kemungkinan dari sebuah hubungan yang ada antara korelasi dan kausalitas.
Sebuah diagram kausal akan memperlihatkan semua faktor-faktor yang diketahui pada satu tempat (secara menyeluruh). Faktor-faktor yang secara langsung memengaruhi antara satu dengan yang lainnya dihubungkan bersama dengan anak panah. Maka dengan begitu kita dapat melihat dengan jelas apa saja yang menjadi mediator dan apa saja confounder nya.
Spesialis perawatan kesehatan dapat mencoba metode ini untuk menguji tingkat efektivitas dari sebuah obat yang mengeklaim mampu untuk menurunkan tekanan darah. Mereka dapat menggambar sebuah diagram dengan anak panah yang menghubungkan antara obat dan tekanan darah, masa hidup dan tekanan darah, dan antara obat dengan masa hidup. Karena usia mempengaruhi kedua hal, baik tekanan darah mapun masa hidup, maka usia terhubung pada kedua faktor dengan anak panah yang menunjuk pada kedua arah; ini menjadikan usia sebagai faktor pengganggu (confounder). Atau diagram ini dapat diekspresikan dengan: usia <--> tekanan darah. Berkat diagram ini, probabilitas masa hidup, dengan asumsi bahwa seseorang telah mengonsumsi obat tersebut, dapat diekspresikan dalam sebuah formula.
Bagian yang menakjubkan dari diagram ini adalah metodologinya. Proses sebab dan akibat ini dapat diprogram ke dalam sebuah komputer. Kita akan menggunakan ini seperti kita menggunakan diagram jejak (path diagram): asumsi dan data diinputkan terlebih dahulu, kemudian kita dapat mengajukan sebuah pertanyaan terhadap algoritma. Jika komputer menentukan bahwa pertanyaan tersebut dapat dijawab menggunakan causal model, maka ia akan merencanakan sebuah formula matematika. Formula ini kemudian dapat digunakan untuk mengalkulasi, tak hanya jawaban, tetapi ketidak-pastian statistik atas jawaban tersebut. Ketidak-pastian ini merefleksikan data set yang terbatas sekaligus pengukuran error.
Mungkin penjelasan pada bab terakhir sulit untuk dimengerti. Untuk mendapatkan penjelasan yang lebih mencerahkan, silahkan lihat video dari penulis saat menjelaskan tentang idenya. Demikian kami sampaikan, semoga bermanfaat.
Add a comment