Kolaborasi Manusia dan AI Ternyata Seringkali Lebih Bodoh

Kolaborasi Manusia dan AI Ternyata Seringkali Lebih Bodoh Daripada AI Sendirian!

Pernahkah kamu merasa sangat yakin bahwa dengan menggunakan ChatGPT atau Claude, kamu telah menjadi “superhuman”?

Ada sebuah narasi besar yang terus didengungkan di telinga kita selama beberapa tahun terakhir: bahwa masa depan bukanlah “AI menggantikan manusia”, melainkan “Manusia + AI” yang akan menjadi tim tak terkalahkan.

Kita membayangkan sebuah centaur—makhluk mitologi setengah manusia setengah kuda—di mana kreativitas manusia bersatu dengan kecepatan komputasi mesin.

Namun, bagaimana jika saya katakan bahwa narasi tersebut mungkin… sedikit keliru?

Atau setidaknya, terlalu optimis?

Baru-baru ini, saya membaca sebuah paper penelitian yang sangat membuka mata (dan sedikit menampar ego kita sebagai manusia) yang diterbitkan di jurnal bergengsi Nature Human Behaviour.

Paper berjudul “When combinations of humans and AI are useful: A systematic review and meta-analysis” ini ditulis oleh Michelle Vaccaro, Abdullah Almaatouq, dan Thomas Malone dari MIT.

Mereka tidak main-main.

Mereka melakukan tinjauan sistematis dan meta-analisis terhadap 106 studi eksperimental yang mencakup 370 ukuran efek (effect sizes) dari tahun 2020 hingga 2023.

Pertanyaan mereka sederhana namun fundamental:

Kapan kombinasi manusia dan AI bekerja lebih baik daripada salah satu dari mereka bekerja sendirian.

Jawabannya? Rumit, filosofis, dan sangat penting untuk kita pahami agar tidak terjebak dalam ilusi produktivitas.

Mari kita selami lebih dalam..

Daftar Isi

Realita Pahit: Tidak Ada Sinergi (Rata-rata)

Mari kita mulai dengan “berita buruk” nya.

Secara intuitif, kita berpikir bahwa jika manusia digabungkan dengan AI, hasilnya pasti A + B = C (di mana C lebih besar dari A atau B). Ini yang disebut sebagai Sinergi Manusia-AI (Human-AI Synergy).

Definisi sinergi di sini sangat ketat: tim Manusia+AI harus bisa mengalahkan performa manusia terbaik sendirian ATAU performa AI terbaik sendirian.

Fakta yang ditemukan para peneliti ini cukup mengejutkan. Secara rata-rata, kombinasi manusia-AI justru berkinerja lebih BURUK daripada yang terbaik di antara keduanya bekerja sendirian.

Dalam bahasa statistik, mereka menemukan nilai Hedges’ g sebesar -0.23. Angka negatif ini menunjukkan kerugian kinerja (performance loss). Artinya, dalam banyak kasus yang diteliti, jika kita hanya peduli pada hasil akhir (seperti akurasi), kita sebenarnya lebih baik membiarkan AI bekerja sendirian atau membiarkan manusia bekerja sendirian, tergantung siapa yang lebih ahli, daripada memaksakan kolaborasi.

BACA INI JUGA Bagaimana Mengetahui Video Yang Dibuat Dengan AI? Simak Cara Ini Agar Gak Ketipu

Ini adalah tamparan keras bagi konsep “Human-in-the-loop” yang sering diagungkan.

Ternyata, kehadiran kita dalam proses tersebut seringkali justru menjadi “beban” yang menurunkan kualitas output maksimal yang bisa dicapai oleh sistem AI tercanggih.

Sisi Terang: Augmentasi Manusia Tetap Ada

Tapi tunggu dulu, jangan buru-buru membuang langganan ChatGPT kalian. Ada sisi lain dari koin ini.

Meskipun “Sinergi” (mengalahkan yang terbaik dari keduanya) sulit dicapai, riset ini menemukan bukti kuat adanya Augmentasi Manusia (Human Augmentation).

Apa bedanya? Augmentasi Manusia hanya membandingkan performa “Manusia + AI” melawan “Manusia Sendirian”.

Hasilnya? Sangat positif.

Tim gabungan Manusia-AI secara signifikan mengungguli manusia yang bekerja sendirian, dengan nilai efek positif yang cukup besar.

Jadi, filosofinya begini: AI memang membuat kita (manusia) menjadi lebih baik daripada versi diri kita sebelumnya. Namun, AI itu sendiri seringkali sudah lebih pintar dari kita dalam tugas tersebut, sehingga ketika kita ikut campur (“berkolaborasi”), kita malah menurunkan potensi maksimal si AI.

Kita menjadi lebih baik, tapi sistem secara keseluruhan menjadi suboptimal karena intervensi kita.

Ironis, bukan?

Jebakan Pengambilan Keputusan vs. Kebebasan Berkreasi

Salah satu temuan paling menarik dari riset ini adalah perbedaan dampak AI pada jenis tugas yang berbeda. Para peneliti membagi tugas menjadi dua kategori besar: Tugas Keputusan (Decision Tasks) dan Tugas Kreasi (Creation Tasks).

1. Tugas Pengambilan Keputusan (Decision Tasks):

Ini adalah tugas di mana kita harus memilih dari serangkaian opsi terbatas (misalnya: mendiagnosis penyakit dari rontgen, memprediksi risiko kredit, atau mendeteksi berita palsu).

Di sinilah “bencana” sering terjadi.

Riset menemukan bahwa pada tugas keputusan, kolaborasi Manusia-AI menyebabkan penurunan kinerja yang signifikan.

Mengapa?

Karena seringkali manusia gagal mengenali kapan harus mempercayai AI dan kapan harus mempercayai intuisi sendiri.

Kita sering terjebak pada bias kognitif: terkadang kita terlalu percaya (overreliance) pada AI yang salah, atau kita terlalu skeptis (underreliance) dan menolak saran AI yang sebenarnya benar.

2. Tugas Kreasi (Creation Tasks):

Di sisi lain, untuk tugas yang melibatkan pembuatan konten terbuka (seperti menulis teks atau membuat gambar), hasilnya jauh lebih positif. Terdapat potensi perbaikan kinerja yang signifikan pada tugas kreasi dibandingkan tugas keputusan.

BACA INI JUGA ChatGPT Memory Full, Gimana Caranya Ya? Baca Posting Ini Terutama Yang Akunnya Sharing!

Mengapa tugas kreasi lebih berhasil? Filosofinya adalah tentang pembagian beban kognitif.

Dalam membuat gambar atau teks, AI seringkali melakukan pekerjaan “kasar” atau mengisi detail rutin sementara manusia memberikan inspirasi kreatif atau arahan strategis.

AI menangani hal-hal teknis yang membosankan, membebaskan manusia untuk fokus pada visi. Ini adalah bentuk kolaborasi yang lebih sehat.

Paradoks “Siapa yang Lebih Pintar?”

Temuan paling krusial dan mungkin yang paling perlu kita renungkan adalah tentang performa relatif.

Data menunjukkan pola yang sangat jelas:

Jika Manusia > AI: Ketika manusia sendirian sudah lebih jago daripada AI sendirian, maka kolaborasi akan meningkatkan hasilnya (Sinergi positif).
Jika AI > Manusia: Ketika AI sendirian sudah lebih jago daripada manusia, maka kolaborasi (campur tangan manusia) akan menurunkan hasilnya (Kerugian kinerja).

Contoh nyata dari paper ini adalah studi tentang deteksi ulasan hotel palsu. AI memiliki akurasi 73%, sementara manusia hanya 55%.

Ketika mereka digabungkan, akurasinya menjadi 69%.

Lihat kan? Kita malah “menyeret” turun performa AI. Karena manusia kurang kompeten dalam tugas ini, mereka tidak tahu kapan harus percaya pada AI sehingga keputusan akhirnya menjadi lebih buruk daripada jika kita membiarkan AI bekerja secara otomatis.

Sebaliknya, pada tugas klasifikasi gambar burung, manusia (81%) lebih jago dari AI (73%). Saat digabung, akurasi melonjak ke 90%.

Di sini, manusia yang kompeten tahu kapan harus menggunakan saran AI untuk menutupi celah pengetahuan mereka sendiri.

Ini mengajarkan kita sebuah kerendahan hati intelektual: Jika kita tidak ahli dalam suatu bidang, dan kita memiliki alat AI yang terbukti ahli, “mengoreksi” AI mungkin adalah tindakan egois yang merugikan.

Mengapa Kita Gagal Berkolaborasi?

Para peneliti di MIT ini menyoroti bahwa masalahnya bukan pada teknologinya saja, tapi pada prosesnya.

Sebagian besar eksperimen (sekitar 95%) mendesain sistem di mana manusia adalah pengambil keputusan terakhir.

Manusia melihat input, melihat saran AI, lalu mengetuk palu. Desain seperti ini sangat rentan terhadap human error.

Sangat sedikit studi (hanya 3 dari 106) yang mencoba desain di mana tugas dibagi-bagi (division of labor): AI mengerjakan bagian A, Manusia mengerjakan bagian B.

Padahal, sinergi sejati kemungkinan besar lahir dari pembagian tugas yang dinamis ini, bukan sekadar menjadikan AI sebagai “penasihat” yang bisa diabaikan.

BACA INI JUGA ChatGPT Kembali Mengupdate Modelnya, Kali Ini Bernama o1, Konon Jawabannya Selevel Pendidikan S3

Selain itu, faktor-faktor yang sering kita anggap penting seperti “Explainable AI” (AI yang memberikan penjelasan mengapa dia memilih jawaban X) atau tingkat kepercayaan diri (confidence level) AI, ternyata secara statistik tidak signifikan mempengaruhi terciptanya sinergi dalam kumpulan data ini.

Cukup mengejutkan karena banyak riset berfokus pada hal ini, padahal mungkin kuncinya ada pada siapa yang mengerjakan apa.

Apa yang Harus Kita Lakukan?

Berdasarkan insight dari paper ini, ada beberapa langkah strategis yang bisa kita ambil sebagai pengguna teknologi maupun pemimpin bisnis:

Fokus pada Generative AI untuk Kreasi: Karena tugas pengambilan keputusan (decision making) seringkali bermasalah, kita harus lebih banyak mengeksplorasi potensi sinergi dalam tugas generatif/kreasi.

Gunakan AI untuk brainstorming, membuat draf awal, atau visualisasi, di mana peran manusia sebagai kurator dan editor sangat bernilai.
Desain Ulang Proses Kerja (Workflow): Jangan hanya menempatkan manusia di akhir proses untuk “menyetujui” hasil AI.

Rancanglah proses yang inovatif di mana sub-tugas dialokasikan kepada pihak yang paling kompeten. Biarkan AI menangani analisis data massal secara otomatis, dan biarkan manusia menangani negosiasi atau empati.
Kenali Batas Kemampuan: Lakukan audit kinerja. Jika untuk tugas tertentu (misalnya entri data atau prediksi stok) AI terbukti 90% akurat dan tim manusia hanya 70%, pertimbangkan otomatisasi penuh.

Jangan memaksakan “Human-in-the-loop” hanya karena alasan sentimental atau ketakutan tak berdasar, kecuali ada risiko etika/keselamatan yang fatal.
Metrik Evaluasi yang Lebih Luas: Sinergi mungkin tidak terlihat jika kita hanya mengukur “akurasi”. Mungkin AI lebih cepat dan murah, tapi manusia bisa mencegah kesalahan fatal yang jarang terjadi (rare errors) yang biayanya sangat mahal.

Kita perlu melihat gambaran besarnya yaitu kecepatan, biaya, dan mitigasi risiko.

Kesimpulan: Menjadi Partner yang Lebih Bijak

Paper ini adalah wake-up call bagi kita semua. Bahwa menambahkan AI ke dalam pekerjaan manusia tidak otomatis mencetak sesuatu yang luar biasa.

Temuan bahwa rata-rata kolaborasi Manusia-AI menghasilkan kerugian kinerja adalah pengingat bahwa teknologi bukanlah sulap.

Teknologi adalah alat yang membutuhkan kebijaksanaan penggunanya.

Kita tidak boleh jatuh ke dalam Underreliance (merasa lebih pintar dari AI padahal tidak) atau Overreliance (mematikan otak dan menelan mentah-mentah hasil AI).

Masa depan bukan tentang Manusia lawan AI, atau sekadar Manusia ditambah AI.

Masa depan adalah tentang Manusia yang tahu kapan harus memimpin, kapan harus mengikuti, dan kapan harus membiarkan AI mengambil alih kemudi.

Jadilah pengguna yang kritis. Pahami di mana keunggulanmu, dan di mana keunggulan AI.

Hanya dengan begitu, sinergi yang sesungguhnya bisa tercipta.

source : https://www.nature.com/articles/s41562-024-02024-1

Yuk kuasai AI sampai jago, kami punya banyak produk yang cocok untuk kamu :

Research Magic bagi kamu yang ingin cepat lulus wisuda S1/S2/S3 atau dosen/peneliti
Analysis Magic untuk ngolah data bagi yang awam statistik
Boleh juga beli buku pegangan AI untuk skripsi disini

AI News, Generative AI