Studi Nature Medicine Menyebut Saran Kesehatan Chatbot AI Sering Tidak Akurat dan Berisiko bagi Pengguna

Pantau - Studi terbaru yang diterbitkan jurnal Nature Medicine mengungkapkan bahwa saran kesehatan dari chatbot kecerdasan buatan sering kali tidak akurat dan berisiko karena dapat berubah hanya akibat sedikit perubahan susunan kata dalam pertanyaan.

Penelitian ini melibatkan 1.200 peserta asal Inggris yang sebagian besar tidak memiliki pelatihan medis dan diminta menilai skenario medis terperinci berisi gejala, gaya hidup, serta riwayat kesehatan.

Para peserta kemudian berinteraksi dengan chatbot untuk menentukan langkah selanjutnya, seperti memanggil ambulans atau melakukan perawatan mandiri di rumah.

Hasilnya menunjukkan peserta memilih tindakan yang benar berdasarkan penilaian panel dokter kurang dari setengah waktu pengujian.

Pengguna juga hanya mampu mengidentifikasi kondisi medis yang tepat, seperti batu empedu atau perdarahan subarachnoid, sekitar 34 persen dari waktu yang diberikan.

Analisis interaksi memperlihatkan sekitar setengah kesalahan terjadi karena pengguna tidak memasukkan informasi yang cukup lengkap atau tidak menyampaikan gejala paling relevan.

Ketika para peneliti memasukkan skenario medis lengkap secara langsung ke dalam chatbot, tingkat diagnosis yang benar meningkat hingga 94 persen.

Sejak tiga tahun terakhir chatbot AI tersedia untuk umum, pertanyaan terkait kesehatan menjadi salah satu topik yang paling sering diajukan oleh pengguna.

Profesor Oxford Internet Institute sekaligus penulis senior studi Adam Mahdi menyatakan, “Kedokteran tidak seperti itu. Kedokteran itu berantakan, tidak lengkap, dan bersifat stokastik,”.

Dr Robert Wachter dari Universitas California, San Francisco, menjelaskan pentingnya mengenali detail relevan dalam diagnosis dan menyebut, “Ada banyak keajaiban kognitif dan pengalaman yang dibutuhkan untuk menentukan elemen-elemen penting dari suatu kasus yang kemudian dimasukkan ke dalam bot,”.

Andrew Bean, mahasiswa pascasarjana Oxford dan penulis utama studi, menilai beban merancang pertanyaan sempurna tidak seharusnya sepenuhnya ada pada pengguna dan chatbot seharusnya mampu mengajukan pertanyaan lanjutan layaknya dokter.

Para ahli juga menyoroti bahwa AI cenderung memberikan saran yang terlalu berhati-hati atau justru meremehkan gejala serius dalam sejumlah kasus.

Peneliti menyimpulkan model AI yang diteliti belum siap diterapkan secara langsung dalam perawatan pasien.