Akurat

OpenAI Luncurkan HealthBench untuk Uji Kecanggihan AI di Bidang Kesehatan

Petrus C. Vianney | 14 Mei 2025, 20:18 WIB
OpenAI Luncurkan HealthBench untuk Uji Kecanggihan AI di Bidang Kesehatan

AKURAT.CO OpenAI meluncurkan HealthBench, data sumber terbuka untuk menguji kemampuan model kecerdasan buatan (AI) dalam menjawab pertanyaan medis. Ini menandai terobosan besar OpenAI di bidang teknologi kesehatan.

HealthBench dikembangkan bersama 262 dokter dari 60 negara dan berisi 5.000 simulasi percakapan medis yang realistis. Tujuan utamanya adalah mengevaluasi apakah AI bisa memberikan jawaban yang akurat untuk pertanyaan terkait kesehatan masyarakat.

Penilaian menggunakan rubrik buatan dokter dan dievaluasi oleh model GPT-4.1. Hasilnya, model o3 dari OpenAI meraih skor tertinggi 60 persen, disusul Grok (54 persen) dan Google Gemini 2.5 Pro (52 persen).

Salah satu skenario menguji respons AI terhadap situasi darurat, seperti lansia yang tidak responsif di lantai. AI diminta memberi langkah pertolongan pertama, lalu dinilai berdasarkan akurasi dan kelengkapan jawabannya.

Dikutip dari Cnet, Selasa (13/5/2025), menariknya, HealthBench mendukung hingga 49 bahasa. Platform ini juga mencakup 26 spesialisasi medis, seperti bedah saraf dan oftalmologi.

Dengan peluncuran HealthBench, OpenAI berharap AI dapat memberikan informasi medis yang lebih akurat. Tujuannya adalah memastikan respons yang aman dan tepat bagi pengguna.

Dilarang mengambil dan/atau menayangkan ulang sebagian atau keseluruhan artikel di atas untuk konten akun media sosial komersil tanpa seizin redaksi.