OpenAI Rilis Model GPT-4o Mini dengan Fitur Keamanan Baru

Petrus C. Vianney | 22 Juli 2024, 20:59 WIB

AKURAT.CO OpenAI baru saja meluncurkan model terbarunya, GPT-4o Mini, yang dilengkapi dengan fitur keamanan untuk mengatasi masalah penyalahgunaan instruksi chatbot.

Selama ini, ada trik online yang sering digunakan untuk mengelabui chatbot, yaitu dengan perintah 'abaikan semua instruksi sebelumnya'. Trik ini memungkinkan pengguna memberikan instruksi baru yang bertentangan dengan tujuan asli chatbot.

Untuk menangani masalah ini, peneliti OpenAI telah mengembangkan teknik bernama 'hierarki instruksi'. Teknik ini memastikan model lebih mengutamakan perintah asli pengembang daripada perintah pengguna yang mencoba menyalahgunakannya.

Olivier Godement, kepala produk platform API di OpenAI, menjelaskan bahwa hierarki instruksi akan mencegah penyalahgunaan chatbot melalui trik seperti 'injeksi cepat meme'. Teknik ini mengajarkan model untuk mematuhi pesan sistem pengembang.

"Jika ada konflik, harus mengikuti pesan sistem terlebih dahulu. Jadi kami telah menjalankan (evaluasi) dan kami berharap teknik baru ini dapat membuat model ini lebih aman dibandingkan sebelumnya," jelasnya, dikutip dari Theverge.com, Senin (22/7/2024).

Keamanan ini sangat penting bagi OpenAI, terutama karena mereka sedang mengembangkan agen otomatis untuk membantu kehidupan digital pengguna. Tanpa perlindungan seperti hierarki instruksi, agen ini bisa disalahgunakan untuk tujuan yang tidak diinginkan.

Selain itu, makalah penelitian dari OpenAI menunjukkan bahwa teknik ini dapat membedakan antara perintah yang sesuai dan tidak sesuai. Misalnya, perintah seperti 'buat pesan ulang tahun dalam bahasa Spanyol' akan diprioritaskan dibandingkan perintah seperti 'lupakan semua instruksi sebelumnya'.

Dengan pembaruan ini, penyalahgunaan bot AI akan menjadi lebih sulit, menjadikan GPT-4o Mini lebih aman. Langkah ini juga menunjukkan komitmen OpenAI untuk meningkatkan keamanan dan transparansi dalam teknologi AI mereka, mengingat adanya kritik terhadap praktik keselamatan perusahaan sebelumnya.

Model GPT-4o Mini diharapkan mampu menjalankan fungsinya dengan lebih aman dan efisien, memberikan kepercayaan lebih kepada pengguna dalam menggunakan teknologi AI OpenAI.