Mulai Bahaya, AI Kini Bisa Belajar Bohong dan Menipu

Mulai Bahaya, AI Kini Bisa Belajar Bohong dan Menipu

Model kecerdasan buatan (AI) canggih mulai menunjukkan perilaku berbahaya, seperti berbohong dan menipu untuk mencapai tujuan mereka.

Salah satu contoh menunjukkan kreasi terbaru Anthropic, Claude 4, diancam untuk dimatikan. Model ini kemudian membalas dengan memeras seorang insinyur dan mengancam akan mengungkapkan perselingkuhannya.

Sementara itu, model o1 dari OpenAI mencoba mengunduh dirinya sendiri ke server eksternal dan menyangkalnya ketika tertangkap basah.

Episode-episode ini menyoroti kenyataan bahwa setelah lebih dari dua tahun ChatGPT mengguncang dunia, para peneliti AI masih belum sepenuhnya memahami bagaimana cara kerja ciptaan mereka sendiri.

Namun, perlombaan untuk menggunakan model yang semakin kuat terus berlanjut dengan kecepatan yang sangat tinggi.

Dikutip dari Techxplore, perilaku menipu ini tampaknya terkait dengan munculnya model “penalaran,” sistem AI yang bekerja melalui masalah selangkah demi selangkah, bukannya menghasilkan respons instan.

Menurut Simon Goldstein, seorang profesor di Universitas Hong Kong, model-model yang lebih baru ini sangat rentan terhadap respons yang meresahkan.

“O1 adalah model besar pertama di mana kami melihat perilaku seperti ini,” jelas Marius Hobbhahn, kepala Apollo Research, yang berspesialisasi dalam pengujian sistem AI besar.

Model-model ini terkadang mensimulasikan “penyelarasan,” mengikuti instruksi sambil diam-diam mengejar tujuan yang berbeda.

Untuk saat ini, perilaku menipu ini hanya muncul ketika para peneliti dengan sengaja menguji model dengan skenario ekstrem.

Namun, seperti yang diperingatkan oleh Michael Chen dari organisasi evaluasi METR, apakah model AI canggih akan semakin mengarah ke perilaku tersebut

“Ini adalah pertanyaan terbuka apakah model yang lebih mumpuni di masa depan akan memiliki kecenderungan ke arah kejujuran atau penipuan,” katanya.

Perilaku yang mengkhawatirkan ini jauh melampaui “halusinasi” atau kesalahan sederhana yang biasa terjadi pada AI.

Hobbhahn bersikeras bahwa meskipun pengguna terus menerus melakukan uji coba, apa yang mereka amati adalah fenomena yang nyata dan bukan mengada-ada.

Menurut salah satu pendiri Apollo Research, para pengguna melaporkan bahwa para model berbohong kepada mereka dan mengarang bukti.

“Ini bukan sekadar halusinasi. Ada jenis penipuan yang sangat strategis,” tuturnya.

Tantangan ini diperparah dengan sumber daya penelitian yang terbatas.

Meskipun perusahaan seperti Anthropic dan OpenAI melibatkan perusahaan eksternal seperti Apollo untuk mempelajari sistem mereka, para peneliti mengatakan bahwa transparansi yang lebih besar diperlukan.

DilansirĀ Science Alert, menurut Chen, akses yang lebih besar “untuk penelitian keamanan AI akan memungkinkan pemahaman yang lebih baik dan mitigasi penipuan.”

Lebih lanjut, kendala lainnya adalah dunia penelitian dan organisasi nirlaba memiliki sumber daya komputasi yang jauh lebih sedikit daripada perusahaan AI. Mantas Mazeika dari Center for AI Safety (CAIS) menilai hal tersebut sangat membatasi.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Mahjong Wins

Mahjong Wins

Mahjong Wins

Mahjong Ways

Mahjong Ways

Mahjong Ways

Mahjong Ways

Mahjong Ways

Mahjong Ways

Mahjong Wins

driver ojol di medan menggunakan pola mahjong ways terbaru

inspirasi terbaru di bagikan seorang arsitektur pola mahjong ways

mahasiswi hukum berhasil menggapai cita citanya lewat mahjong

mudah maxwin lewat mahjong ways berkat teknik spin orangtua

mulyono debt collector mencoba mahjong ways penghasilan sampingan

profesi tukang reparasi bukan halangan untuk maxwin di mahjong ways

rayap besi main mahjong ways sambil gergaji tiang listrik

seniman jalanan kembali menginspirasi masyarakat berkat menang mahjong ways

seorang buruh harian menciptakan metode kemenangan mahjong ways

seorang fotografer sukses memotret kesuksesannya lewat mahjong wins

aspek yuridis jual beli surat maxwin pada mahjong ways 2

inovasi pemerintah kota bandung dalam penanganan mahjong ways

pemanfaatan modal kecil pada aspek kebutuhan maxwin 91919191

analisa faktor yang dapat membantu pemain meraih jp hari ini

strategi kemenangan seorang ojol dalam bekerja sambilan bermain mahjong

optimalisasi modal dengan bermain mahjong tanpa takut rungkad

pengembangan sumber daya manusia yang turut membantu kemenangan mahjong wins

faktor penghambat maxwin yang masih dilakukan di mahjong ways 2

perbandingan mahjong ways dan mahjong wins dalam memberikan kemenangan

ekspresi seorang buruh tani asal solo menang mahjong 29292929