Tanda air untuk chatbots dapat menawar materi pengungkapan tekstual yang ditulis oleh AI

Tanda air untuk chatbots dapat menawar materi pengungkapan tekstual yang ditulis oleh AI

Alat ini mungkin juga memungkinkan guru menghentikan plagiarisme atau membantu platform media sosial melawan bot disinformasi.

Diam tangan wanita menulis daftar fungsi

Foto Getty

Pola tersembunyi yang sengaja terkubur dalam teks yang dihasilkan AI mungkin juga akan membantu menetapkannya seperti itu, memungkinkan kita untuk mengetahui apakah kata-kata yang kita pelajari ditulis oleh manusia atau tidak.

“Tanda air” ini tidak terlihat oleh saksi manusia, tetapi membiarkan teknik komputer mendeteksi bahwa materi pengungkapan tekstual kemungkinan besar berasal dari perangkat AI. Jika disematkan dalam gadget bahasa yang luar biasa, mereka mungkin juga hanya membantu mencegah salah satu komplikasi penting utama yang telah dinikmati oleh gadget ini.

Misalnya, sejak chatbot ChatGPT OpenAI diluncurkan pada November, para siswa sudah mulai curang dengan menggunakannya untuk menulis esai untuk mereka. Arena data internet CNET memiliki ChatGPT yang lemah untuk menulis artikel, hanya untuk menikmati koreksi negara di tengah tuduhan plagiarisme. Membangun potensi watermarking menjadi teknik seperti itu sebelum diluncurkan mungkin juga akan membantu mengatasi komplikasi tersebut.

Dalam laporan, tanda air ini sudah lemah untuk membuat materi pesan teks yang dihasilkan AI dengan tujuan taruhan tertentu. Para peneliti di University of Maryland, misalnya, berada di tempat untuk menjejalkan materi pengungkapan tekstual yang dibuat oleh model bahasa pengantar Meta, OPT-6.7B, menggunakan algoritme deteksi yang mereka buat. Pekerjaan tersebut dijelaskan dalam makalah yang belum ditinjau, dan kode tersebut tampaknya akan tersedia gratis sekitar 15 Februari.

Gadget bahasa AI bekerja dengan memprediksi dan menghasilkan satu frase pada satu waktu. Setelah setiap frasa, algoritme watermarking secara acak membagi kosakata manekin bahasa menjadi kata-kata pada “daftar hijau” dan “daftar merah”, lalu meminta manekin untuk menginginkan kata-kata di daftar hijau.

HOT 🔥  Bagaimana obat yang meretas jam sirkadian kita mungkin pada akhirnya dapat merusak kesehatan kita

Semakin banyak kata-kata yang masuk daftar hijau dalam suatu bagian, semakin terlihat bahwa materi pengungkapan tekstual itu dihasilkan oleh mesin. Teks yang ditulis oleh seseorang cenderung mewakili campuran kata yang lebih acak. Sebagai contoh, untuk frasa “estetika”, algoritme watermarking mungkin juga akan mengklasifikasikan frasa “bunga” sebagai hijau dan “anggrek” sebagai merah. Model AI dengan algoritme watermarking mungkin lebih rentan untuk menggunakan kata “bunga” daripada “anggrek,” jelas Tom Goldstein, asisten profesor di University of Maryland, yang pernah tertarik dengan tinjauan tersebut.

ChatGPT adalah salah satu generasi asli dari gadget bahasa super yang menghasilkan materi pengungkapan tekstual yang sangat lancar sehingga tidak cocok untuk tulisan manusia. Gadget AI ini memuntahkan informasi dengan percaya diri, tetapi terkenal karena memuntahkan kebohongan dan bias. Bagi saksi yang tidak terlatih, kemungkinan besar akan hampir tidak membedakan bagian yang ditulis oleh model AI dari yang ditulis oleh manusia. Kecepatan AI yang mencengangkan menunjukkan bahwa perangkat asli yang lebih kuat dengan cepat mengumpulkan perangkat lunak kami yang canggih untuk mendeteksi materi pengungkapan teks buatan menjadi kurang efektif. Ini adalah pelarian konstan antara pengembang AI untuk membuat instrumen keselamatan asli yang dapat menandingi gadget AI generasi terbaru.

“Saat ini, ini adalah Wild West,” kata John Kirchenbauer, seorang peneliti di University of Maryland, yang pernah tertarik dengan pekerjaan watermarking. Dia berharap instrumen watermarking juga dapat memberikan upaya deteksi AI. Alat yang dikembangkan krunya akan disesuaikan untuk bekerja dengan model bahasa AI apa pun yang memprediksi kata berikutnya, katanya.

Temuannya menjanjikan dan waktunya tepat, kata Irene Solaiman, direktur kebijakan di startup AI Hugging Face, yang bekerja mempelajari deteksi output AI di misi sebelumnya sebagai peneliti AI di OpenAI, namun tidak lagi tertarik dengan ulasan ini.

HOT 🔥  Bagaimana CRISPR membuat hewan ternak menjadi lebih baik, lebih kuat, dan lebih sehat

“Saat gadget sedang digunakan dalam skala besar, lebih banyak orang di luar lingkungan AI, yang tampaknya tanpa pelatihan ilmu komputer, ingin mengumpulkan izin untuk saran deteksi,” kata Solaiman.

Ada batasan untuk potensi asli ini, kalau tidak. Watermarking hanya berfungsi jika tertanam dalam model bahasa yang luar biasa oleh pembuatnya sejak awal. Bahkan jika OpenAI konon bekerja untuk mempelajari cara mendeteksi materi pengungkapan tekstual yang dihasilkan AI, termasuk tanda air, gambaran umum tetap sangat rahasia. Perusahaan tidak bersedia untuk memberikan catatan berharga tentang cara kerja ChatGPT pada acara luar atau pernah dilatih, apalagi mengumpulkan izin untuk mengutak-atiknya. OpenAI tidak tanpa menjawab permintaan kami untuk observasi.

Juga tidak jelas bagaimana karya asli tampaknya akan mengenali berbagai gadget apalagi Meta, mirip dengan ChatGPT, kata Solaiman. Model AI tempat tanda air saat diuji juga lebih kecil dari pada model perangkat seperti ChatGPT.

Lebih banyak pengujian diperlukan untuk mengeksplorasi berbagai saran yang mungkin juga akan diupayakan seseorang untuk melawan dorongan terhadap saran watermarking, namun para peneliti mengartikulasikan bahwa pilihan alternatif penyerang dibatasi. “Anda akan senang memperdagangkan sekitar setengah dari kata-kata dalam sebuah bagian dari materi pengungkapan tekstual sebelum tanda air dihapus,” kata Goldstein.

“Tidak baik meremehkan siswa sekolah menengah atas, jadi saya tidak akan melakukan itu,” kata Solaiman. “Tapi pada dasarnya orang biasa kebanyakan tidak dapat mengutak-atik tanda air yang kurang lebih ini.”

Cakupan Asli

Baca juga

Abaikan bayi desainer.  Inilah cara CRISPR mengubah sebagian besar kehidupan

Abaikan bayi desainer. Inilah cara CRISPR mengubah sebagian besar kehidupan

Abaikan He Jiankui, ilmuwan bahasa China yang menciptakan bayi yang diedit gennya. Sebagai tambahan, meskipun …

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *