“Fingerprint ChatGPT: Metode Deteksi Teks DNA-GPT Menggunakan Analisis N-Gram Divergen”

Keberadaan kecerdasan buatan (Artificial Intelligence/AI) dalam kehidupan sehari-hari semakin terasa saat ini. Salah satu contoh penggunaannya adalah ChatGPT yang banyak digunakan untuk menyelesaikan tugas-tugas rutin atau mendapat bantuan dalam menyelesaikan masalah kompleks. Namun, penggunaan AI dalam menulis juga membawa tantangan baru, seperti maraknya berita palsu serta plagiarisme yang dibantu teknologi. Oleh karena itu, penting untuk memiliki metode deteksi yang efektif untuk menemukan teks yang dihasilkan oleh AI, seperti yang ditawarkan oleh DNA-GPT.

Tantangan Deteksi Teks AI

Meskipun model GPT (Generative Pre-trained Transformer) terbukti berguna sebagai asisten dalam menulis, keberadaannya juga memunculkan tantangan baru. Salah satu tantangan tersebut adalah kemunculan berita palsu yang dihasilkan oleh AI serta plagiarisme yang dibantu teknologi. Hal ini membuat peneliti dan pelaku industri semakin menyadari kebutuhan akan metode deteksi teks AI yang efektif.

Namun, deteksi teks AI bukanlah tugas yang mudah. Metode deteksi yang ada saat ini, seperti pendekatan berbasis gangguan atau rank/entropy-based, seringkali gagal ketika probabilitas token tidak disediakan, seperti pada kasus ChatGPT. Selain itu, kurangnya transparansi dalam pengembangan model bahasa yang kuat juga menjadi tantangan tambahan. Oleh karena itu, diperlukan metode deteksi yang dapat menjawab tantangan tersebut.

DNA-GPT: Metode Deteksi yang Efektif

DNA-GPT adalah metode deteksi teks AI yang efektif untuk teks yang dihasilkan oleh model GPT. Metode ini sangat penting untuk mendeteksi teks yang dihasilkan oleh AI mengingat kemajuan model bahasa semakin cepat dibandingkan dengan metode deteksi yang ada saat ini.

DNA-GPT bertujuan untuk memberikan solusi komprehensif dengan mempertimbangkan dua skenario: deteksi white-box dan deteksi black-box. Deteksi white-box dimana akses ke probabilitas token output model GPT tersedia, sementara deteksi black-box tidak memiliki akses tersebut.

Metode ini memanfaatkan pengamatan bahwa model bahasa cenderung menciptakan n-gram yang berulang-ulang dari generasi sebelumnya, sedangkan teks yang ditulis oleh manusia lebih jarang. Analisis teoretis fokus pada kemungkinan teks yang dihasilkan oleh AI dalam hal true positive rate (TPR) dan false positive rate (FPR). Hal ini memperkuat pandangan bahwa deteksi teks AI memang menjadi hal yang sangat penting seiring dengan kemajuan teknologi.

DNA-GPT menjadikan asumsi bahwa setiap model AI memiliki DNA yang unik, yang dapat muncul baik dalam kecenderungan untuk menghasilkan n-gram yang sama maupun dalam bentuk kurva probabilitasnya. Kemudian, tugas deteksi didefinisikan sebagai tugas klasifikasi biner, di mana tujuannya adalah untuk mengklasifikasikan apakah suatu urutan teks S dihasilkan oleh model bahasa LM atau ditulis oleh manusia.

DNA-GPT adalah algoritma deteksi nol-tembak untuk teks yang dihasilkan oleh model GPT, yang mampu menangani kedua skenario deteksi. Keefektifan algoritma ini telah divalidasi menggunakan lima model bahasa yang paling maju pada lima set data. Selain itu, keberhasilannya juga berhasil diuji terhadap teks non-Bahasa Inggris dan serangan teks yang telah direvisi. Metode deteksi juga memberikan kemampuan untuk melakukan pelacakan sumber model, sehingga dapat mengidentifikasi model bahasa yang digunakan untuk menghasilkan teks. Akhirnya, DNA-GPT juga menyediakan bukti terhadap keputusan deteksinya.

Dengan DNA-GPT, diharapkan deteksi teks yang dihasilkan oleh AI semakin terbantu. Metode ini tentunya akan terus dikembangkan seiring dengan kemajuan teknologi yang semakin pesat. Oleh karena itu, DNA-GPT menjadi solusi yang sangat relevan dan dibutuhkan untuk menangani tantangan deteksi teks AI.

Disarikan dari: Source