oleh Arys Hilman, Ketua Umum Ikatan Penerbit Indonesia (Ikapi)
Sebagian orang salah paham atas artikel “Mendebat Akal Imitasi”, mengira saya sedang mencemaskan kelahiran buku-buku yang memanfaatkan kecerdasan buatan (AI). Padahal, alih-alih khawatir tersaingi oleh karya AI, fokus artikel itu adalah aspek hukum pemanfaatan buku yang berhak-cipta (copyrighted book) sebagai dataset untuk materi latih AI.
Jadi, bayangkan sebagai penulis atau penerbit, Anda tiba-tiba sadar atau tahu bahwa Gemini, Claude, Meta, atau ChatGPT, ternyata mengambil karya Anda untuk melatih model AI yang ujung-ujungnya mesin itu memiliki pengetahuan tentang buku Anda atau bahkan punya kemampuan menulis buku serupa. Apakah Gemini, Claude, Meta, dan ChatGPT memberi Anda royalti? Apakah mereka memiliki lisensi untuk melakukan hal itu?
Di negeri dengan pembajakan tradisional masih menjadi isu besar seperti Indonesia, pencurian hak cipta oleh perusahaan teknologi besar (big tech) asing terdengar sayup-sayup. Saya mencoba googling dan nyaris tak menemukan tema ini menjadi isu. Sementara, pertarungan penulis-penerbit dengan para big tech di Eropa dan Amerika telah berlangsung bertahun-tahun.
Dua kasus paling terkenal di Amerika adalah Bartz versus Anthropic dan Kadrey versus Meta pada 2025. Bartz dan Kadrey mewakili para penulis buku; Anthropic adalah pembuat Claude AI; Meta adalah big techmilik Mark Zuckerberg pengembang Meta AI. Para penulis menggugat perusahaan AI karena telah mengambil konten karya mereka untuk dijadikan bahan latihan mesin AI, tanpa izin, tanpa membayar apa pun. Dalam kedua kasus, dua hakim yang berbeda telah mengetuk palu kemenangan bagi perusahaan teknologi: Penggunaan konten buku tersebut tanpa lisensi maupun royalti dibenarkan karena masih dalam batas penggunaan yang wajar (fair use).
Di Inggris, kegerahan penulis dan penerbit sudah menginjak tahun kelima setelah pemerintah pada 2021 menetapkan penggunaan prinsip opt-out dalam pemanfaatan isi buku untuk materi latih AI. Prinsip opt-out intinya membolehkan perusahaan AI untuk memanfaatkan konten buku hingga pada satu titik ketika penulis atau penerbitnya menyatakan penolakan. Jadi pakai dulu, soal izin belakangan. Ini berbeda dengan prinsip opt-in yang mempersyaratkan adanya lisensi terlebih dahulu bagi perusahaan AI untuk dapat mulai memanfaatkan isi buku.
Dengan ambisi untuk menjadi pemain besar industri AI, Inggris melihat opt-out sebagai jalan tercepat yang logis bagi pelatihan model AI. Publishers Association (PA), semacam Ikapi-nya Inggris, sebaliknya mencoba mengingatkan pemerintah bahwa prinsip opt-out mustahil dapat dijalankan dengan menyodorkan sejumlah argumen teknis, praktis, dan legal.
Sebagai pelaku utama industri perbukuan global, para penulis dan penerbit Inggris tentu layak mendapatkan perlindungan hukum atas karya-karya mereka. Namun, pemerintah berasumsi bahwa opt-in terlalu rumit untuk dijalankan, membatasi kecepatan langkah perusahaan AI, dan di sisi lain tetap menilai metode opt-out masih dapat berperan melindungi hak cipta para kreator.
Para penulis melawan. Maka, “Don’t Steal this Book” menjadi pesan mereka pekan lalu, dengan meminjam London Book Fair sebagai ranah aksi. Sepuluh ribu penulis bergabung menerbitkan buku perlawanan terhadap apa yang mereka sebut sebagai, “Pencurian buku dan perampokan mata pencaharian penulis.” Halaman-halaman buku perlawanan itu kosong, tak berisi teks apa pun, kecuali nama 10 ribu penulis penyokong aksi, di antaranya Mick Herron penulis Slow Horses, sejarawan David Olusuga, dan penulis Nought and Crosses, Malorie Blackman. Mereka menyebut industri AI dibangun di atas landasan barang curian … karya yang diambil tanpa permisi maupun pembayaran.
Baca juga: Mendebat Akal Imitasi
Tren di Amerika dan Eropa inilah yang dikhawatirkan akan menimpa para penulis dan penerbit Indonesia jika tidak sejak dini kita mengingatkan pemerintah. Apalagi jiran kita Vietnam, melalui UU Kecerdasan Artifisial, telah mengikuti pendekatan Eropa seiring ambisi pemerintahnya untuk menjadikan negeri itu poros pengembangan industri AI di Asia Tenggara.
Sejauh ini, regulasi hak cipta Indonesia memasukkan pemanfaatan karya tulis seperti buku untuk pelatihan AI sebagai penggunaan sekunder hak cipta. Jika naskah (manuskrip) milik penulis diterbitkan sebagai buku adalah penggunaan primer hak cipta, maka penggunaan sekunder adalah saat hak cipta berupa buku disalin, difotokopi, diperbanyak, dibagi-bagikan, disiarkan secara penuh dalam wahana lain, dan … dipakai sebagai alat latih model AI. Boleh saja AI memanfaatkan buku, tapi wajib bayar royalti kepada penulis dan penerbit.
Ketentuan itu ada dalam Peraturan Menteri Hukum dan HAM No. 15 Tahun 2024 tentang Pengelolaan Royalti atas Lisensi Penggunaan Sekunder Hak Cipta Buku dan/atau Karya Tulis Lainnya. Ketika bertanya tentang posisi pemerintah saat ini, saya mendapatkan jawaban dari Kementerian Hukum, “Indonesia mengambil pendekatan berimbang yang mendukung inovasi AI sekaligus pada saat yang sama memastikan para kreator tetap menerima pengakuan hak ekonomi yang wajar atas karya mereka … Indonesia sedang mempelajari perkembangan di tingkat internasional dan berpartisipasi dalam diskusi global.”
Pendekatan berimbang terdengar bijak, namun sulit menemukan landasan yang kokoh saat bicara tentang siapa pemain di kedua sektor itu. Industri AI Indonesia sejauh ini hanyalah pemain pinggiran di lingkup global, sementara industri kreatifnya sudah terbukti memberikan kontribusi PDB yang kian signifikan dan menjadi motor penggerak ekonomi yang resiliens. Memberikan porsi seimbang hanya akan menyerahkan kue ekonomi nasional kepada kepentingan para big tech luar negeri.***
Baca juga: Book Book Hota Hai
——
Catatan tentang Kelemahan Prinsip Opt-out menurut Publishers Association
Isu Teknis:
- Dua pendekatan menolak pemanfaatan oleh AI: Location-based, berdasarkan URL, robot.txt yang mengandung info bagaimana konten dapat diakses. Namun, cara ini hanya bekerja pada website yang berada dalam kontrol pemiliknya. Ketika konten tersebar pada tempat-tempat lain, kontrol itu hilang. Unit based, menggunakan metadata yang menerangkan konten opt-out. Cara ini tidak efektif pada saat metadata tidak tercantum, misalnya pada teks. Metadata juga bisa dihapus. Ada usulan automatic content recognition namun cara ini pun dinilai tidak reliable untuk mengenali opt-out.
- Tidak ada standar teknis bagaimana pemilik konten harus opt-out. Ada usul untuk opt-out berbasiswebsite, bukan konten, namun ini tidak efektif untuk menghadapi berbagai cara konten dibuat dan diedarkan. Empat tahun sejak exception oleh Uni Eropa, banyak industri gagal menerapkan konsep opt-out.
- Penerapan opt-out yang tak mengganggu keterbacaan di internet. Pengembang AI menyediakan fungsi penelusuran dengan dataset aktif. Pemilik data tidak memisahkan antara menyediakan data untuk search dan data untuk jadi materi latih AI. Dengan opt-out, berarti konten juga tidak dapat ditelusuri.
- Pemilik data mungkin mengizinkan sebagian mesin AI namun opt-out pada pengembang lainnya. Mereka perlu waktu sehingga kemungkinan ada penggunaan yang tidak sesuai. Bahkan pada perusahaan besar pun, potensi tertunda untuk opt-out besar.
- Teknologi yang berkembang tak memberikan kepastian pemilik data untuk mengenali cara crawling, misalnya kaca mata Met Ray Ban dan Apple Vision Pro atau robot humanoid seperti Tesla Optimus dapat saja mengambil hak cipta melalui kamera dan mikrofon.
Isu Praktis:
- Opt-out membebani pemilik data secara administratif, teknis, finansial, dan praktis. Contoh, penulis yang membuat karya melalui aneka platform, buku, academic paper, koran, blog, website, dalam jumlah besar. Selain membebani, cara ini juga melanggar prinsip deklaratif pada hak cipta.
- Tekanan waktu untuk memutuskan bagi pemilik data. Sebelum penerbit mengambil keputusan, data akan dipakai untuk melatih AI.
- Pemilik data tidak sadar tentang opt-out dan tidak memiliki kemampuan untuk melakukannya. Cara paling umum, misalnya, menggunakan file robot.txt untuk mengeblok crawler. Namun, sebagaimana tampak di Cloudflare, hanya 16 persen dari 100 top-visited sites yang mengeblok crawler.
Isu Legal:
- Tidak ada cara untuk menghapus pelanggaran di masa lalu atau menghentikan penggunaan lanjutan setelah opt-out berjalan. Tidak mungkin menghapus pekerjaan AI setelah sebuah model dlatih. Pelatihan harus mulai dari awal. Padahal, banyak model sudah dilatih sebelum release. Misal GPT-4 selesai training pada Agustus 2021, sementara peluncuran baru Maret 2023.
- Pembebanan formalitas pada prinsip hak cipta padahal seharusnya hak cipta berlaku otomatis saat sebuah karya dilahirkan, bukan pada saat dicatatkan. Konvensi Berne melarang penerapan formalitas.


