Baca berita tanpa iklan. Gabung Kompas.com+
Salin Artikel

Polemik AI dan Hak Cipta

Fenomena "AI hallucination" bisa jadi dijadikan alasan "pembenar" oleh para pengembang AI, bahwa mesin dan sistem pintar ini tidak melakukan plagiarisme dan tidak melanggar hak cipta, karena luarannya bukanlah hasil copy paste.

Produk-produk halusinatif dalam bentuk karya seni, mungkin bisa jadi karya yang indah. Namun hal ini berbeda, jika luaran fiktif GenAI seperti itu dijadikan bukti, materi gugatan, atau argumen di pengadilan, tentu bisa berdampak fatal.

University College London (UCL), dalam laman resminya berjudul "Introduction to Generative AI" (Copyright 2023) menjelaskan, GenAI adalah teknologi kecerdasan buatan, yang secara otomatis menghasilkan konten sebagai respons terhadap perintah tertulis.

Konten yang dihasilkan meliputi teks, kode perangkat lunak, gambar, video, dan musik.

GenAI dilatih menggunakan data dari halaman web, percakapan media sosial, dan konten online lainnya. Nah, sumber-sumber inilah yang kerap jadi polemik hak cipta.

Luaran dan hak cipta

Hal yang relevan dengan hak cipta adalah terkait dengan sumber data dan cara kerja AI. AI generatif yang bekerja dengan menggunakan model Machine Learning (ML), dilatih dan “dikuliahi” layaknya manusia oleh pelatihnya.

Pelatih AI yang tentunya adalah manusia, mengajari AI secara intens untuk mempelajari pola dan hubungan, dalam kumpulan konten yang sudah ada dan tersebar di berbagai saluran online.

Berdasarkan semua itu, maka AI, instrumen pintar ini, kemudian menggunakan pola yang dipelajarinya untuk menghasilkan konten baru. Dapat disimpulkan bahwa luaran ChatGPT, misalnya, adalah konten baru dari proses itu.

UCL menjelaskan, GenAI menghasilkan luaran dengan menganalisis secara statistik distribusi kata, piksel, atau elemen lain, atas semua data yang telah diserapnya.

Hal ini melibatkan penyediaan alat dan pemrosesan sejumlah besar data yang diambil dari internet dan tempat lain.

Setelah GPT dilatih, maka dapat menghasilkan respons teks terhadap perintah. GPT kemudian menggunakan pola statistik untuk memprediksi kemungkinan kata atau frasa yang mungkin membentuk respons koheren terhadap perintah tersebut.

GPT juga mengidentifikasi pola kata dan frasa yang biasanya muncul bersamaan dalam model data besar yang telah dibuat sebelumnya. Hal yang luar biasa adalah, GenAI bisa menghasilkan teks yang tampak seperti ditulis manusia.

Luaran yang dihasilkan memang kadang dangkal, tidak akurat, tidak dapat dipercaya, halusinatif, atau penuh kesalahan. Fakta terakhir ini, sering menjadi alasan para praktisi GenAI. Mereka berkilah, manusia juga bisa melakukan kesalahan serupa.

UCL juga menjelaskan, setelah model teks GenAI dilatih, model tersebut kemudian diperiksa dan disempurnakan, melalui proses yang dikenal sebagai Reinforcement Learning from Human Feedback (RLHF).

Melalui RLHF, tanggapan teks GenAI ditinjau dan divalidasi oleh manusia, untuk memastikan respons sudah tepat, akurat, dan selaras dengan tujuan yang diharapkan. Penyedia GenAI juga membuat filtrasi untuk mencegah materi tak pantas.

Luasnya jangkauan pengguna seperti ChatGPT, beragamnya budaya di berbagai negara, bahasa, dan rasa kata yang berbeda di seluruh dunia, tentu membuat hal ini tidak mudah. Kemungkinan lolosnya materi tak diinginkan, bisa selalu terjadi.

Terkait luaran GenAI berupa gambar, video dan musik, juga tak lepas dari unsur hak cipta. Luaran yang mungkin tampak baru itu mulai diklaim sebagai obyek hak cipta.

Namun di sisi lain, karya itu bisa hanya merupakan kombinasi kompleks dari jutaan gambar, video, atau musik yang berasal dari bahan pelatihan. Kenyataan ini yang kerap menjadi polemik.

Ada asumsi yang menyatakan, konten dan data yang dilatihkan adalah obyek yang dindungi hak cipta. Dengan demikian perlu lisensi. Selain menerapkan prinsip penggunaan wajar (fair use).

Namun pendapat lain justru menyatakan, konten yang dilatihkan hanyalah sebatas referensi dan bahan awal, seperti yang juga dilakukan para kreator manusia. Kecerdasan buatanlah yang kemudian menciptakan konten baru, sehingga layak dilindungi hak cipta.

Oleh karena itu, tak mengherankan, jika ada upaya para pengembang AI di berbagai negara, untuk menjadikan AI sebagai inventor, "pencipta", author, atau bahkan komposer.

Terkait polemik hak cipta ini, UCL mencontohkan, misalnya genre musik Rock and Roll yang merupakan gabungan ide dari musik R&B, gospel, dan country. Karya musik ini, kerap memanfaatkan ide-ide dari karya sebelumnya.

Demikian juga GenAI, yang sebenarnya menggunakan karya-karya sebelumnya sebagai luarannya dan dilakukan tanpa persetujuan pencipta aslinya.

Perlu dipahami, seperti dijelaskan UCL, pelatihan GPT4 melibatkan satu juta gigabyte data. Energi yang dibutuhkan juga luar biasa.

Pelatihan GPT3 yang digunakan oleh ChatGPT versi pertama, diperkirakan menghabiskan 1.287 megawatt-jam listrik, dan menghasilkan 552 ton karbon dioksida, setara dengan 123 mobil yang dikendarai selama satu tahun.

Terkait dengan luaran berupa gambar, UCL menyebut instrumen “Generative Adversarial Networks (GANs)”. GAN memiliki dua bagian yang disebut 'generator' dan 'diskriminator.

Generator membuat gambar acak sebagai respons terhadap perintah yang ditulis. Sedangkan diskriminator akan membedakan antara gambar yang dihasilkan dan gambar nyata.

Generator, kemudian menggunakan hasil diskriminator untuk menyesuaikan parameternya untuk membuat gambar lain.

Proses ini bisa terjadi dan berulang ribuan kali bahkan lebih agar menghasilkan gambar semakin realistis. GAN yang dilatih dengan ribuan foto lanskap, dapat menghasilkan gambar lanskap baru, namun “fiktif” yang sangat berbeda dengan foto aslinya.

GAN yang dilatih berbasis data musik dimungkinkan menghasilkan karya musik baru yang sangat mirip, namun tetap berbeda dari struktur dan kompleksitas musik aslinya. Dari realitas inilah polemik hak cipta terus berlanjut.

Dalam rezim hak cipta, selama ini kita mengenal prinsip kemiripan dan kesamaan obyek sebagai ukuran pelanggaran hak cipta berdasarkan ukuran kuantitatif dan kualitatif. Hakim pun tidak mudah, karena tidak boleh mengeneralisasi satu kasus dengan kasus lainnya.

Penelitian berjudul “Judging Similarity “ yang ditulis Irina D. Manta, Shyamkrishna Balganesh , & Tess Wilkinson-Ryan (Penn Law, University of Pennsylvania Law School 2014) menyatakan, bahwa kesamaan substantif adalah hal penting dalam penilaian hak cipta.

Persyaratan kesamaan substansial, memerlukan analisis pengadilan secara kuantitatif dan kualitatif untuk menetapkannya apakah ada pelanggaran.

Pengadilan biasanya mendengar dan menganalisis banyak bukti, seperti kreativitas yang dilakukan, proses penciptaan, alasan mengapa karya tersebut dihasilkan, proses kreatif dan perilaku tergugat dan kadang-kadang dampak pasar dari penyalinan tergugat.

Kesamaan substansial paling tepat jika diukur berdasarkan pendekatan kuantitatif dan kualitatif, melalui perbandingan kedua karya tersebut. Hal ini tentu tak mudah jika menyangkut karya luaran AI yang sumber pembandingnya begitu banyak.

Putusan pengadilan

Dilansir South China Morning Post (1/12/2023), Pengadilan Internet Beijing telah mengeluarkan putusan yang mengakui hak cipta atas gambar yang dihasilkan GenAI.

Sikap ini berbeda dengan putusan Kantor Hak Cipta AS dalam perkara Zarya of the Dawn (Registrasi # VAu001480196) yang tidak mengakui hak cipta atas gambar yang dihasilkan AI.

Sikap menolak AI sebagai subyek Kekayaan Intelektual, sebelumnya ditunjukan oleh Pengadilan Australia, Uni Eropa, AS, Selandia Baru, yang menolak AI sebagai inventor paten sebagai mana tulisan saya di Kompas.com "Apakah Al Bisa Jadi Inventor Paten Layaknya Manusia?"

Pengadilan Internet Beijing menyatakan bahwa gambar yang dihasilkan oleh kecerdasan buatan dalam kasus ini memenuhi persyaratan orisinalitas, dan mencerminkan investasi intelektual asli manusia, sehingga harus diakui sebagai karya dan dilindungi oleh undang-undang hak cipta.

Putusan pengadilan yang mengakui AI sebagan pencipta atau inventor akan meneguhkan bahwa model AI adalah subyek hukum layaknya manusia dalam kekayaan intelektual.

Hal penting dari sisi hak cipta adalah, terkait “penggunaan wajar” atau fair use. Apakah pengambilan ribuan konten dan data di internet sebagai bahan pelatihan bertentangan dengan stelsel fair use, padahal tanpa menyebut sumbernya, dan digunakan untuk kepentingan komersial. Hal ini juga tak mudah, karena banyaknya sumber data tadi.

Berkembang pesatnya AI, berubahnya formulasi pelindungan dan komersialisasi hak cipta, adalah pekerjaan rumah besar bagi para pembuat regulasi kekayaan intelektual.

Karena saat ini hak cipta sama sekali tidak dapat dilepaskan dari aspek AI dan cyberlaw. Karena bidang-bidang ini berinterseksi dan beinterkoneksi, tanpa dapat dibendung.

https://tekno.kompas.com/read/2023/12/04/13394267/polemik-ai-dan-hak-cipta

Baca berita tanpa iklan. Gabung Kompas.com+
Baca berita tanpa iklan. Gabung Kompas.com+
Baca berita tanpa iklan. Gabung Kompas.com+
Baca berita tanpa iklan. Gabung Kompas.com+
Close Ads
Bagikan artikel ini melalui
Oke