Melalui RLHF, tanggapan teks GenAI ditinjau dan divalidasi oleh manusia, untuk memastikan respons sudah tepat, akurat, dan selaras dengan tujuan yang diharapkan. Penyedia GenAI juga membuat filtrasi untuk mencegah materi tak pantas.
Luasnya jangkauan pengguna seperti ChatGPT, beragamnya budaya di berbagai negara, bahasa, dan rasa kata yang berbeda di seluruh dunia, tentu membuat hal ini tidak mudah. Kemungkinan lolosnya materi tak diinginkan, bisa selalu terjadi.
Terkait luaran GenAI berupa gambar, video dan musik, juga tak lepas dari unsur hak cipta. Luaran yang mungkin tampak baru itu mulai diklaim sebagai obyek hak cipta.
Namun di sisi lain, karya itu bisa hanya merupakan kombinasi kompleks dari jutaan gambar, video, atau musik yang berasal dari bahan pelatihan. Kenyataan ini yang kerap menjadi polemik.
Ada asumsi yang menyatakan, konten dan data yang dilatihkan adalah obyek yang dindungi hak cipta. Dengan demikian perlu lisensi. Selain menerapkan prinsip penggunaan wajar (fair use).
Namun pendapat lain justru menyatakan, konten yang dilatihkan hanyalah sebatas referensi dan bahan awal, seperti yang juga dilakukan para kreator manusia. Kecerdasan buatanlah yang kemudian menciptakan konten baru, sehingga layak dilindungi hak cipta.
Oleh karena itu, tak mengherankan, jika ada upaya para pengembang AI di berbagai negara, untuk menjadikan AI sebagai inventor, "pencipta", author, atau bahkan komposer.
Terkait polemik hak cipta ini, UCL mencontohkan, misalnya genre musik Rock and Roll yang merupakan gabungan ide dari musik R&B, gospel, dan country. Karya musik ini, kerap memanfaatkan ide-ide dari karya sebelumnya.
Demikian juga GenAI, yang sebenarnya menggunakan karya-karya sebelumnya sebagai luarannya dan dilakukan tanpa persetujuan pencipta aslinya.
Perlu dipahami, seperti dijelaskan UCL, pelatihan GPT4 melibatkan satu juta gigabyte data. Energi yang dibutuhkan juga luar biasa.
Pelatihan GPT3 yang digunakan oleh ChatGPT versi pertama, diperkirakan menghabiskan 1.287 megawatt-jam listrik, dan menghasilkan 552 ton karbon dioksida, setara dengan 123 mobil yang dikendarai selama satu tahun.
Terkait dengan luaran berupa gambar, UCL menyebut instrumen “Generative Adversarial Networks (GANs)”. GAN memiliki dua bagian yang disebut 'generator' dan 'diskriminator.
Generator membuat gambar acak sebagai respons terhadap perintah yang ditulis. Sedangkan diskriminator akan membedakan antara gambar yang dihasilkan dan gambar nyata.
Generator, kemudian menggunakan hasil diskriminator untuk menyesuaikan parameternya untuk membuat gambar lain.
Proses ini bisa terjadi dan berulang ribuan kali bahkan lebih agar menghasilkan gambar semakin realistis. GAN yang dilatih dengan ribuan foto lanskap, dapat menghasilkan gambar lanskap baru, namun “fiktif” yang sangat berbeda dengan foto aslinya.