Lebih lanjut Google meminta tim privasi perusahaan untuk mengubah bahasa kebijakannya, guna memperluas kapasitas perusahaan terkait data konsumen, termasuk di layanan Google Docs. Kebijakan itu menurut The New York Times akan dipublikasikan pada 1 Juli mendatang.
Tidak hanya OpenAI, berbagai perusahaan seperti Meta dan Google juga kabarnya sedang kesulitan mendapat data pelatihan untuk LLM-nya, khususnya untuk memperoleh data secara legal.
Baca juga: Meta Latih AI Pakai Posting Pengguna Facebook dan Instagram
Tim AI Meta konon mempertimbangkan penggunaan karya ber-hak cipta tetapi tanpa izin demi mengejar kemampuan model OpenAI.
Namun setelah menelusur hampir semua buku, esai, puisi serta artikel berbahasa Inggris yang ada di internet, Meta kemungkinan akan memilih untuk membayar lisensi buku atau langsung membeli penerbit besar.
Sementara itu laporan Wall Street Journal (WSJ) menyebutkan bahwa jumlah data yang diserap berbagai perusahaan teknologi AI, akan melampaui jumlah konten baru pada tahun 2028.
Adapun solusi untuk menangani kendala itu, perusahaan harus melatih modelnya dengan data sintetis yang dibuat oleh model mereka sendiri. Praktik ini juga disebut sebagai "pembelajaran kurikulum".
Simak breaking news dan berita pilihan kami langsung di ponselmu. Pilih saluran andalanmu akses berita Kompas.com WhatsApp Channel : https://www.whatsapp.com/channel/0029VaFPbedBPzjZrk13HO3D. Pastikan kamu sudah install aplikasi WhatsApp ya.