ChatGPT Sekarang Bisa Ditanya Pakai Suara dan Gambar

Baca berita tanpa iklan. Gabung Kompas.com+

Salin Artikel

ChatGPT Sekarang Bisa Ditanya Pakai Suara dan Gambar,

Dengan kemampuan ini, pengguna seolah bisa "ngobrol" dengan ChatGPT. Pengguna bisa bertanya pada ChatGPT menggunakan suara, dan ChatGPT akan memberi jawaban.

Obrolan tersebut juga akan terasa lebih hidup karena chatbot AI ini memberi jawaban dengan luwes, layaknya dua orang sedang mengobrol.

Kemampuan ini dapat dilakukan karena ChatGPT mengadopsi model text-to-speech yang baru. Sebuah teknologi yang dapat menghasilkan audio layaknya manusia, hanya dengan teks dan beberapa detik dari sampel speech (ucapan).

Lewat blog resminya, OpenAI juga memberi sampel suara dalam beberapa kondisi. Misalnya, suara saat membacakan dongeng, rekomendasi resep, pidato, puisi, hingga memberi jawaban berupa penjelasan.

Jenis suara yang tersedia terdiri dari lima jenis suara. Kelima suara tersebut masing-masing diberi nama Juniper, Sky, Cove, Ember, dan Breeze. Setiap suara memiliki ciri khasnya masing-masing, ada yang membacakan teks dengan nada datar, penuh intonasi, dan sebagainya.

Sedangkan untuk perintah menggunakan foto, ChatGPT kini dapat mengenali elemen dalam gambar. Menurut OpenAI, pengguna cukup memasukkan gambar dan mencantumkan pertanyaan yang ingin ditanyakan.

Misalnya, pengguna dapat mencantumkan foto sepeda dan bertanya kepada ChatGPT bagaimana cara membuat jok sepeda tersebut agar lebih rendah.

ChatGPT nantinya akan memberikan instruksi cara untuk menurunkan jok sepeda tersebut, serta merekomendasikan alat apa saja yang bisa digunakan.

Cara kerja yang ditawarkan cukup serupa dengan Google Lense. Pengguna juga sama-sama dapat mengirimkan foto dan melakukan pencarian lebih lanjut.

Hanya saja, cara mendapatkan informasinya berbeda. Google Lense memberikan jawaban/penjelasan secara deskriptif, sedangkan. ChatGPT memberikan jawaban dengan gaya yang lebih luwes, layaknya sedang berbicara dengan manusia langsung.

“Kami mulai menggelontorkan kemampuan suara dan gambar di ChatGPT. Mereka (sistem AI) menawarkan komunikasi yang baru dan lebih intuitif menggunakan suara atau menunjukkan (gambar) kepada ChatGPT mengenai obrolan yang sedang dibicarakan,” tulis OpenAI di blog resminya.

Fitur ini akan segera digelontorkan selama dua minggu ke depan. Pantauan KompasTekno, fitur masih belum hadir di Indonesia. Kemampuan baru ini hanya tersedia untuk pengguna berbayar (ChatGPT Plus) dan pengguna yang terdapat sebagai ChatGPT Enterprise (pelaku bisnis).

“Kami menggelontorkan (kemampuan) suara dan gambar di ChatGPT Plus dan Enterprise selama dua minggu kedepan. (Fitur) suara hanya akan hadir di iOS dan Android, dan (fitur) gambar akan tersedia di seluruh platform,” jelas OpenAI.

Di Indonesia, biaya langganan ChatGPT sebesar 20 dollar AS atau setara dengan Rp 303.500. Benefit dari langganan ini adalah dapat tetap mengakses platform di jam sibuk (peak times), mendapat respons lebih cepat dan detail, dan dapat mengakses fitur baru lebih awal.

Selain itu, teknologi suara yang dihadirkan juga dapat membuat suara sintetis dari sampel pidato asli. Namun, OpenAI menyadari bahwa kemampuan yang ditawarkan memiliki risiko keamanan yang bisa muncul di masa mendatang.

“Kemampuan ini menghadirkan risiko baru, seperti peluang aktor jahat yang menyamar sebagai publik figus atau melakukan penipuan,” jelas OpenAI.

Maka dari itu, teknologi hanya dipakai untuk kasus-kasus tertentu saja, seperti voice chat (pesan menggunakan suara). Fitur voice chat dibuat bersama aktor suara profesional yang sudah bekerja sama secara sah di perusahaan, sebagaimana dirangkum KompasTekno dari The Verge, Selasa (26/9/2023).