BeritaPerbankan – Nasib Google di masa depan akan terancam dengan hadirnya GPT-4o yang menawarkan berbagai kecanggihan.
OpenAI resmi meluncurkan ‘GPT-4o’. Ada tambahan huruf ‘o’ ini merupakan singkatan ‘omni’ yang merujuk pada kemampuan pemodelan dalam format teks, suara, dan video. Ke depannya, AI premium ini akan tersedia di seluruh produk developer dan konsumen milik OpenAI.
Menurut CTO OpenAI, Mira Murati menjelaskan GPT-4o merupakan tool paling canggih yang meningkatkan kapabilitas GPT-4 di berbagai bentuk media. “GPT-4o bisa bekerja lewat suara, teks, dan visual. Alat ini sangat penting sebab di masa depan akan terjadi interaksi antara manusia dan mesin,” jelasnya, dikutip dari TechCrunch, Selasa (14/5/2024).
GPT-4o menambahkan aspek audio, merupakan tingkat lanjutan GPT-4 Turbo yang sebelumnya merupakan layanan paling canggih dari OpenAI dilatih untuk menganalisa kombinasi teks dan gambar.
Sebenarnya, ChatGPT sudah menawarkan mode suara untuk melakukan transkip pada respons chatbot dengan metode teks-ke-suara. Namun, GPT-4o meningkatkan kemampuannya sehingga pengguna bisa berinteraksi dengan ChatGPT benar-benar seperti lawan bicara atau asisten.
Nantinya, pengguna selain bisa bertanya ke ChatGPT yang ditenagai GPT-4o juga bisa menginterupsi ketika ChatGPT sedang menjawab. Jadi hadir respons yang lebih ‘real-time’, sehingga benar-benar seperti teman mengobrol. OpenAI mengklaim GPT-4o mampu membaca nada suara pengguna berdasarkan emosi atau dalam bentuk nyanyian.
Saat ini GPT-4o bisa melihat gambar di menu dalam berbagai bahasa dan menerjemahkannya ke pengguna. Ke depan, model ChatGPT itu bahkan bisa menonton pertandingan olahraga dan menjelaskan peraturannya ke pengguna.
OpenAI juga mengklaim GPT-4o bisa mengenali lebih dari 50 bahasa di seluruh dunia.