ChatGPT Kini Bisa Buat Gambar Hanya dengan Perintah Suara

OpenAI baru saja mengumumkan inovasi terbaru yang memungkinkan pengguna menciptakan gambar langsung di dalam ChatGPT. Fitur ini akan tersedia bagi pelanggan layanan ChatGPT Plus, Pro, Team, dan bahkan bisa diakses secara gratis oleh pengguna umum.

Dengan hadirnya fitur ini, pengguna tidak lagi perlu membuka DALL-E secara terpisah setiap kali ingin menghasilkan gambar unik, seperti ilustrasi kucing yang sedang menikmati lasagna di luar angkasa atau konsep kreatif lainnya. Selain itu, fitur ini juga akan diintegrasikan ke dalam platform Sora.

Sebagaimana dilaporkan oleh Engadget pada Kamis (27/3/2025), OpenAI menegaskan bahwa sistem ini mampu menghasilkan gambar berkualitas tinggi berdasarkan instruksi teks, percakapan, maupun file yang diunggah oleh pengguna.

Salah satu keunggulan utama yang diperkenalkan adalah kemampuan untuk mengedit dan menyesuaikan gambar yang telah ada sesuai permintaan pengguna. OpenAI juga menyebutkan adanya peningkatan signifikan dalam kemampuan rendering teks serta pemahaman konteks visual, memungkinkan hasil yang lebih akurat dan detail.

Fitur ini dirancang untuk memenuhi kebutuhan individu maupun profesional. OpenAI memberikan beberapa contoh penerapannya, termasuk dalam pembuatan infografis, desain promosi untuk media sosial, serta gambar dengan elemen teks yang kompleks.

Sebagai teknologi generasi terbaru, alat ini juga mendukung penciptaan visual dengan kualitas tinggi. OpenAI menyoroti kemampuannya dalam menghasilkan gambar yang mendekati realisme, dengan pencahayaan, bayangan, dan tekstur yang lebih presisi.

Pemahaman konteks yang lebih mendalam juga menjadi nilai tambah, karena memungkinkan pengguna membuat ilustrasi berdasarkan konsep yang telah dibahas dalam percakapan. Misalnya, sistem dapat menghasilkan ‘poster burung yang ditemukan di Central Park’ atau ‘visualisasi dari era sejarah seni tertentu’.

Fitur ini dikembangkan di atas model GPT-4o, yang merupakan versi AI multimodal pertama yang diperkenalkan OpenAI tahun lalu. Huruf ‘o’ dalam namanya merujuk pada “omni”, yang mencerminkan kemampuan model dalam mengolah berbagai jenis input, termasuk teks, gambar, dan suara.

Pengumuman terbaru ini menandai langkah penting menuju visi yang pernah diungkapkan oleh CEO OpenAI, Sam Altman, beberapa waktu lalu—sebuah sistem AI yang dapat mengintegrasikan berbagai fungsi dalam satu platform.

Read Also