Google Gemini Hadirkan Fitur Edit Foto Langsung di Aplikasi dan Web

Google terus berinovasi dalam ranah kecerdasan buatan (AI) dengan menghadirkan fitur pengeditan foto langsung pada chatbot AI Gemini. Fitur ini memungkinkan pengguna untuk memodifikasi gambar yang dihasilkan oleh AI, serta gambar pribadi mereka, langsung di dalam aplikasi maupun platform web Gemini.

Kemampuan pengeditan gambar asli (native image editing) ini diluncurkan secara bertahap oleh Google dan akan tersedia dalam lebih dari 45 bahasa di berbagai negara dalam beberapa minggu mendatang. Pengguna di Indonesia sudah dapat mencoba fitur ini melalui aplikasi seluler atau web Gemini.

Dengan fitur ini, pengguna dapat dengan mudah mengubah latar belakang gambar, menambahkan atau mengganti objek, bahkan menyisipkan elemen baru ke dalam foto. Misalnya, pengguna dapat mengunggah foto diri dan meminta Gemini untuk menampilkan bagaimana penampilan mereka dengan warna rambut yang berbeda, atau menambahkan aksesori lucu seperti topi pada foto hewan peliharaan.

Proses pengeditan dilakukan secara bertahap, memungkinkan pengguna untuk menumpuk perubahan tanpa harus memulai dari awal jika ingin memodifikasi hasil sebelumnya. Fitur ini didukung oleh model Gemini 2.0 Flash, yang diperkenalkan pertama kali pada Desember 2024 dan dirilis secara resmi pada Februari 2025. Gemini 2.0 Flash merupakan penerus dari Gemini 1.5 Flash dan dilengkapi dengan kemampuan baru, termasuk menggabungkan input multimodal, penalaran yang disempurnakan, dan pemahaman bahasa alami untuk menciptakan gambar yang lebih baik.

Model ini mampu menjaga konsistensi tekstur, pencahayaan, dan perspektif saat melakukan banyak perubahan dalam satu gambar. Gemini 2.0 Flash juga unggul dalam memahami konteks dunia nyata, misalnya saat menggambarkan resep makanan, serta mampu merender teks dalam gambar dengan lebih akurat dibandingkan model lainnya. Hal ini menjadikannya ideal untuk membuat konten visual seperti poster, undangan, atau unggahan media sosial.

Google meyakini fitur ini akan bermanfaat bagi berbagai kalangan. Guru dapat membuat storyboard ilustratif secara instan, desainer dapat menyusun portofolio produk, dan arsitek dapat memvisualisasikan revisi desain bangunan secara real-time dalam rapat.

Untuk menjaga keamanan dan etika penggunaan, setiap gambar hasil editan AI akan diberi dua watermark, satu yang terlihat dan satu lagi yang tak kasat mata menggunakan teknologi SynthID.

Sebelum dirilis luas, kemampuan native image editing yang didukung Gemini 2.0 Flash versi eksperimental ini sempat diuji melalui platform pengembang Google, AI Studio. Namun, muncul kontroversi ketika pengguna menemukan bahwa model AI tersebut dapat menghapus watermark dari gambar yang dilindungi hak cipta.

Kasus penggunaan Gemini 2.0 Flash eksperimental untuk menghapus watermark ini dianggap melanggar hak cipta, karena tanda air digunakan untuk melindungi karya dari penggunaan tanpa izin dan pencurian konten. Menghapus tanda air tanpa persetujuan pemilik asli dianggap ilegal menurut hukum hak cipta.

Dibandingkan dengan model AI generator gambar lain seperti Claude 3.7 Sonnet milik Anthropic dan GPT-4o milik OpenAI, Gemini 2.0 Flash eksperimental secara tegas menolak untuk menghapus tanda air dari gambar. Google pun menyatakan bahwa penggunaan AI generatif Google untuk mengakali hak cipta merupakan pelanggaran terhadap ketentuan layanan Google Gemini. Google akan terus memantau dan mendengarkan masukan dari pengembang terkait hal ini.