Connect with us

Mengenal Google DreamBooth & Dampaknya Bagi Anda

Technology

Mengenal Google DreamBooth & Dampaknya Bagi Anda

Mengenal Google DreamBooth & Dampaknya – Google DreamBooth ialah model difusi teks-ke-gambar dengan penyetelan untuk menciptakan gambar baru berbasis subjek. Google mengumumkan model difusi teks-ke-gambar baru mereka ini pada akhir bulan Agustus 2022. Model AI ini mampu menghasilkan segudang gambar dengan subjek yang dikehendaki pengguna dalam konteks yang berlawanan memakai bimbingan prompt teks.

Dalam bertahun-tahun terakhir, model teks-ke-gambar sudah meningkat dengan kecepatan yang luar biasa. Kualitas hasil yang diberikan oleh model seperti Open AI’s DALL-E2 atau Google’s Imagen ialah sesuatu yang, beberapa tahun kemudian, bahkan tidak pernah kita bayangkan.

Google DreamBooth diperkenalkan oleh tim yang terdiri dari peneliti dari Google dan Universitas Boston dan didasarkan pada tata cara gres untuk mempersonalisasi model teks-ke-gambar besar yang sudah dilatih sebelumnya, dalam hal ini Google Imagen, pada kumpulan gambar yang sangat terbatas ( 3 -5). 

Latar Belakang Dirilisnya Google DreamBooth

Saat ini sungguh susah untuk menciptakan suatu subjek dalam konteks yang berbeda dengan menggunakan model teks-ke-gambar yang ada sekarang. Karena bermacam-macam model tersebut tidak mampu menjaga ciri khas dari subjek yang menjadi input.

Agar lebih terang mari lihat acuan yang diberikan langsung dalam rilisnya. Ini merupakan input gambar yang diberikan :

input image Google DreamBooth

Kemudian diberikan juga teladan gambar yang dihasilkan oleh DALL-E 2.

hasil model DALL-E2

Dari gambar di atas mampu kita lihat bahwa gambar hasil dari model DALL-E 2 tidak mampu mempertahankan fidelity nya. DALL-E 2 cenderung memproduksi gambar baru yang serupa bahkan memiliki kesamaan konteks.

Kemudian diberikan juga contoh dari Google Imagen.

hasil model Google Imagen

Dari gambar di atas, tampakbahwa Google Imagen bisa menghadirkan konteks baru pada gambar walaupun tidak mampu menjaga fidelity-nya.

Melehat fakta ini maka para peneliti dari Google dan Universitas Boston mencoba metode baru demi mempertahankan fidelity serta konteks gres pada gambar. Berikut ini yakni hasih yang diberikan oleh Google DreamBooth.

hasil model Google DreamBooth

Dari gambar di atas terlihat bahwa Google DreamBooth mampu memberikan hasil yang terbaik. Baik dari segi fidelity serta dari segi konteksnya. Jika Anda perhatikan, gambar jam yang dihasilkan oleh DreamBooth merupakan jam yang serupa dengan inputan tapi dengan konteks yang serupa sekali berbeda. Hal seperti ini yang tidak mampu diberikan baik DALL-E 2 maupun Google Imagen.

Click to comment

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

More in Technology

To Top