Sebagai salah satu tools AI yang sedang ngehits, pasti banyak ingin tahu apa itu Midjourney. Ya, Tools AI ini bisa mengubah text menjadi gambar.
Berbeda dengan menggunakan chaiNNer untuk meningkatkan resolusi gambar, Tools AI dengan logo kapal ini bisa membuat image baru. Karenanya, Midjourney ini disebut generative AI.
Pasti pernah kan membayangkan suatu gambar, tapi ketika mencoba menorehkannya dengan tangan, ternyata hasilnya tidak sesuai ekspektasi.
Kini, ketika membayangkan sebuah gambar, tuliskan saja sebagai prompt di midjourney, dan biarkan tools AI ini membuatkan gambarnya untukmu.
Simak terus artikel ini untuk mengetahui apa itu MidJourney sebenarnya dan prinsip dasar bagaimana AI ini bekerja.
Apa Itu MidJourney?
“Midjourney adalah laboratorium penelitian independen yang mengeksplorasi media pemikiran baru dan memperluas kekuatan imajinatif manusia.” Begitulah yang disebutkan pada laman remsi Midjourney.
Bisa dibilang, Midjourney adalah sebuah platform berbasis teknologi AI Generatif yang memiliki kemampuan untuk mengubah input teks menjadi gambar unik.
Karena pernah memberikan kesempatan untuk generate image secara gratis dan memberikan nilai artistik yang tinggi, MidJourney menjadi pilihan banyak orang untuk generate image. Alternatif lain yang memiliki kemampuan serupa adalah Dall-E dan Leonardo AI.
Sebagai salah satu AI Generatif di pasar, Midjourney menawarkan keuntungan yang sangat menarik, terutama bagi para content creator. Salah satunya adalah gambar yang dihasilkan oleh Midjourney tidak terikat hak cipta. Jadi, bebas menggunakan gambar tersebut untuk berbagai keperluan tanpa khawatir tentang isu copyright.
Namun, bagaimana Midjourney dapat menghasilkan gambar yang begitu detail dan unik? Rahasianya terletak pada cara pelatihannya. Gambar-gambar yang dihasilkan oleh Midjourney sebenarnya dirangkai dari basis data gambar-gambar yang telah dilatih.
Teknik yang digunakan oleh Midjourney ini disebut sebagai ‘diffusion‘. Teknik ini memungkinkan AI untuk “menyebarkan” ide-ide dari input teks dan menggabungkannya dengan database gambar yang telah ada, menghasilkan kreasi yang sesuai dengan deskripsi yang diberikan.
Dengan kemampuan dan teknologi yang dimilikinya, Midjourney tentu membuka peluang baru dalam dunia digital, memudahkan setiap orang untuk merealisasikan imajinasi mereka menjadi sebuah gambar tanpa harus memiliki keahlian menggambar.
Cara Menggunakan MidJourney
Untuk bisa menggunakan MidJourney ada beberapa persyaratan.
- Akun Discord
- Berlangganan Midjourney
- Atau akses ke discord dengan MidJourney Bot
MidJourney menggunakan platform discord untuk bisa bekerja. Untungnya, discord bisa diakses melalui website.
Setelah masuk ke discord dengan akun MidJourney, masuk ke kanal yang umumnya digunakan untuk generate image.
Misalnya, pada discord MidJourney, generate image di channel newbie. Bisa juga dm langsung ke bot MidJourney, Atau ikuti panduan yang telah ditetapkan oleh group discord.
Kemudian, untuk membuat gambar, ketikkan /imagine dan spasi, secara otomatis maka discord akan menampilkan text box khusus untuk memasukkan prompt.
- Masuk ke channel discord untuk pembuatan gambar
- Ketikkan “/imagine” dan spasi diikuti dengan text deskripsi iamge yang diinginkan
Tunggu midjourney membuat gambar - Pilih “u” untuk upscale, atau “v” untuk membuat variasi lain.
Cek parameter Midjourney untuk mengatur resolusi gambar dan keterangan lainnya.
Bagaimana MidJourney Bekerja?
Singkatnya, Midjourney menggunakan pendekatan yang mirip dengan cara otak manusia mengolah informasi visual.
Baca Juga
1. Memahami Prompt Text
Pertama-tama, ketika Anda memasukkan teks atau prompt, Midjourney akan menganalisisnya untuk memahami esensi dan detilnya. Ini mirip dengan bagaimana kita, sebagai manusia, membaca dan memahami sebuah kalimat.
Jika Anda meminta seseorang untuk menggambarkan “sebuah pemandangan matahari terbenam di pantai dengan burung-burung terbang”, otak mereka akan mengambil rujukan dari kenangan atau pengalaman visual yang pernah mereka lihat. Midjourney melakukan hal serupa, namun dengan data dan algoritma.
2. Mencari Gambar yang sesuai di Database
Setelah memahami prompt, Midjourney akan mengakses database gambar yang telah dilatih. Database ini bukan hanya kumpulan gambar, tapi juga pemahaman tentang apa yang membuat suatu gambar unik, seperti bentuk, warna, tekstur, dan lainnya.
3. Teknik Diffusion
Teknik ini memungkinkan AI untuk “menyebar” atau mengkombinasikan berbagai elemen dari gambar-gambar yang ada dalam database untuk menciptakan gambar baru. Bayangkan proses ini seperti melukis, di mana Anda mulai dengan latar belakang, menambahkan elemen satu per satu, hingga akhirnya menciptakan sebuah karya seni yang utuh.
Proses ini terjadi dalam hitungan detik berkat kekuatan komputasi AI Generatif. Hasilnya? Sebuah gambar yang seolah-olah ditarik dari imajinasi Anda, diberi bentuk dan warna oleh Midjourney.
Mengenal Diffusion Model
Masih ingat dengan pelajaran SMP di sekolah? Iya, difusi adalah salah satu proses fisika. Ibarat meneteskan tinta ke dalam air, maka tinta akan menyebar. Proses penyebaran/pelarutan ini disebut difusi. Nah, proses difusi yang digunakan di image generation.
Gambar seolah olah dilarutkan menjadi noise image. Bedanya, dalam proses pembuatan gambar baru, gambar bisa ditarik lagi dengan menghilangkan noise.
Berbeda dengan teknik AI lain seperti GAN (Generative Adversairial Network) yang digunakan chaiNNer untuk upscale di mana noise dihilangkan, difussion bekerja dengan melarutkan gambar menjadi noise.
Difussion adalah proses di mana sesuatu menyebar dari titik asal ke area sekitarnya. Dalam konteks AI generatif, difusi mengacu pada teknik di mana sebuah gambar dihasilkan dengan secara bertahap menyempurnakan gambar acak hingga menjadi gambar akhir yang realistis dan terperinci.
Ide dasarnya mirip dengan autoencoder denoising.
Untuk menghasilkan gambar baru, secara bertaha tingkat noise di beberapa langkah dikurangi sampai gambar yang bersih dihasilkan.
Pada setiap langkah, model memprediksi gambar asli (sebelum noise ditambahkan) dengan noise image saat ini. Prediksi ini kemudian digunakan untuk menghasilkan gambar berikutnya dalam urutan, dan proses ini diulang sampai gambar akhir yang dihasilkan diperoleh.
Jadi, pada intinya, model difusi mempelajari ‘jalur’ dari gambar asli ke noise, dan kemudian menggunakan jalur ini secara terbalik untuk menghasilkan gambar baru dari noise.
Akhir Kata
Butuh pembahasan lebih lanjut untuk benar benar mengupas proses diffusion. Tetapi setidaknya sudah mengerti apa itu Midjourney, kan?
Dalam era digital saat ini, batasan antara teknologi dan kreativitas semakin tipis. Midjourney, dengan kemampuannya yang menggabungkan AI dan seni visual, menunjukkan kepada kita bahwa potensi teknologi dalam mendefinisikan ulang cara kita mencipta tidak memiliki batas.
Dunia berada di ambang revolusi kreatif, dan Midjourney hanyalah permulaan dari perjalanan panjang tersebut.
Baca juga artikel menarik seputar teknologi di Pintar Tekno yang terkait dengan AIatau artikel lainnya dari Mufid Hanif. Untuk informasi lebih lanjut atau kebutuhan lainnya, kamu bisa menghubungi kami melalui admin@pintartekno.id.
Sumber: