Sebelumnya kita sudah mengenalkan secara singkat bagaimana cara menggunakan chainner untuk upscale, disebutkan bahwa diperlukan pretrained model agar proses upscale bisa berlangsung. Tapi sebenarnya pretrained model itu apa sih?
Sebenarnya pretrained model ada banyak macamnya. Ada banyak orang yang terus mengembangkan dan menyempurnakan model ini agar mampu melakukan upscale dengan lebih baik.
Kamu bisa pilih yang ringan agar komputer tidak terlalu lama melakukan proses upscaling, atau sebaliknya, pilih yang berat untuk hasil upscale yang lebih baik. Kamu juga bisa menyesuaikan model sesuai dengan gambar yang kamu upscale, apkaah digital art, foto, atau video.
Simaak penjelasan di bawah untuk lebih jelasnya.
Mengenal Pretrained Model
ChaiNNer adalah platfrom yang memungkinkan penggunanya untuk mengaplikasikan pretrained model dalam bentuk GUI (Graphical User Interface) yang dikaitkan. Makannya, pretrainned model menjadi sesuatu yang tidak terpisahkan dalam chaiNNer.
Pretrained model adalah neural network yang yang disimpan setelah dilatih pada dataset besar untuk memecahkan masalah tertentu. Dalam kasus upscale, pretrained model dilatih untuk melakukan proses upscale.
Pretrained model erat kaitanya dengan artificial intelligence dan machine learning. Dalam kasus upscale, pretrained model ini sebelumnya sudah dilatih dengan gambar resolusi rendah yang kemudian mengalapi proses upscaling dengan baik.
Dari banyak gambar tersebut, model ini bisa belajar apa saja yang perlu dirubah agar sebuah gambar bisa mengalami upscale dengan baik. Data neural network tersebut disimpan dalam pretrained model yang bisa diterapkan ke gambar lain untuk mendapatkan hasil serupa.
Mengapa pretrained model itu penting? Bayangkan kalau kalian harus melatih model neural network dari awal setiap kali kalian ingin melakukan tugas seperti upscaling gambar. Itu akan memakan waktu yang lama, bukan? Plus, memerlukan banyak data dan sumber daya komputasi.
Nah, dengan pretrained model, kita bisa melewati tahap pelatihan awal tersebut. Model sudah dilatih di data besar (biasanya pada tugas seperti pengenalan gambar atau bahasa), dan kini siap untuk digunakan pada tugas yang lebih spesifik.
Model ini menggunakan beberapa format arsitektur dasar, seperti PyTorch, ONNX, atau NCNN. ChaiNNer mendukung model dengan format tersebut. Kebanyakan model yang tersedia menggunakan format PyTorch. (.pth).
Jadi, sekarang kalian mengerti betapa pentingnya pretrained model dalam dunia pengolahan gambar dan AI, kan? Jangan ragu untuk bereksperimen dan mencoba berbagai model dalam chaiNNer untuk melihat hasil yang bisa kalian capai. Ini bisa jadi alternatif untuk aplikasi edit foto.
Di Mana Letak Pretrained Model?
Sekarang kita tahu kalau chaiNNer memungkinkan orang yang tidak mengerti coding atau programming untuk menggunakan pretrained model dalam proses upscale image. Tapi apakah kalian tahu di mana letak pretrained model?
Ketika merangkai node dalam aplikasi chaiNNer, node “Load Model” digunakkan untuk memasukkan pretrained model. Node ini bisa dicabangkan dari node “upscale image“.
Baca Juga
Oke, sekarang kamu sudah tahu di mana meletakkan node model untuk proses upscale menggunakan chaiNNer. Tapi, dimana kalau mau download pretrained model?
Ada beberapa cara untuk mendapatkan pretrained model untuk upscale.
Apa saja Pretrained Model yang Bisa Kamu Pilih?
Ketika kamu mengunjungi halaman discord, mungkin hanya ada beberapa model yang bisa kamu pilih. Namun ketika membuka model database, ternyata ada ratusan model yang bisa kamu pilih.
Masing-masing model ini memiliki banyak perbedaan, mulai dari materi yang digunakan untuk training, hingga beban resources. Jadi, bisa saja satu model memiliki kemampuan menghasilkan gambar yang lebih bersih, namun menggunakan beban resources yang tinggi.
Selain itu, perbedaan lain biasanya terletak pada skala. Ada yang 2x, 3x, 4x, dan seterusnya.
ESRGAN (Enhanced Super Resolution Generative Adversarial Networks)
Seperti yang disebutkan sebelumnya, ESRGAN adalah salah satu model paling populer untuk upscaling. Ini menggunakan teknik deep learning untuk menghasilkan gambar dengan resolusi tinggi dari gambar dengan resolusi rendah, sering kali menghasilkan detail yang tajam dan jernih.
Sebenarnya, selain menggunakan chaiNNer, bisa juga menggunakan IEU dan Cupscale untuk menjalankan model ini.
- Universal Models
Sesuai namanya, universal models umumnya bisa digunakan pada berbagai foto. Umumnya, model ini memiliki kemampuan untuk meningkatkan detail dan kualitas gambar secara umum dengan kemampuan skala 4x.
Model-model ini dibuat oleh berbagai penulis dan memiliki lisensi, arsitektur, dan tujuan yang berbeda-beda. Misalnya, “CountryRoads” dari EzoGaming difokuskan pada upscaling adegan outdoor dan jalanan dengan dedaunan lebat.
Selain itu, “UniScaleNR-Balanced/Strong” dilatih khusus untuk menghilangkan noise dari gambar saat melakukan proses upscale, sedangkan “UniScale_Restore” memiliki kemampuan yang kuat dalam mengembalikan kualitas gambar yang sangat terkompresi atau memiliki banyak noise.
nb: NR disini adalah singkatan dari Noise Reduction
- Realistic Photos
Model-model ini telah dikembangkan oleh berbagai penulis dan dibuat untuk meningkatkan kualitas dan detail foto realistis, termasuk foto dengan tekstur rendah atau foto yang telah terkompresi. Model ini akan membuat foto tetap tampak nyata dan natural dengan skala 4x.
Misalnya, model “4x_RealisticRescaler_100000_G” yang dibuat oleh Mutin Choler dirancang khusus untuk meningkatkan tekstur realistis yang memiliki resolusi rendah dan telah terkompresi. Model ini terbukti bekerja dengan baik pada tekstur GameCube yang realistis seperti pada game Shrek Extra Large dan tekstur papan dari game Mario Party 4.
Model lain seperti “4x-Valar” oleh musl dirancang sebagai eksperimen untuk menguji teknik-teknik terbaru dalam pembelajaran mesin, termasuk penggunaan AdaTarget, KernelGAN, dan sebagainya. Sementara “Nickelback” dan “NickelbackFS” oleh BlackScout dirancang untuk meningkatkan hasil yang telah dicapai oleh model ESRGAN standar, dengan fokus pada mempertahankan detail tanpa menghasilkan pola yang terlalu tajam atau kabur.
[twenty20 img1="21994" img2="21993" offset="0.5"]...