GeForce RTX 4060 Ti 16G - Kartu Grafis dengan Value Terbaik untuk Stable Diffusion XL
By Stefani Tai|September 14,2023
Motherboards
,
Graphics Cards
,
Peripherals
,
Desktops
,
Monitors
,
Case & Components
Beberapa waktu ini, banyak postingan media sosial, artikel berita, dan video mengenai AI dan konten yang dapat mereka buat. Anak dari OpenAI, yaitu ChatGPT, adalah yang paling populer. Interface berbentuk chat memungkinkan pengguna untuk berinteraksi dengan model AI untuk bertanya, menginstruksikan untuk mengerjakan tugas tertentu, menulis kode script, dan menulis kalimat, paragraf, atau bahkan membuat artikel!
Dibandingkan model berbentuk teks seperti ChatGPT, terdapat terobosan dengan bentuk yang lebih visual yaitu model AI, yang dapat menciptakan gambar berdasarkan prompt (seperti MidJourney, Stable Diffusion, DALL-E, dll. Anda bahkan bisa meminta model ini untuk menciptakan digital art berdasarkan prompt seperti berikut:
Prompt:
Space battleship, causing objects to disintegrate into atomic particles. cinematic shot + dynamic composition, incredibly detailed, sharpen, details + intricate detail + professional lighting, film lighting + 35mm + anamorphic + lightroom + cinematography + bokeh + lens flare + film grain + HDR10 + 8K + Roger Deakins, ((cinematic)), perfect composition, hyperrealistic, super detailed, 8k, high quality, trending art, trending on artstation, sharp focus, studio photo, intricate details, highly detailed
Negative Prompt:
(3d, cartoon, anime, sketches), (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), bad anatomy, out of view, cut off, ugly, deformed, mutated, ((young)), EasyNegative, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, glans,extra fingers,fewer fingers, (ugly eyes, deformed iris, deformed pupils, fused lips and teeth:1.2), (un-detailed skin, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, anime:1.2), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions
Dengan salah satu model tersebut, berikut adalah hasil yang kita dapat dengan prompt tersebut:
Tentunya, memiliki akses pada teknologi yang sungguh kuat telah menarik perhatian semua industri. Walaupun tidak ada model AI yang mendekati hasil seni, grafis, tulisan, dan kreativitas yang diciptakan manusia, banyak profesi yang mulai menyadari dampaknya.
Meskipun begitu, seiring berjalannya waktu, keterampilan dari AI akan selalu berkembang. Kita sudah melihat kecanggihan dari model AI terbaru yang meningkat dibandingkan versi sebelumnya.
Model VRAM dan AI: Berapa Banyak yang Anda Butuhkan?
Beberapa tool AI yang tersedia hari ini sangat menonjol karena sifatnya yang open-source - memberi pengguna, bisnis, dan organisasi kemampuan untuk menghosting model ini secara lokal di hardware mereka tanpa masalah privasi atau keamanan.
Walaupun bisnis besar tidak memiliki kekurangan pada infrastruktur atau dana untuk hosting model, individu dan profesional yang ingin memanfaatkan AI. Salah satu alasan mengapa model AI dapat menjadi sangat lambat atau bahkan tidak didukung pada hardware modern adalah kebutuhan VRAM dari model tersebut.
Persyaratan Minimum Stable Diffusion XL
Salah satu contoh dari model Stable Diffusion XL (SDXL) adalah Stability AI. Perusahaan mereka menjelaskannya sebagai Ai yang “paling canggih” hingga sekarang.
Sampai sekarang AI tersebut dapat menciptakan muka, teks resmi, dan seni yang indah menggunakan prompt yang lebih singkat. Namun, kapabilitas yang meningkat ini juga memberikan beban pada hardware, khususnya, persyaratan VRAM dan performa GPU.
Jadi, apa yang Anda perlukan untuk menikmati peningkatan SDXL pada PC Anda di rumah?
Seperti yang Anda lihat, Stability AI merekomendasikan kartu grafis NVIDIA untuk dipakai, jadi kami akan mencoba menggunakan produk dari generasi sekarang dan sebelumnya agar lebih mudah memahami apa yang bisa Anda ekspektasikan. Walaupun tercantum bahwa Stability AI memerlukan minimal 8 GB VRAM padapress release yang mereka publikasikan, kami ingin menunjukkan efek dari kapasitas VRAM yang lebih tinggi.
Apakah memenuhi persyaratan minimal (atau melebihinya dengan sedikit) memiliki dampak drastis pada performa, atau GPU yang lebih kuat akan memenuhi kekurangan VRAM?
Untuk menjawabnya, lab kami akan tes untuk melihat bagaimana kinerjanya dengan hardware generasi sekarang dan sebelumnya. Data tersebut seharusnya memungkinkan Anda untuk menambahkan pertimbangan saat membeli kartu grafis selanjutnya.
Benchmark GPU SDXL untuk Kartu Grafis GeForce.
Untuk pengetesan ini, kami menggunakan kartu grafis RTX 4060 Ti 16 GB, RTX 3080 10 GB, dan RTX 3060 12 GB.
Pertama, mari mulai dengan komposisi seni yang simpel menggunakan parameter default agar GPU kami mulai bekerja.
1024 x 1024
VRAM Size(GB)
Speed(sec.)
RTX 4060 Ti 16G
11.4 GB
16.0 s
RTX 3080 10G
9.7 GB
65.1 s
RTX 3060 12G
11.7 GB
27.2 s
Hasilnya mungkin mengejutkan untuk mereka yang biasanya hanya berfokus pada benchmark gaming.
RTX 4060 Ti 16GB, , dengan 16GB VRAM buffer, dengan mudah selesai lebih cepat dari GPU lain dengan waktu 16 detik. Kedua, berkat VRAM 12GB, adalah RTX 3060 12GB dengan waktu 27.2 detik. Tidak hebat, tetapi cukup bagus.
Sayangnya, kurangnya VRAM pada RTX 3080 yang berarti kecepatan murni rendernya kurang baik dengan waktu yang sangat lama yaitu 65.1 detik! Berarti, RTX 4060 Ti 16GB yang modern mengungguli RTX 3080 yang high-end pada generasi sebelumnya dengan waktu pembuatan gambar ~4x lebih cepat.
SDXL Benchmark: 1024x1024 + LoRA
Mari naikkan levelnya sedikit! Untuk test selanjutnya, kita akan mencoba LoRA.
Teknik LoRA atau Low-Rank Adaptation memungkinkan Anda untuk fine-tune model Stable Diffusion pada karakter atau art style yang spesifik. Namun, hal ini memberi beban lebih pada VRAM Anda, jadi mari lihat performa para penantang kami.
Mari kita gunakan LoRA untuk menghasilkan karya seni 'Cybergirl' dan mencari tahu seberapa besar perbedaan antara kartu grafis dengan VRAM yang cukup dan banyak.
1024 x 1024 + LoRA
VRAM Size(GB)
Speed(sec.)
RTX 4060 Ti 16G
15.5 GB
17.0 s
RTX 3080 10G
9.6 GB
98.8 s
RTX 3060 12G
11.5 GB
26.8 s
Disini, RTX 3080 dengan mudah dikalahkan oleh kartu grafis 60-class yang memiliki lebih banyak VRAM. RTX 4060 Ti 16GB lagi-lagi menjadi yang terbaik, membutuhkan hanya 17 detik untuk menghasilkan gambar, sedangkan RTX 3080 memiliki kecepatan seperti siput yakni 98.8 detik.
SDXL Benchmarks: 1024x1024 + LoRA + ControlNet
Sekarang, mari kita buat lebih sulit untuk kartu grafis 60-class dengan beberapa kondisi tambahan menggunakan ControlNet.
Pertama, apa itu ControlNet? Mudahnya, ControlNet adalah model neural network yang bisa Anda gunakan untuk mengontrol dan menyesuaikan komposisi (output) Stable Diffusion. Memungkinkan Anda memberi tahu Stable Diffusion bahwa Anda memberikan referensi yang jelas ke desain yang Anda inginkan dengan menambahkan lebih banyak kondisi ke output, selanjutnya menyempurnakan hasilnya agar lebih sesuai dengan apa yang Anda butuhkan.
Buka halaman ControlNet GitHub untuk detail dan dokumentasi lebih lanjut mengenai cara memasangnya!
1024 x 1024 + LoRA + controlnet
VRAM Size(GB)
Speed(sec.)
RTX 4060 Ti 16G
15.2 GB
48.7 s
RTX 3080 10G
9.7 GB
51 s
RTX 3060 12G
11.5 GB
89.2 s
TSekarang kompetisinya semakin tipis, dengan RTX 3080 hampir menyusul RTX 4060 Ti 16 GB dan mengalahkan RTX 3060 12 GB dengan telak. Namun, bahkan dengan skenario komputasi yang berat, RTX 4060 Ti 16 GB berakhir menang dengan tipis.
SDXL Benchmark: 1024x1024 + Upscaling
Sekarang, mari kita coba upscaling. Apakah penantang 60-class masih bisa menandingi kekuatan upscaling RTX 3080 yang lumayan? Untuk pengetesan berikut, kita gunakan Real Enhanced Super-Resolution Generative Adversarial Networks, juga dikenal dengan singkatannya - R-ESRGAN 4x+.
1024 x 1024 upscale x2
VRAM Size(GB)
Speed(sec.)
RTX 4060 Ti 16G
10.8 GB
5.5 s
RTX 3080 10G
10 GB
8.6 s
RTX 3060 12G
10.4 GB
7.8 s
Untuk gambar 1024x1024 yang di-upscale hingga 2x, RTX 4060 Ti 16 GB melampaui RTX 3080 dan RTX 3060 12 GB, hanya membutuhkan waktu 5,5 detik untuk menyelesaikannya – menjadikannya 36% lebih cepat daripada RTX 3080 10 GB untuk menghasilkan gambar.
1024 x 1024 upscale x4
VRAM Size(GB)
Speed(sec.)
RTX 4060 Ti 16G
10.5 GB
10 s
RTX 3080 10G
10 GB
13 s
RTX 3060 12G
10.4 GB
12.3 s
Kesenjangan antara RTX 4060 Ti 16 GB dan pesaingnya semakin tipis dengan peningkatan tugas 4x menggunakan upscaler R-ESRGAN 4x+. Kini, RTX 4060 Ti 16 GB, 23% lebih cepat dalam menyelesaikan tugas dibandingkan RTX 3080 10 GB, sedangkan RTX 3060 12 GB kini berada dalam jarak yang sangat dekat dengan RTX 3080. Meskipun demikian, RTX 4060 Ti 16GB masih tetap memimpin.
ASeperti yang bisa Anda lihat dari beberapa hasil sebelumnya, apabila beban upscare lebih intens, maka semakin dekat juga RTX 3080 pada kompetisi 60-class.
Kartu Grafis Best Value untuk Stable Diffusion XL
Apabila membicarakan model AI seperti Stable Diffusion XL, memiliki VRAM yang cukup sangatlah penting. Dari pengetesan diatas, mudah untuk melihat mengapa RTX 4060 Ti 16GB adalah kartu grafis dengan harga yang paling baik untuk dibeli saat ini untuk menciptakan gambar AI.
Anda dapat mengunjungi Stability AI’s GitHub page untuk mencari informasi lebih lanjut mengenai SDXL dan model diffusion lainnya dari Stability AI.