DALL-E (ditulis sebagai DALL·E ) dan DALL-E 2 adalah model pembelajaran mesin yang dikembangkan oleh OpenAI untuk menghasilkan gambar digital dari deskripsi bahasa alami atau natural language. Dengan kata lain DALL·E merupakan AI yang dapat menggambar atau bahkan melukis sesuai dengan permintaan Anda.
Tentu saja hal ini sangat menarik bagi para content creator. Gambar atau foto sangat diperlukan dibanyak bidang. Menambahkan gambar yang unik dan berkualitas juga dapat sangat membantu SEO.
Seringkali, saat Anda membuat konten atau pun menulis artikel, biasanya sulit menemukan gambar yang tepat untuk mengilustrasikan isi konten, terutama jika Anda mencari gambar yang bebas royalti .
Di sinilah gambar berkualitas dapat memberikan banyak manfaat. Gambar yang tepat dapat membantu menarik perhatian pengguna internet dan meningkatkan peringkat pencarian artikel Anda.
Apa Itu DALL·E?
Menurut https://openai.com/ dalam rilis resminya yang telah disebutkan di atas, menyatakan bahwa :
DALL·E adalah transformator dekoder yang menerima teks dan gambar sebagai aliran tunggal 1280 token (256 untuk teks dan 1024 untuk gambar) dan memodelkan semuanya secara otomatis. Sedangkan token adalah simbol apa pun dari kosakata diskrit; untuk manusia, setiap huruf adalah token dari alfabet 26 huruf.
Kosakata DALL·E memiliki token untuk konsep teks dan gambar. Secara khusus, setiap keterangan gambar (image caption) direpresentasikan menggunakan maksimum 256 BPE (Byte-Pair Encoding) token dengan ukuran kosakata 16384, dan gambar direpresentasikan menggunakan 1024 token dengan ukuran kosakata 8192.
Bagi yang ingin mendalami DALL·E secara lebih detil, silakan baca papernya pada link berikut ini.
Contoh DALL·E
Berikut beberapa karya DALL·E yang mungkin mengejutkan Anda serta input natural languagenya.
“An astronaut riding a horse in a photorealistic style”
“Teddy bears mixing sparkling chemicals as mad scientists as a 1990s Saturday morning cartoon”
“A bowl of soup that is a portal to another dimension as digital art”
Luar biasa bukan? Saya rasa sebagian orang akan menduga bahwa gambar-gambar di atas seluruhnya dibuat oleh seorang digital artist, bukan oleh sebuah model AI.
Copyright DALL·E
Dalam mengumuman rilis versi beta dari DALL·E, OpenAI menyampaikan mengenai copyright DALL·E.
OpenAI memperbolehkan penggunakan DALL·E untuk proyek komersial. Pengguna mendapatkan hak penggunaan penuh untuk mengkomersialkan gambar yang mereka buat dengan DALL·E, termasuk hak untuk mencetak ulang, menjual, dan merchandise. Ini termasuk gambar yang mereka hasilkan selama pratinjau penelitian.
Pengguna juga dapat menggunakan DALL·E untuk membuat ilustrasi buku anak-anak, seni untuk buletin, seni konsep dan karakter untuk permainan, papan suasana hati untuk konsultasi desain, papan cerita film dan lain sebagainya..
Mengenal DALL·E
Pertama-tama kita awali dari nama, DALL·E adalah sebuah portmanteau atau penggabungan dua kata yang berbeda. Kata pertama berasal dari nama seniman surealis Salvador Dalí dan kata kedua berasal dari nama karakter robot dalam film kartun Wall-E yang dirilis oleh Pixar tahun 2008. Kenapa Salvador Dalí? tidak ada penjelasan spesifik mengenai hal ini yang saya temukan.
DALL-E pertama kali dirilis oleh OpenAI dalam posting blog resmi mereka pada 5 Januari 2021. DALL·E dikembangkan menggunakan GPT-3 yang dimodifikasi untuk menghasilkan gambar. GPT-3 sendiri adalah model bahasa autoregresif yang dikembangkan dan diluncurkan oleh OpenAI.
Saya sudah pernah menulis artikel yang cukup panjang beserta videonya mengenai GPT-3. Bagi yang penasaran silakan kunjungi artikel GPT-3 ini.
DALL·E adalah versi 12-miliar parameter GPT-3 yang dilatih untuk menghasilkan gambar dari deskripsi teks, menggunakan kumpulan data pasangan teks-gambar. Perlu diketahui bahwa GPT-3 menggunakan 175 miliar parameter.
DALL·E 2
Pada 6 April 2022 dalam sebuah posting blog, OpenAI mengumumkan perilisan DALL-E 2 sebagai penerus yang dirancang untuk menghasilkan gambar yang lebih realistis pada resolusi lebih tinggi yang dapat menggabungkan konsep, atribut, dan gaya.
Pada Januari 2021, OpenAI memperkenalkan DALL·E. Satu tahun kemudian, DALL·E 2 muncul dan dapat menghasilkan gambar yang lebih realistis dan akurat dengan resolusi 4x lebih besar.
DALL·E 2 dimulai sebagai proyek penelitian dan sekarang tersedia dalam versi beta. Bagi mereka yang memiliki minat bergabung dapat mendaftar dalam daftar tunggunya.
Mulai 20 Juli 2022 , DALL-E 2 memasuki fase beta dengan undangan dikirim ke 1 juta orang yang masuk daftar tunggu. Sebelumnya akses dibatasi hanya untuk pengguna yang telah dipilih untuk pratinjau penelitian karena kekhawatiran tentang etika dan keamanan.
Manfaat Gambar Bagi Konten Digital
Mengoptimalkan gambar adalah praktik SEO yang baik. Dengan membaca frasa yang Anda kaitkan dengan gambar Anda, mesin telusur dapat memahami subjek utamanya, memahaminya, dan karenanya menggunakannya untuk memposisikan konten Anda dengan cara yang logis dan relevan bagi pengguna web.
Gambar menjadi sama pentingnya dengan teks.
Pada 18 Mei 2021, Google mengumumkan penerapan bertahap teknologi Google MUM (Multitask Unified Model) , yang memahami dan mengekstrak informasi langsung dari gambar, video, dan file audio.
Ingatlah bahwa gambar asli itu penting, seperti yang dinyatakan Google :
“Pastikan konten visual Anda relevan dengan topik halaman. Kami menyarankan Anda untuk menampilkan gambar hanya di tempat yang menambahkan nilai asli ke halaman.
Kami secara khusus tidak menyarankan halaman di mana baik gambar maupun teksnya bukanlah konten asli.”
“Situs web yang ingin memanfaatkan pembaruan algoritme ulasan produk Google harus fokus pada penggunaan foto asli.”