dall-e ne demek?

DALL-E (ya da DALL·E), 5 Ocak 2021'de OpenAI tarafından piyasa sürülen, metinsel tanımlardan görüntü oluşturan bir yapay zeka programıdır.

Adını ünlü ressam Salvador Dali ve WALL-E adlı animasyon robottan almıştır.¹ Program, doğal dil girdilerini (örneğin "beşgen şekilli yeşil deri çanta" veya "üzgün bir kapibaranın izometrik görünümü") tanımlamak için GPT-3 modelinin 12 milyar parametreden oluşan² sürümünü kullanır ve dil girdisine karşılık gelen görüntüyü oluşturur. Gerçekçi nesnelerin ("mavi çilek resimli vitray bir pencere") ve gerçekte var olmayan nesnelerin ("kirpi dokusuna sahip bir küp") görüntülerini oluşturabilir.

Tarihçe

DALL-E OpenAI tarafından 5 Ocak 2021'de piyasaya sürüldü.³⁴ Nisan 2022'de OpenAI, çıktıdaki görselde basit değişiklikler yapılmasına olanak sağlayan düzenleyiciyle birlikte metin açıklamalarından daha gerçekçi görüntüler üretebileceğini iddia ederek DALL-E 2'yi duyurdu. Duyuru itibarıyla, yazılımın hala yapım aşamasında olduğu ve erişimin önceden seçilmiş beta kullanıcıları ile sınırlı olduğu açıklandı. Modelin, hiçbir insanın yapmayacağı hatalar da dahil olmak üzere hala ciddi hatalar yapabildiği belirtildi.⁵ DALL-E 2, "metin açıklamasından orijinal, gerçekçi görüntüler ve sanat oluşturabilen, kavramları, nitelikleri ve stilleri birleştirebilen" bir model olarak tanımlandı.⁶

CLIP

DALL-E, CLIP (Contrastive Language-Image Pre-training) ile birlikte geliştirilmiş ve duyurulmuştur.⁷ Amacı, çıktıyı "anlamak ve sıralamak" olan ayrı bir modeldir.⁸ DALL-E'nin oluşturduğu görseller, herhangi bir girdi için en yüksek kaliteli görüntüleri sunan CLIP tarafından küratörlüğünü yapar.⁹