Imagen
Wat is Imagen?
Google onderzoekers hebben een AI-tool ontwikkeld die realistische afbeeldingen kan creëren uit tekstinput. Over deze tool, genaamd “Imagen”, wordt beweerd dat het realistischere resultaten kan produceren dan de vergelijkbare AI-tool “DALL-E 2” van OpenAI. Daarnaast is Imagen toegankelijk voor iedereen met een computer en internetverbinding. Je hoeft alleen een beschrijving te geven, en Imagen doet de rest.
Waarom Imagen?
Met Imagen kun je kiezen uit een olieverfschilderij of een fotorealistische afbeelding, waarbij laatstgenoemde uitdagender is om te creëren met kunstmatige intelligentie. Imagen blinkt hier volgens de ontwikkelaars juist in uit. Het werkt op basis van een groot taalmodel, zoals GPT-3, dat “bevroren” wordt om de beste resultaten te behalen. De tekstinput wordt vervolgens omgezet naar beeld met behulp van een diffusion model. Eerst wordt een klein plaatje van 64×64 pixels gegenereerd, dat vervolgens met een super-resolution diffusion model uitvergroot wordt naar 1024×1024 pixels. Hierdoor kan Imagen overtuigende niet-bestaande plaatjes creëren uit zinnen.
Imagen kan de artistieke en ontwerpwereld drastisch veranderen door het AI-systeem te laten ontwerpen op basis van de input die wij geven. In plaats van één ontwerp, kan het systeem duizenden verschillende opties genereren.