Generativní umělá inteligence

Impresionistický obrázek postav v opeře
Théâtre D'opéra Spatial, obrázek vytvořený pomocí generativní umělé inteligence

Generativní umělá inteligence (anglicky generative artificial intelligence – zkráceně GenAI, nebo GAI) je umělá inteligence schopná generovat text, obrázky, videa nebo jiná data pomocí generativních modelů,[1] často v reakci na výzvy (hlasový prompt nebo příkazový řádek).[2][3] Generativní modely umělé inteligence se učí vzorce a strukturu svých vstupních trénovacích dat a poté generují nová data, která mají podobné vlastnosti.[4][5]

Generativní umělá inteligence může být buď

  • unimodální
  • multimodální

Unimodální systémy přijímají pouze jeden typ vstupu. Zatímco multimodální systémy mohou přijímat více typů vstupů. Kromě textu může přijímat i soubory, kód, videa, obrázky či zvuk.[6] Stejně tak mohou mít i multimodální výstupy.

Vylepšení hlubokých neuronových sítí, zejména velkých jazykových modelů (LLM), umožnily ke konci roku 2022 veliký rozvoj generativních systémů umělé inteligence.

  • Chatboti, kteří původně odpovídali jen textově, postupně do sebe zakomponovaly multimodální výstupy v podobě tvorby obrazů: ChatGPT, Copilot, Gemini, Claude, Grok, LLaMA a další.
  • Systémy pro generování obrázků s umělou inteligencí typu text-to-image, jako jsou Stable Diffusion, Imagen, Midjourney a DALL-E
  • Generátory pro převod textu na video, jako je Sora od OpenAi, Veo od Google, Midjourney V1 od Midjourney[5], OmniHuman a Seedance (2025) od ByteDance.

Generativní modely umělé inteligence vyvinuly společnosti jako OpenAI, Anthropic, Microsoft, Google a Baidu a také řada menších firem.[2][7][8]

Související články

Odkazy

Reference

  1. PINAYA, Walter H. L.; GRAHAM, Mark S.; KERFOOT, Eric; TUDOSIU, Petru-Daniel; DAFFLON, Jessica; FERNANDEZ, Virginia; SANCHEZ, Pedro. Generative AI for Medical Imaging: extending the MONAI Framework. Electrical Engineering and Systems Science. 2023. arXiv 2307.15208. 
  2. a b GRIFFITH, Erin; METZ, Cade. Anthropic Said to Be Closing In on $300 Million in New A.I. Funding [online]. 2023-01-27 [cit. 2023-03-14]. Dostupné v archivu pořízeném z originálu dne December 9, 2023. 
  3. LANXON, Nate; BASS, Dina; DAVALOS, Jackie. A Cheat Sheet to AI Buzzwords and Their Meanings. Bloomberg News. March 10, 2023. Dostupné v archivu pořízeném z originálu dne November 17, 2023. 
  4. PASICK, Adam. Artificial Intelligence Glossary: Neural Networks and Other Terms Explained. The New York Times. 2023-03-27. Dostupné v archivu pořízeném z originálu dne September 1, 2023. ISSN 0362-4331. (anglicky) 
  5. a b KARPATHY, Andrej; ABBEEL, Pieter; BROCKMAN, Greg; CHEN, Peter; CHEUNG, Vicki; DUAN, Yan; GOODFELLOW, Ian. Generative models [online]. OpenAI, 2016-06-16 [cit. 2023-03-15]. Dostupné v archivu pořízeném z originálu dne November 17, 2023. 
  6. Multimodal AI. Google Cloud [online]. [cit. 2025-02-26]. Dostupné online. (anglicky) 
  7. The race of the AI labs heats up. The Economist. 2023-01-30. Dostupné v archivu pořízeném z originálu dne November 17, 2023. 
  8. YANG, June; GOKTURK, Burak. Google Cloud brings generative AI to developers, businesses, and governments [online]. 2023-03-14 [cit. 2023-03-15]. Dostupné v archivu pořízeném z originálu dne November 17, 2023. 

Externí odkazy