ef:ki:grundissen

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
ef:ki:grundissen [2026/04/21 19:57] bauertef:ki:grundissen [2026/05/06 10:38] (aktuell) lehmannr
Zeile 1: Zeile 1:
 ====== Grundwissen zur Künstlichen Intelligenz ====== ====== Grundwissen zur Künstlichen Intelligenz ======
 +Bei der kurzen Prüfung werde ich vor allem die Konzepte abfragen, d.h. Faktenwissen. 
 +Die unten grün markierten Inhalte sind sehr interessant, aber für die Prüfung weniger relevant.
 +
  
   - Erkläre die Begriffe "Künstliche Intelligenz", "Maschinelles Lernen", "Neuronale Netzwerke"   - Erkläre die Begriffe "Künstliche Intelligenz", "Maschinelles Lernen", "Neuronale Netzwerke"
Zeile 8: Zeile 11:
     - Kostenfunktion     - Kostenfunktion
     - Backpropagation     - Backpropagation
-    - Aktivierungsfunktion (z.B. Sigmoid) +    - Aktivierungsfunktion 
   - LLMs    - LLMs 
     - Erkläre grob, was ein LLM ist und wie es funktioniert     - Erkläre grob, was ein LLM ist und wie es funktioniert
Zeile 14: Zeile 17:
     - Was versteht man unter Pre-Training und RLHF (Reinforcement Learning from Human Feedback)?     - Was versteht man unter Pre-Training und RLHF (Reinforcement Learning from Human Feedback)?
     - Warum brachte die Transformer-Architektur einen gewaltigen Vorteil gegenüber herkömmlichen Verfahren und worin besteht sie grob gesagt?     - Warum brachte die Transformer-Architektur einen gewaltigen Vorteil gegenüber herkömmlichen Verfahren und worin besteht sie grob gesagt?
-    - Wie werden Wörter codiert? Was versteht man unter dem "Attention-Mechanismus" +    - Wie werden Wörter codiert? Was versteht man unter dem "Attention-Mechanismus" 
 +  - Was ist der Unterschied zwischen generativer und prädiktiver KI? 
 +  - Ein LLM gibt für ein und dieselbe Eingabe nicht immer dieselbe Ausgabe, ein Diffussionsmodell für die Bildgenerierung schon. Nimm zu dieser Aussage Stellung. 
 +  - Warum sind GPU (Graphikkarten bzw. Graphikprozessoren) in der KI so wichtig? 
 +  - Welche zwei Bedeutungen hat das Wort "Bias" im Zusammenhang mit KI? 
 +  - Gib ein persönliches kurzes Statement ab bezüglich der These "Durch KI werden die durch die Studenten eingereichgten Produkte immer besser, obwohl sie in mündlichen Prüfungen immer schlechter abschneiden." 
 +  - Was könnte unter den Begriffen "Skill Skipping", "Kognitive Entlastung" gemeint sein? 
 +  - Nenne Bereiche, die in Zukunft durch den Einsatz von KI komplett verändert werden könnten. Erkläre kurz. 
 +  
 +<color #22b14c>- Nimm Stellung zu Problemen und ethischen Fragen, die durch KIs aufgeworfen werden.</color> 
 + 
 +<color #22b14c>- Dürfen KI-Modelle mithilfe von jeglichen Daten trainiert werden? (Urheberrecht)</color> 
 + 
 +<color #22b14c>- Dürfen KI-Systeme Entscheidungen selbst treffen (z.B. Verkehr)</color> 
 + 
 +<color #22b14c>- Welche Problematik stellen Deepfakes dar?</color>
  
 ==== Quellen ==== ==== Quellen ====
Zeile 23: Zeile 41:
  
 [[https://www.youtube.com/watch?v=LPZh9BOjkQs|LLMs kurz erklärt (3Blue1Brown)]] [[https://www.youtube.com/watch?v=LPZh9BOjkQs|LLMs kurz erklärt (3Blue1Brown)]]
- 
-====== Bild- und Videogeneratoren mit KI ====== 
- 
-Stell dir vor, du schreibst „ein futuristisches Zürich bei Nacht“ – und eine KI erzeugt daraus in wenigen Sekunden ein realistisches Bild oder sogar ein Video. 
- 
-Genau das machen moderne Bild- und Videogeneratoren. 
- 
-Diese Seite erklärt, wie solche Systeme funktionieren – von den Grundbegriffen über die technischen Hintergründe bis zu den wichtigsten gesellschaftlichen Fragen. 
- 
-<WRAP tip> 
-Auf einen Blick: Bild- und Videogeneratoren sind KI-Programme, die aus einer Texteingabe neue Bilder oder Videos erzeugen. Das wichtigste Verfahren dahinter nennt man Diffusionsmodell. 
-</WRAP> 
- 
- 
-===== 1. Grundbegriffe ===== 
- 
-==== Was ist generative KI? ==== 
- 
-Normale KI erkennt Dinge, zum Beispiel ob auf einem Bild eine Katze zu sehen ist.   
-Generative KI geht einen Schritt weiter: Sie erzeugt neue Inhalte, die es vorher noch nicht gab. 
- 
-Das Modell lernt aus sehr vielen Beispielen. Es erkennt dabei Muster – also wie typische Bilder, Texte oder Videos aussehen – und kann daraus neue Inhalte erzeugen, die ähnlich wirken.((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models)) 
- 
-Bild- und Videogeneratoren gehören zu dieser Art von KI. Man gibt eine Beschreibung (den Prompt) ein und das Modell erzeugt daraus ein passendes Bild oder Video. 
- 
-^ Begriff ^ Erklärung ^ 
-| Prompt | Texteingabe, die beschreibt, was erzeugt werden soll | 
-| Seed | Startwert für den Zufall – gleicher Seed = gleiches Bild | 
-| Latenter Raum | Vereinfachte interne Darstellung eines Bildes | 
-| Training | Lernphase mit vielen Beispielbildern | 
-| Inference | Nutzung des Modells (Prompt → Bild) | 
- 
-==== Was macht einen guten Prompt aus? ==== 
- 
-Ein guter Prompt beschreibt möglichst genau: 
- 
-  * Was im Bild zu sehen sein soll (Objekte, Personen, Ort) 
-  * Wie es aussehen soll (Stil, Licht, Stimmung) 
-  * Optional: Kameraeinstellung oder Perspektive 
- 
-<WRAP example> 
-Schwacher Prompt: //Ein Hund// 
- 
-Besserer Prompt: //Ein Golden Retriever sitzt auf einer sonnigen Wiese, warmes Nachmittagslicht, fotorealistisch, geringe Schärfentiefe// 
-</WRAP> 
- 
-==== Trainingsdaten ==== 
- 
-Damit ein Modell Bilder erzeugen kann, braucht es sehr viele Beispiele.   
-Beim Training sieht es Millionen von Bildern zusammen mit passenden Textbeschreibungen. 
- 
-So lernt das Modell, was Begriffe wie „Hund“ oder „Sonnenuntergang“ visuell bedeuten.((Digitalzentrum Franken: KI-Bildgenerierung mit Stable Diffusion. https://digitalzentrum-franken.de/aktuelles/detail/ki-bildgenerierung-mit-stable-diffusion)) 
- 
- 
-===== 2. Technische Grundlagen ===== 
- 
-<WRAP info> 
-Dieser Abschnitt erklärt die wichtigsten Ideen im Hintergrund. Man muss kein Experte sein – es geht um das Grundverständnis. 
-</WRAP> 
- 
-==== Neuronale Netze ==== 
- 
-Ein neuronales Netz ist ein Computerprogramm, das grob vom menschlichen Gehirn inspiriert ist.   
-Es besteht aus vielen kleinen Recheneinheiten, die miteinander verbunden sind. 
- 
-Beim Training werden diese Verbindungen so angepasst, dass das Netz sinnvolle Ergebnisse erzeugt – in diesem Fall neue Bilder.((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models)) 
- 
-==== Transformer und Attention ==== 
- 
-Transformer sind eine spezielle Art von neuronalen Netzen. Sie sind besonders gut darin, Zusammenhänge zu erkennen. 
- 
-Ein Beispiel: Das Modell versteht, dass „sonnige Wiese“ bestimmte Farben, Lichtverhältnisse und Objekte bedeutet. 
- 
-Der Mechanismus dahinter heisst Attention. Das Modell lernt dabei, welche Teile der Eingabe wichtig sind.((dogado KI-Lexikon: Diffusionsmodelle. https://www.dogado.de/ki-lexikon/diffusionsmodelle)) 
- 
-==== U-Net ==== 
- 
-Viele Bildgeneratoren verwenden eine Struktur namens U-Net.   
-Das Modell vereinfacht das Bild zuerst (Encoder) und baut es danach wieder auf (Decoder). 
- 
-So kann es Bilder schrittweise verbessern und Details hinzufügen.((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models)) 
- 
-==== Variational Autoencoder (VAE) ==== 
- 
-Ein VAE besteht aus zwei Teilen: 
- 
-  - Encoder: Wandelt ein Bild in eine kompakte Darstellung (latenter Raum) um 
-  - Decoder: Baut aus dieser Darstellung wieder ein Bild auf 
- 
-Dadurch muss das Modell nicht direkt mit Millionen von Pixeln rechnen, sondern mit einer kleineren, effizienteren Darstellung.((AWS: Was ist Stable Diffusion? https://aws.amazon.com/de/what-is/stable-diffusion/)) 
- 
-==== Diffusionsmodelle ==== 
- 
-Diffusionsmodelle sind das Herz moderner Bildgeneratoren. 
- 
-Die Idee kommt aus der Physik: Wenn sich ein Stoff verteilt (Diffusion), wird er mit der Zeit immer gleichmässiger. 
- 
-Bei Bildern funktioniert das so:((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models)) 
- 
-  - Vorwärtsprozess: Ein Bild wird Schritt für Schritt verrauscht, bis nur noch Zufall übrig bleibt 
-  - Rückwärtsprozess: Das Modell lernt, dieses Rauschen wieder in ein sinnvolles Bild umzuwandeln 
-  - Anwendung: Man startet mit Rauschen und erzeugt daraus Schritt für Schritt ein Bild 
- 
-<WRAP tip> 
-Merkhilfe: Man beginnt mit reinem Rauschen. Mit jedem Schritt wird das Bild klarer, bis es zum Prompt passt. 
-</WRAP> 
- 
-==== Latent Diffusion Models (LDM) ==== 
- 
-Um Rechenleistung zu sparen, wird die Diffusion nicht direkt auf dem Bild durchgeführt, sondern im latenten Raum. 
- 
-Das macht den Prozess deutlich schneller, ohne grosse Qualitätsverluste.((GuideGlare: Diffusionsmodelle erklärt. https://www.guideglare.com/de/plattform/bild-suite/technologie/diffusionsmodelle-ki-bildgeneratoren)) 
- 
-Der Prompt wird über Cross-Attention eingebunden, sodass das Modell weiss, welches Bild erzeugt werden soll. 
- 
- 
-===== 3. Wichtige Modelltypen ===== 
- 
-^ Modelltyp ^ Funktionsweise ^ Bedeutung ^ 
-| GANs | Zwei Netze konkurrieren miteinander | Früher wichtig, heute weniger relevant | 
-| VAE | Komprimiert und rekonstruiert Bilder | Bestandteil moderner Modelle | 
-| DDPM | Schrittweises Entrauschen | Basis von Diffusion | 
-| LDM | Diffusion im latenten Raum | Grundlage moderner Tools | 
-| DiT | Transformer im Diffusionsprozess | Neue, skalierbare Ansätze | 
- 
- 
-===== 4. Wie funktioniert ein Bildgenerator? ===== 
- 
-Typischer Ablauf: 
- 
-<WRAP box> 
-  - Der Prompt wird in Zahlen umgewandelt 
-  - Zufälliges Rauschen wird erzeugt 
-  - Das Modell entfernt Schritt für Schritt das Rauschen 
-  - Der Prompt steuert den Prozess 
-  - Am Ende wird das Bild erzeugt 
-</WRAP> 
- 
-==== Wichtige Parameter ==== 
- 
-^ Parameter ^ Bedeutung ^ 
-| Seed | Bestimmt den Zufall | 
-| Guidance Scale | Wie stark der Prompt wirkt | 
-| Steps | Anzahl der Schritte | 
-| Negativer Prompt | Was nicht im Bild sein soll | 
- 
-==== ControlNet ==== 
- 
-ControlNet erlaubt zusätzliche Kontrolle, z. B. über Formen oder Posen.   
-Das Modell übernimmt die Struktur und kombiniert sie mit dem Stil aus dem Prompt.((theblue.ai: Diffusionsmodelle erklärt. https://theblue.ai/blog-de/trends/diffusionsmodelle-generative-ki/)) 
- 
- 
-===== 5. Video-Generatoren ===== 
- 
-Ein Video besteht aus vielen Bildern (Frames), die zusammenpassen müssen. 
- 
-<WRAP important> 
-Die grösste Herausforderung ist die zeitliche Konsistenz:   
-Objekte und Personen sollen sich logisch und stabil über mehrere Frames bewegen. 
-</WRAP> 
- 
-==== Ansätze ==== 
- 
-^ Ansatz ^ Beschreibung ^ 
-| Video Diffusion | Erweiterung von Bilddiffusion | 
-| Kaskadenmodell | Mehrstufige Verbesserung | 
-| Latent Video Diffusion | Effizientere Berechnung | 
-| Spacetime Patches | Verarbeitung über Raum und Zeit | 
- 
-==== Tipps für Prompts ==== 
- 
-  * Bewegung beschreiben 
-  * Kamera angeben 
-  * Szene einfach halten 
- 
- 
-===== 6. Tools und Modelle ===== 
- 
-^ Tool ^ Besonderheit ^ 
-| Stable Diffusion | Open Source | 
-| Midjourney | Sehr hohe Qualität | 
-| DALL-E 3 | Gute Textverarbeitung | 
-| Firefly | Lizenzierte Daten | 
-| Runway | Video | 
-| Pika | Einfache Bedienung | 
-| Sora | Hochwertige Videos | 
- 
- 
-===== 7. Anwendungsbereiche ===== 
- 
-  * Kreativarbeit (Design, Werbung) 
-  * Bildung 
-  * Forschung 
-  * Industrie 
-  * Unterhaltung 
- 
- 
-===== 8. Risiken ===== 
- 
-==== Deepfakes ==== 
- 
-Täuschend echte Fake-Inhalte können entstehen und zur Desinformation genutzt werden. 
- 
-==== Urheberrecht ==== 
- 
-Rein KI-generierte Inhalte sind meist nicht geschützt. Die Rechtslage ist noch unklar. 
- 
-==== Bias ==== 
- 
-Modelle übernehmen Verzerrungen aus den Trainingsdaten. 
- 
-==== Umwelt ==== 
- 
-Training benötigt viel Energie. 
- 
- 
-===== 9. Zusammenfassung ===== 
- 
-<WRAP tip> 
-  - KI erzeugt Bilder aus Text 
-  - Diffusion ist das zentrale Verfahren 
-  - Parameter steuern das Ergebnis 
-  - Video ist komplexer als Bild 
-  - Risiken sind wichtig zu beachten 
-</WRAP> 
  
  
  • ef/ki/grundissen.1776794233.txt.gz
  • Zuletzt geändert: 2026/04/21 19:57
  • von bauert