Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

--- ef:ki:grundissen [2026/04/21 19:57] – bauert
+++ ef:ki:grundissen [2026/05/06 10:38] (aktuell) – lehmannr
@@ Zeile 1: / Zeile 1: @@
 ====== Grundwissen zur Künstlichen Intelligenz ======
+Bei der kurzen Prüfung werde ich vor allem die Konzepte abfragen, d.h. Faktenwissen.
+Die unten grün markierten Inhalte sind sehr interessant, aber für die Prüfung weniger relevant.
   - Erkläre die Begriffe "Künstliche Intelligenz", "Maschinelles Lernen", "Neuronale Netzwerke"
@@ Zeile 8: / Zeile 11: @@
     - Kostenfunktion
     - Backpropagation
-    - Aktivierungsfunktion (z.B. Sigmoid)
+    - Aktivierungsfunktion
   - LLMs
     - Erkläre grob, was ein LLM ist und wie es funktioniert
@@ Zeile 14: / Zeile 17: @@
     - Was versteht man unter Pre-Training und RLHF (Reinforcement Learning from Human Feedback)?
     - Warum brachte die Transformer-Architektur einen gewaltigen Vorteil gegenüber herkömmlichen Verfahren und worin besteht sie grob gesagt?
     - Wie werden Wörter codiert? Was versteht man unter dem "Attention-Mechanismus"
+  - Was ist der Unterschied zwischen generativer und prädiktiver KI?
+  - Ein LLM gibt für ein und dieselbe Eingabe nicht immer dieselbe Ausgabe, ein Diffussionsmodell für die Bildgenerierung schon. Nimm zu dieser Aussage Stellung.
+  - Warum sind GPU (Graphikkarten bzw. Graphikprozessoren) in der KI so wichtig?
+  - Welche zwei Bedeutungen hat das Wort "Bias" im Zusammenhang mit KI?
+  - Gib ein persönliches kurzes Statement ab bezüglich der These "Durch KI werden die durch die Studenten eingereichgten Produkte immer besser, obwohl sie in mündlichen Prüfungen immer schlechter abschneiden."
+  - Was könnte unter den Begriffen "Skill Skipping", "Kognitive Entlastung" gemeint sein?
+  - Nenne Bereiche, die in Zukunft durch den Einsatz von KI komplett verändert werden könnten. Erkläre kurz.
+<color #22b14c>- Nimm Stellung zu Problemen und ethischen Fragen, die durch KIs aufgeworfen werden.</color>
+<color #22b14c>- Dürfen KI-Modelle mithilfe von jeglichen Daten trainiert werden? (Urheberrecht)</color>
+<color #22b14c>- Dürfen KI-Systeme Entscheidungen selbst treffen (z.B. Verkehr)</color>
+<color #22b14c>- Welche Problematik stellen Deepfakes dar?</color>
 ==== Quellen ====
@@ Zeile 23: / Zeile 41: @@
 [[https://www.youtube.com/watch?v=LPZh9BOjkQs|LLMs kurz erklärt (3Blue1Brown)]]
-====== Bild- und Videogeneratoren mit KI ======
-Stell dir vor, du schreibst „ein futuristisches Zürich bei Nacht“ – und eine KI erzeugt daraus in wenigen Sekunden ein realistisches Bild oder sogar ein Video.
-Genau das machen moderne Bild- und Videogeneratoren.
-Diese Seite erklärt, wie solche Systeme funktionieren – von den Grundbegriffen über die technischen Hintergründe bis zu den wichtigsten gesellschaftlichen Fragen.
-<WRAP tip>
-Auf einen Blick: Bild- und Videogeneratoren sind KI-Programme, die aus einer Texteingabe neue Bilder oder Videos erzeugen. Das wichtigste Verfahren dahinter nennt man Diffusionsmodell.
-</WRAP>
-===== 1. Grundbegriffe =====
-==== Was ist generative KI? ====
-Normale KI erkennt Dinge, zum Beispiel ob auf einem Bild eine Katze zu sehen ist.
-Generative KI geht einen Schritt weiter: Sie erzeugt neue Inhalte, die es vorher noch nicht gab.
-Das Modell lernt aus sehr vielen Beispielen. Es erkennt dabei Muster – also wie typische Bilder, Texte oder Videos aussehen – und kann daraus neue Inhalte erzeugen, die ähnlich wirken.((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models))
-Bild- und Videogeneratoren gehören zu dieser Art von KI. Man gibt eine Beschreibung (den Prompt) ein und das Modell erzeugt daraus ein passendes Bild oder Video.
-^ Begriff ^ Erklärung ^
-| Prompt | Texteingabe, die beschreibt, was erzeugt werden soll |
-| Seed | Startwert für den Zufall – gleicher Seed = gleiches Bild |
-| Latenter Raum | Vereinfachte interne Darstellung eines Bildes |
-| Training | Lernphase mit vielen Beispielbildern |
-| Inference | Nutzung des Modells (Prompt → Bild) |
-==== Was macht einen guten Prompt aus? ====
-Ein guter Prompt beschreibt möglichst genau:
-  * Was im Bild zu sehen sein soll (Objekte, Personen, Ort)
-  * Wie es aussehen soll (Stil, Licht, Stimmung)
-  * Optional: Kameraeinstellung oder Perspektive
-<WRAP example>
-Schwacher Prompt: //Ein Hund//
-Besserer Prompt: //Ein Golden Retriever sitzt auf einer sonnigen Wiese, warmes Nachmittagslicht, fotorealistisch, geringe Schärfentiefe//
-</WRAP>
-==== Trainingsdaten ====
-Damit ein Modell Bilder erzeugen kann, braucht es sehr viele Beispiele.
-Beim Training sieht es Millionen von Bildern zusammen mit passenden Textbeschreibungen.
-So lernt das Modell, was Begriffe wie „Hund“ oder „Sonnenuntergang“ visuell bedeuten.((Digitalzentrum Franken: KI-Bildgenerierung mit Stable Diffusion. https://digitalzentrum-franken.de/aktuelles/detail/ki-bildgenerierung-mit-stable-diffusion))
-===== 2. Technische Grundlagen =====
-<WRAP info>
-Dieser Abschnitt erklärt die wichtigsten Ideen im Hintergrund. Man muss kein Experte sein – es geht um das Grundverständnis.
-</WRAP>
-==== Neuronale Netze ====
-Ein neuronales Netz ist ein Computerprogramm, das grob vom menschlichen Gehirn inspiriert ist.
-Es besteht aus vielen kleinen Recheneinheiten, die miteinander verbunden sind.
-Beim Training werden diese Verbindungen so angepasst, dass das Netz sinnvolle Ergebnisse erzeugt – in diesem Fall neue Bilder.((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models))
-==== Transformer und Attention ====
-Transformer sind eine spezielle Art von neuronalen Netzen. Sie sind besonders gut darin, Zusammenhänge zu erkennen.
-Ein Beispiel: Das Modell versteht, dass „sonnige Wiese“ bestimmte Farben, Lichtverhältnisse und Objekte bedeutet.
-Der Mechanismus dahinter heisst Attention. Das Modell lernt dabei, welche Teile der Eingabe wichtig sind.((dogado KI-Lexikon: Diffusionsmodelle. https://www.dogado.de/ki-lexikon/diffusionsmodelle))
-==== U-Net ====
-Viele Bildgeneratoren verwenden eine Struktur namens U-Net.
-Das Modell vereinfacht das Bild zuerst (Encoder) und baut es danach wieder auf (Decoder).
-So kann es Bilder schrittweise verbessern und Details hinzufügen.((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models))
-==== Variational Autoencoder (VAE) ====
-Ein VAE besteht aus zwei Teilen:
-  - Encoder: Wandelt ein Bild in eine kompakte Darstellung (latenter Raum) um
-  - Decoder: Baut aus dieser Darstellung wieder ein Bild auf
-Dadurch muss das Modell nicht direkt mit Millionen von Pixeln rechnen, sondern mit einer kleineren, effizienteren Darstellung.((AWS: Was ist Stable Diffusion? https://aws.amazon.com/de/what-is/stable-diffusion/))
-==== Diffusionsmodelle ====
-Diffusionsmodelle sind das Herz moderner Bildgeneratoren.
-Die Idee kommt aus der Physik: Wenn sich ein Stoff verteilt (Diffusion), wird er mit der Zeit immer gleichmässiger.
-Bei Bildern funktioniert das so:((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models))
-  - Vorwärtsprozess: Ein Bild wird Schritt für Schritt verrauscht, bis nur noch Zufall übrig bleibt
-  - Rückwärtsprozess: Das Modell lernt, dieses Rauschen wieder in ein sinnvolles Bild umzuwandeln
-  - Anwendung: Man startet mit Rauschen und erzeugt daraus Schritt für Schritt ein Bild
-<WRAP tip>
-Merkhilfe: Man beginnt mit reinem Rauschen. Mit jedem Schritt wird das Bild klarer, bis es zum Prompt passt.
-</WRAP>
-==== Latent Diffusion Models (LDM) ====
-Um Rechenleistung zu sparen, wird die Diffusion nicht direkt auf dem Bild durchgeführt, sondern im latenten Raum.
-Das macht den Prozess deutlich schneller, ohne grosse Qualitätsverluste.((GuideGlare: Diffusionsmodelle erklärt. https://www.guideglare.com/de/plattform/bild-suite/technologie/diffusionsmodelle-ki-bildgeneratoren))
-Der Prompt wird über Cross-Attention eingebunden, sodass das Modell weiss, welches Bild erzeugt werden soll.
-===== 3. Wichtige Modelltypen =====
-^ Modelltyp ^ Funktionsweise ^ Bedeutung ^
-| GANs | Zwei Netze konkurrieren miteinander | Früher wichtig, heute weniger relevant |
-| VAE | Komprimiert und rekonstruiert Bilder | Bestandteil moderner Modelle |
-| DDPM | Schrittweises Entrauschen | Basis von Diffusion |
-| LDM | Diffusion im latenten Raum | Grundlage moderner Tools |
-| DiT | Transformer im Diffusionsprozess | Neue, skalierbare Ansätze |
-===== 4. Wie funktioniert ein Bildgenerator? =====
-Typischer Ablauf:
-<WRAP box>
-  - Der Prompt wird in Zahlen umgewandelt
-  - Zufälliges Rauschen wird erzeugt
-  - Das Modell entfernt Schritt für Schritt das Rauschen
-  - Der Prompt steuert den Prozess
-  - Am Ende wird das Bild erzeugt
-</WRAP>
-==== Wichtige Parameter ====
-^ Parameter ^ Bedeutung ^
-| Seed | Bestimmt den Zufall |
-| Guidance Scale | Wie stark der Prompt wirkt |
-| Steps | Anzahl der Schritte |
-| Negativer Prompt | Was nicht im Bild sein soll |
-==== ControlNet ====
-ControlNet erlaubt zusätzliche Kontrolle, z. B. über Formen oder Posen.
-Das Modell übernimmt die Struktur und kombiniert sie mit dem Stil aus dem Prompt.((theblue.ai: Diffusionsmodelle erklärt. https://theblue.ai/blog-de/trends/diffusionsmodelle-generative-ki/))
-===== 5. Video-Generatoren =====
-Ein Video besteht aus vielen Bildern (Frames), die zusammenpassen müssen.
-<WRAP important>
-Die grösste Herausforderung ist die zeitliche Konsistenz:
-Objekte und Personen sollen sich logisch und stabil über mehrere Frames bewegen.
-</WRAP>
-==== Ansätze ====
-^ Ansatz ^ Beschreibung ^
-| Video Diffusion | Erweiterung von Bilddiffusion |
-| Kaskadenmodell | Mehrstufige Verbesserung |
-| Latent Video Diffusion | Effizientere Berechnung |
-| Spacetime Patches | Verarbeitung über Raum und Zeit |
-==== Tipps für Prompts ====
-  * Bewegung beschreiben
-  * Kamera angeben
-  * Szene einfach halten
-===== 6. Tools und Modelle =====
-^ Tool ^ Besonderheit ^
-| Stable Diffusion | Open Source |
-| Midjourney | Sehr hohe Qualität |
-| DALL-E 3 | Gute Textverarbeitung |
-| Firefly | Lizenzierte Daten |
-| Runway | Video |
-| Pika | Einfache Bedienung |
-| Sora | Hochwertige Videos |
-===== 7. Anwendungsbereiche =====
-  * Kreativarbeit (Design, Werbung)
-  * Bildung
-  * Forschung
-  * Industrie
-  * Unterhaltung
-===== 8. Risiken =====
-==== Deepfakes ====
-Täuschend echte Fake-Inhalte können entstehen und zur Desinformation genutzt werden.
-==== Urheberrecht ====
-Rein KI-generierte Inhalte sind meist nicht geschützt. Die Rechtslage ist noch unklar.
-==== Bias ====
-Modelle übernehmen Verzerrungen aus den Trainingsdaten.
-==== Umwelt ====
-Training benötigt viel Energie.
-===== 9. Zusammenfassung =====
-<WRAP tip>
-  - KI erzeugt Bilder aus Text
-  - Diffusion ist das zentrale Verfahren
-  - Parameter steuern das Ergebnis
-  - Video ist komplexer als Bild
-  - Risiken sind wichtig zu beachten
-</WRAP>