Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
ef:ki:grundissen [2026/04/21 20:16] bauertef:ki:grundissen [2026/05/06 10:38] (aktuell) lehmannr
Zeile 1: Zeile 1:
 ====== Grundwissen zur Künstlichen Intelligenz ====== ====== Grundwissen zur Künstlichen Intelligenz ======
 +Bei der kurzen Prüfung werde ich vor allem die Konzepte abfragen, d.h. Faktenwissen. 
 +Die unten grün markierten Inhalte sind sehr interessant, aber für die Prüfung weniger relevant.
 +
  
   - Erkläre die Begriffe "Künstliche Intelligenz", "Maschinelles Lernen", "Neuronale Netzwerke"   - Erkläre die Begriffe "Künstliche Intelligenz", "Maschinelles Lernen", "Neuronale Netzwerke"
Zeile 8: Zeile 11:
     - Kostenfunktion     - Kostenfunktion
     - Backpropagation     - Backpropagation
-    - Aktivierungsfunktion (z.B. Sigmoid) +    - Aktivierungsfunktion 
   - LLMs    - LLMs 
     - Erkläre grob, was ein LLM ist und wie es funktioniert     - Erkläre grob, was ein LLM ist und wie es funktioniert
Zeile 14: Zeile 17:
     - Was versteht man unter Pre-Training und RLHF (Reinforcement Learning from Human Feedback)?     - Was versteht man unter Pre-Training und RLHF (Reinforcement Learning from Human Feedback)?
     - Warum brachte die Transformer-Architektur einen gewaltigen Vorteil gegenüber herkömmlichen Verfahren und worin besteht sie grob gesagt?     - Warum brachte die Transformer-Architektur einen gewaltigen Vorteil gegenüber herkömmlichen Verfahren und worin besteht sie grob gesagt?
-    - Wie werden Wörter codiert? Was versteht man unter dem "Attention-Mechanismus" +    - Wie werden Wörter codiert? Was versteht man unter dem "Attention-Mechanismus" 
 +  - Was ist der Unterschied zwischen generativer und prädiktiver KI? 
 +  - Ein LLM gibt für ein und dieselbe Eingabe nicht immer dieselbe Ausgabe, ein Diffussionsmodell für die Bildgenerierung schon. Nimm zu dieser Aussage Stellung. 
 +  - Warum sind GPU (Graphikkarten bzw. Graphikprozessoren) in der KI so wichtig? 
 +  - Welche zwei Bedeutungen hat das Wort "Bias" im Zusammenhang mit KI? 
 +  - Gib ein persönliches kurzes Statement ab bezüglich der These "Durch KI werden die durch die Studenten eingereichgten Produkte immer besser, obwohl sie in mündlichen Prüfungen immer schlechter abschneiden." 
 +  - Was könnte unter den Begriffen "Skill Skipping", "Kognitive Entlastung" gemeint sein? 
 +  - Nenne Bereiche, die in Zukunft durch den Einsatz von KI komplett verändert werden könnten. Erkläre kurz. 
 +  
 +<color #22b14c>- Nimm Stellung zu Problemen und ethischen Fragen, die durch KIs aufgeworfen werden.</color> 
 + 
 +<color #22b14c>- Dürfen KI-Modelle mithilfe von jeglichen Daten trainiert werden? (Urheberrecht)</color> 
 + 
 +<color #22b14c>- Dürfen KI-Systeme Entscheidungen selbst treffen (z.B. Verkehr)</color> 
 + 
 +<color #22b14c>- Welche Problematik stellen Deepfakes dar?</color>
  
 ==== Quellen ==== ==== Quellen ====
Zeile 25: Zeile 43:
  
  
-====== Bild- und Videogeneratoren mit KI ====== 
- 
-Stell dir vor, du schreibst „ein futuristisches Zürich bei Nacht“, und eine KI erzeugt daraus in wenigen Sekunden ein realistisches Bild oder sogar ein Video. 
- 
-Genau das machen moderne Bild und Videogeneratoren. 
- 
-Diese Seite erklärt, wie solche Systeme funktionieren, von den Grundbegriffen über die technischen Hintergründe bis zu den wichtigsten gesellschaftlichen Fragen. 
- 
-<WRAP tip> 
-Auf einen Blick: Bild und Videogeneratoren sind KI Programme, die aus einer Texteingabe neue Bilder oder Videos erzeugen. Das wichtigste Verfahren dahinter nennt man Diffusionsmodell. 
-</WRAP> 
- 
- 
-===== 1. Grundbegriffe ===== 
- 
-==== Was ist generative KI? ==== 
- 
-Normale KI erkennt Dinge, zum Beispiel ob auf einem Bild eine Katze zu sehen ist.   
-Generative KI geht einen Schritt weiter: Sie erzeugt neue Inhalte, die es vorher noch nicht gab. 
- 
-Das Modell lernt aus sehr vielen Beispielen. Es erkennt dabei Muster, also wie typische Bilder, Texte oder Videos aussehen, und kann daraus neue Inhalte erzeugen, die ähnlich wirken.((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models)) 
- 
-Bild und Videogeneratoren gehören zu dieser Art von KI. Man gibt eine Beschreibung, den sogenannten Prompt, ein und das Modell erzeugt daraus ein passendes Bild oder Video. 
- 
-^ Begriff ^ Erklärung ^ 
-| Prompt | Texteingabe, die beschreibt, was erzeugt werden soll | 
-| Seed | Startwert für den Zufall, gleicher Seed führt zum gleichen Bild | 
-| Latenter Raum | Vereinfachte interne Darstellung eines Bildes | 
-| Training | Lernphase mit vielen Beispielbildern | 
-| Inference | Nutzung des Modells, Prompt führt zu einem Bild | 
- 
-==== Was macht einen guten Prompt aus? ==== 
- 
-Ein guter Prompt beschreibt möglichst genau: 
- 
-  * Was im Bild zu sehen sein soll 
-  * Wie es aussehen soll, zum Beispiel Stil oder Licht 
-  * Optional die Perspektive oder Kamera 
- 
-<WRAP example> 
-Schwacher Prompt: //Ein Hund// 
- 
-Besserer Prompt: //Ein Golden Retriever sitzt auf einer sonnigen Wiese, warmes Nachmittagslicht, fotorealistisch, geringe Schärfentiefe// 
-</WRAP> 
- 
-==== Trainingsdaten ==== 
- 
-Damit ein Modell Bilder erzeugen kann, braucht es sehr viele Beispiele. Beim Training sieht es Millionen von Bildern zusammen mit passenden Textbeschreibungen. 
- 
-So lernt das Modell, was Begriffe wie „Hund“ oder „Sonnenuntergang“ visuell bedeuten.((Digitalzentrum Franken: KI Bildgenerierung mit Stable Diffusion. https://digitalzentrum-franken.de/aktuelles/detail/ki-bildgenerierung-mit-stable-diffusion)) 
- 
- 
-===== 2. Technische Grundlagen ===== 
- 
-<WRAP info> 
-Dieser Abschnitt erklärt die wichtigsten Ideen im Hintergrund. Es geht um ein grundlegendes Verständnis, nicht um Details. 
-</WRAP> 
- 
-==== Neuronale Netze ==== 
- 
-Ein neuronales Netz ist ein Computerprogramm, das grob vom menschlichen Gehirn inspiriert ist. Es besteht aus vielen kleinen Recheneinheiten, die miteinander verbunden sind. 
- 
-Beim Training werden diese Verbindungen so angepasst, dass das Netz sinnvolle Ergebnisse erzeugt, in diesem Fall neue Bilder.((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models)) 
- 
-==== Transformer und Attention ==== 
- 
-Transformer sind eine spezielle Art von neuronalen Netzen. Sie sind besonders gut darin, Zusammenhänge zu erkennen. 
- 
-Zum Beispiel versteht das Modell, dass „sonnige Wiese“ bestimmte Farben, Lichtverhältnisse und Objekte bedeutet. 
- 
-Der Mechanismus dahinter heisst Attention. Das Modell lernt dabei, welche Teile der Eingabe besonders wichtig sind.((dogado KI Lexikon: Diffusionsmodelle. https://www.dogado.de/ki-lexikon/diffusionsmodelle)) 
- 
-==== U Net ==== 
- 
-Viele Bildgeneratoren verwenden eine Struktur namens U Net. Das Modell vereinfacht das Bild zuerst und baut es danach wieder auf. 
- 
-So kann es Bilder schrittweise verbessern und Details hinzufügen.((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models)) 
- 
-==== Variational Autoencoder, VAE ==== 
- 
-Ein VAE besteht aus zwei Teilen: 
- 
-  - Encoder: Wandelt ein Bild in eine kompakte Darstellung um 
-  - Decoder: Baut aus dieser Darstellung wieder ein Bild auf 
- 
-Dadurch muss das Modell nicht direkt mit allen Pixeln rechnen, sondern mit einer vereinfachten Version.((AWS: Was ist Stable Diffusion? https://aws.amazon.com/de/what-is/stable-diffusion/)) 
- 
-==== Diffusionsmodelle ==== 
- 
-Diffusionsmodelle sind das Herz moderner Bildgeneratoren. 
- 
-Die Idee ist einfach: Ein Bild wird zuerst immer stärker verrauscht, bis nur noch Zufall übrig bleibt. Das Modell lernt dann, diesen Prozess umzukehren. 
- 
-  - Vorwärtsprozess: Bild wird schrittweise verrauscht 
-  - Rückwärtsprozess: Rauschen wird wieder in ein Bild umgewandelt 
-  - Anwendung: Man startet mit Zufall und erzeugt daraus ein Bild 
- 
-<WRAP tip> 
-Man kann sich das so vorstellen: Aus chaotischem Rauschen entsteht Schritt für Schritt ein klares Bild. 
-</WRAP> 
- 
-==== Latent Diffusion Models ==== 
- 
-Um schneller zu sein, wird die Diffusion nicht direkt auf dem Bild durchgeführt, sondern im latenten Raum. 
- 
-Das spart viel Rechenleistung und macht moderne Modelle erst praktikabel.((GuideGlare: Diffusionsmodelle erklärt. https://www.guideglare.com/de/plattform/bild-suite/technologie/diffusionsmodelle-ki-bildgeneratoren)) 
- 
- 
-===== 3. Wichtige Modelltypen ===== 
- 
-^ Modelltyp ^ Funktionsweise ^ Bedeutung ^ 
-| GANs | Zwei Netze konkurrieren miteinander | Heute weniger wichtig für Text zu Bild | 
-| VAE | Komprimiert und rekonstruiert Bilder | Bestandteil moderner Modelle | 
-| DDPM | Schrittweises Entrauschen | Grundlage von Diffusion | 
-| LDM | Diffusion im latenten Raum | Basis aktueller Systeme | 
-| DiT | Transformer im Diffusionsprozess | Neue skalierbare Modelle | 
- 
- 
-===== 4. Wie funktioniert ein Bildgenerator? ===== 
- 
-Typischer Ablauf: 
- 
-<WRAP box> 
-  - Der Prompt wird in Zahlen umgewandelt 
-  - Zufälliges Rauschen wird erzeugt 
-  - Das Modell entfernt Schritt für Schritt das Rauschen 
-  - Der Prompt steuert den Prozess 
-  - Am Ende entsteht das Bild 
-</WRAP> 
- 
-==== Wichtige Parameter ==== 
- 
-^ Parameter ^ Bedeutung ^ 
-| Seed | Bestimmt den Zufall | 
-| Guidance Scale | Stärke des Prompts | 
-| Steps | Anzahl Schritte | 
-| Negativer Prompt | Was vermieden werden soll | 
- 
-==== ControlNet ==== 
- 
-ControlNet erlaubt zusätzliche Kontrolle, zum Beispiel über Formen oder Posen. Das Modell übernimmt die Struktur und kombiniert sie mit dem Stil aus dem Prompt.((theblue.ai: Diffusionsmodelle erklärt. https://theblue.ai/blog-de/trends/diffusionsmodelle-generative-ki/)) 
- 
- 
-===== 5. Video Generatoren ===== 
- 
-Ein Video besteht aus vielen einzelnen Bildern, die zeitlich zusammenpassen müssen. 
- 
-<WRAP important> 
-Die grösste Herausforderung ist die zeitliche Konsistenz. Objekte sollen sich stabil und logisch bewegen. 
-</WRAP> 
- 
-==== Ansätze ==== 
- 
-^ Ansatz ^ Beschreibung ^ 
-| Video Diffusion | Erweiterung von Bilddiffusion auf mehrere Frames | 
-| Kaskadenmodell | Mehrstufige Verbesserung | 
-| Latent Video Diffusion | Effizientere Verarbeitung | 
-| Spacetime Patches | Verarbeitung über Raum und Zeit | 
- 
-==== Tipps für Prompts ==== 
- 
-  * Bewegung beschreiben 
-  * Kamera angeben 
-  * Szene nicht zu komplex machen 
- 
- 
-===== 6. Tools und Modelle ===== 
- 
-^ Tool ^ Besonderheit ^ 
-| Stable Diffusion | Open Source | 
-| Midjourney | Sehr hohe Bildqualität | 
-| DALL E 3 | Gute Umsetzung von Text | 
-| Firefly | Lizenzierte Daten | 
-| Runway | Video | 
-| Pika | Einfache Bedienung | 
-| Sora | Sehr realistische Videos | 
- 
- 
-===== 7. Anwendungsbereiche ===== 
- 
-KI Bild und Videogeneratoren werden heute in sehr unterschiedlichen Bereichen eingesetzt. Dabei geht es nicht nur um Kunst, sondern oft auch um praktische Anwendungen. 
- 
-  * Kreativbranche: Künstler, Designer und Werbeagenturen nutzen KI für Ideen, Entwürfe und Visualisierungen. Oft dient sie als Unterstützung im kreativen Prozess, nicht als Ersatz. 
-  * Film und Medien: Storyboards, visuelle Effekte oder sogar ganze Szenen können schneller entworfen werden. Das spart Zeit und Kosten. 
-  * Spieleentwicklung: Figuren, Landschaften oder Texturen können automatisiert erstellt werden, was die Produktion beschleunigt. 
-  * Bildung: Komplexe Inhalte lassen sich visuell darstellen, zum Beispiel historische Szenen oder naturwissenschaftliche Prozesse. 
-  * Forschung: KI kann künstliche Daten erzeugen, um andere Modelle zu trainieren, wenn reale Daten fehlen oder sensibel sind. 
-  * Architektur und Design: Gebäude oder Produkte können schnell als realistische Visualisierungen dargestellt werden. 
-  * Marketing und soziale Medien: Bilder und Videos können gezielt für Kampagnen erstellt und angepasst werden. 
-  * Medizin: Erste Ansätze nutzen generative Modelle zur Simulation von Daten oder zur Visualisierung von Strukturen, zum Beispiel in der Ausbildung. 
-  * Alltag: Auch Privatpersonen nutzen solche Tools für Bilder, Videos oder kreative Projekte. 
- 
- 
-===== 8. Risiken und gesellschaftliche Fragen ===== 
- 
-==== Deepfakes und Desinformation ==== 
- 
-Mit generativer KI lassen sich sehr realistische Bilder und Videos von Personen erzeugen, sogenannte Deepfakes. Diese können gezielt eingesetzt werden, um falsche Informationen zu verbreiten oder Menschen Dinge in den Mund zu legen, die sie nie gesagt haben. 
- 
-Das Problem ist, dass solche Inhalte für viele Menschen kaum von echten Aufnahmen zu unterscheiden sind. Dadurch wird es schwieriger, zwischen Wahrheit und Manipulation zu unterscheiden.((BSI: Deepfakes Gefahren und Gegenmassnahmen. https://www.bsi.bund.de)) 
- 
-==== Verlust von Vertrauen ==== 
- 
-Wenn immer mehr Inhalte künstlich erzeugt werden, kann das langfristig das Vertrauen in Medien schwächen. Fotos und Videos galten früher oft als Beweis. Heute ist das nicht mehr selbstverständlich. 
- 
-Das betrifft zum Beispiel Journalismus, soziale Medien und auch politische Kommunikation. 
- 
-==== Urheberrecht und Autorschaft ==== 
- 
-Ein zentrales Problem ist die Frage, wem ein KI erzeugtes Bild gehört. In vielen Fällen gilt: Wenn kein Mensch kreativ beteiligt ist, gibt es kein klassisches Urheberrecht. 
- 
-Schwierig wird es, wenn ein Mensch aktiv am Ergebnis mitarbeitet, zum Beispiel durch gezielte Prompts oder Nachbearbeitung. Hier ist die Rechtslage noch nicht eindeutig geklärt. 
- 
-==== Bias und Repräsentation ==== 
- 
-KI Modelle lernen aus grossen Datenmengen aus dem Internet. Diese Daten enthalten oft unbewusste Verzerrungen. 
- 
-Das kann dazu führen, dass bestimmte Gruppen stereotyp dargestellt werden oder weniger sichtbar sind. Solche Verzerrungen nennt man Bias und sie spiegeln gesellschaftliche Ungleichheiten wider. 
- 
-==== Missbrauch und Manipulation ==== 
- 
-Neben Deepfakes gibt es weitere Risiken: 
- 
-  * Erstellung von Fake Bildern für Betrug 
-  * Manipulation von Beweismaterial 
-  * Automatisierte Propaganda 
- 
-Dadurch entsteht ein neues Feld von digitalen Sicherheitsproblemen. 
- 
-==== Umwelt und Ressourcen ==== 
- 
-Das Training grosser Modelle benötigt viel Rechenleistung und Energie. Das führt zu einem hohen Stromverbrauch und damit zu Umweltbelastung. 
- 
-Neue Methoden versuchen, diese Kosten zu reduzieren, aber das Problem bleibt bestehen. 
- 
- 
-===== 9. Zusammenfassung ===== 
- 
-<WRAP tip> 
-  - KI kann aus Text Bilder und Videos erzeugen 
-  - Diffusionsmodelle sind das zentrale Verfahren 
-  - Parameter steuern das Ergebnis 
-  - Videos sind komplexer als Bilder 
-  - Die gesellschaftlichen Auswirkungen sind zentral 
-</WRAP> 
  • ef/ki/grundissen.1776795380.txt.gz
  • Zuletzt geändert: 2026/04/21 20:16
  • von bauert