Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
ef:ki:grundissen [2026/04/21 20:36] bauertef:ki:grundissen [2026/05/06 10:38] (aktuell) lehmannr
Zeile 1: Zeile 1:
 ====== Grundwissen zur Künstlichen Intelligenz ====== ====== Grundwissen zur Künstlichen Intelligenz ======
 +Bei der kurzen Prüfung werde ich vor allem die Konzepte abfragen, d.h. Faktenwissen. 
 +Die unten grün markierten Inhalte sind sehr interessant, aber für die Prüfung weniger relevant.
 +
  
   - Erkläre die Begriffe "Künstliche Intelligenz", "Maschinelles Lernen", "Neuronale Netzwerke"   - Erkläre die Begriffe "Künstliche Intelligenz", "Maschinelles Lernen", "Neuronale Netzwerke"
Zeile 8: Zeile 11:
     - Kostenfunktion     - Kostenfunktion
     - Backpropagation     - Backpropagation
-    - Aktivierungsfunktion (z.B. Sigmoid) +    - Aktivierungsfunktion 
   - LLMs    - LLMs 
     - Erkläre grob, was ein LLM ist und wie es funktioniert     - Erkläre grob, was ein LLM ist und wie es funktioniert
Zeile 14: Zeile 17:
     - Was versteht man unter Pre-Training und RLHF (Reinforcement Learning from Human Feedback)?     - Was versteht man unter Pre-Training und RLHF (Reinforcement Learning from Human Feedback)?
     - Warum brachte die Transformer-Architektur einen gewaltigen Vorteil gegenüber herkömmlichen Verfahren und worin besteht sie grob gesagt?     - Warum brachte die Transformer-Architektur einen gewaltigen Vorteil gegenüber herkömmlichen Verfahren und worin besteht sie grob gesagt?
-    - Wie werden Wörter codiert? Was versteht man unter dem "Attention-Mechanismus" +    - Wie werden Wörter codiert? Was versteht man unter dem "Attention-Mechanismus" 
 +  - Was ist der Unterschied zwischen generativer und prädiktiver KI? 
 +  - Ein LLM gibt für ein und dieselbe Eingabe nicht immer dieselbe Ausgabe, ein Diffussionsmodell für die Bildgenerierung schon. Nimm zu dieser Aussage Stellung. 
 +  - Warum sind GPU (Graphikkarten bzw. Graphikprozessoren) in der KI so wichtig? 
 +  - Welche zwei Bedeutungen hat das Wort "Bias" im Zusammenhang mit KI? 
 +  - Gib ein persönliches kurzes Statement ab bezüglich der These "Durch KI werden die durch die Studenten eingereichgten Produkte immer besser, obwohl sie in mündlichen Prüfungen immer schlechter abschneiden." 
 +  - Was könnte unter den Begriffen "Skill Skipping", "Kognitive Entlastung" gemeint sein? 
 +  - Nenne Bereiche, die in Zukunft durch den Einsatz von KI komplett verändert werden könnten. Erkläre kurz. 
 +  
 +<color #22b14c>- Nimm Stellung zu Problemen und ethischen Fragen, die durch KIs aufgeworfen werden.</color> 
 + 
 +<color #22b14c>- Dürfen KI-Modelle mithilfe von jeglichen Daten trainiert werden? (Urheberrecht)</color> 
 + 
 +<color #22b14c>- Dürfen KI-Systeme Entscheidungen selbst treffen (z.B. Verkehr)</color> 
 + 
 +<color #22b14c>- Welche Problematik stellen Deepfakes dar?</color>
  
 ==== Quellen ==== ==== Quellen ====
Zeile 25: Zeile 43:
  
  
-====== Bild- und Videogeneratoren mit KI ====== 
- 
-Stell dir vor, du schreibst „ein futuristisches Zürich bei Nacht“, und eine KI erzeugt daraus in wenigen Sekunden ein realistisches Bild oder sogar ein Video. 
- 
-Genau das machen moderne Bild und Videogeneratoren. 
- 
-Diese Seite erklärt, wie solche Systeme funktionieren, von den Grundbegriffen über die technischen Hintergründe bis zu den wichtigsten gesellschaftlichen Fragen. 
- 
-<WRAP tip> 
-Auf einen Blick: Bild und Videogeneratoren sind KI Programme, die aus einer Texteingabe neue Bilder oder Videos erzeugen. Das wichtigste Verfahren dahinter nennt man Diffusionsmodell. 
-</WRAP> 
- 
- 
-===== 1. Grundbegriffe ===== 
- 
-==== Was ist generative KI? ==== 
- 
-Normale KI erkennt Dinge, zum Beispiel ob auf einem Bild eine Katze zu sehen ist. 
- 
-Generative KI geht einen Schritt weiter: Sie erzeugt neue Inhalte, die es vorher noch nicht gab. 
- 
-Das Modell lernt aus sehr vielen Beispielen. Es erkennt dabei Muster, also wie typische Bilder, Texte oder Videos aussehen, und kann daraus neue Inhalte erzeugen, die ähnlich wirken.((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models)) 
- 
-Bild und Videogeneratoren gehören zu dieser Art von KI. Man gibt eine Beschreibung, den sogenannten Prompt, ein und das Modell erzeugt daraus ein passendes Bild oder Video. 
- 
-^ Begriff ^ Erklärung ^ 
-| Prompt | Texteingabe, die beschreibt, was erzeugt werden soll | 
-| Seed | Startwert für den Zufall, gleicher Seed führt zum gleichen Bild | 
-| Latenter Raum | Vereinfachte interne Darstellung eines Bildes | 
-| Training | Lernphase mit vielen Beispielbildern | 
-| Inference | Nutzung des Modells, Prompt führt zu einem Bild | 
- 
- 
-==== Was macht einen guten Prompt aus? ==== 
- 
-Ein guter Prompt beschreibt möglichst genau: 
- 
-  * Was im Bild zu sehen sein soll 
-  * Wie es aussehen soll, zum Beispiel Stil oder Licht 
-  * Optional die Perspektive oder Kamera 
- 
-<WRAP example> 
-Schwacher Prompt: //Ein Hund// 
- 
-Besserer Prompt: //Ein Golden Retriever sitzt auf einer sonnigen Wiese, warmes Nachmittagslicht, fotorealistisch, geringe Schärfentiefe// 
-</WRAP> 
- 
- 
-==== Trainingsdaten ==== 
- 
-Damit ein Modell Bilder erzeugen kann, braucht es sehr viele Beispiele. 
- 
-Beim Training sieht es Millionen von Bildern zusammen mit passenden Textbeschreibungen. 
- 
-So lernt das Modell, was Begriffe wie „Hund“ oder „Sonnenuntergang“ visuell bedeuten.((Digitalzentrum Franken: KI Bildgenerierung mit Stable Diffusion. https://digitalzentrum-franken.de/aktuelles/detail/ki-bildgenerierung-mit-stable-diffusion)) 
- 
- 
-===== 2. Technische Grundlagen ===== 
- 
-<WRAP info> 
-Dieser Abschnitt erklärt die wichtigsten Ideen im Hintergrund. Es geht um ein grundlegendes Verständnis, nicht um Details. 
-</WRAP> 
- 
- 
-==== Neuronale Netze ==== 
- 
-Ein neuronales Netz ist ein Computerprogramm, das grob vom menschlichen Gehirn inspiriert ist. 
- 
-Es besteht aus vielen kleinen Recheneinheiten, die miteinander verbunden sind. 
- 
-Beim Training werden diese Verbindungen so angepasst, dass das Netz sinnvolle Ergebnisse erzeugt, in diesem Fall neue Bilder.((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models)) 
- 
- 
-==== Transformer und Attention ==== 
- 
-Transformer sind eine spezielle Art von neuronalen Netzen. Sie sind besonders gut darin, Zusammenhänge zu erkennen. 
- 
-Zum Beispiel versteht das Modell, dass „sonnige Wiese“ bestimmte Farben, Lichtverhältnisse und Objekte bedeutet. 
- 
-Der Mechanismus dahinter heisst Attention. Das Modell lernt dabei, welche Teile der Eingabe besonders wichtig sind.((dogado KI Lexikon: Diffusionsmodelle. https://www.dogado.de/ki-lexikon/diffusionsmodelle)) 
- 
- 
-==== U Net ==== 
- 
-Viele Bildgeneratoren verwenden eine Struktur namens U Net. 
- 
-Das Modell vereinfacht das Bild zuerst und baut es danach wieder auf. 
- 
-So kann es Bilder schrittweise verbessern und Details hinzufügen.((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models)) 
- 
- 
-==== Variational Autoencoder, VAE ==== 
- 
-Ein VAE besteht aus zwei Teilen: 
- 
-  - Encoder: Wandelt ein Bild in eine kompakte Darstellung um 
-  - Decoder: Baut aus dieser Darstellung wieder ein Bild auf 
- 
-Dadurch muss das Modell nicht direkt mit allen Pixeln rechnen, sondern mit einer vereinfachten Version.((AWS: Was ist Stable Diffusion? https://aws.amazon.com/de/what-is/stable-diffusion/)) 
- 
- 
-==== Diffusionsmodelle ==== 
- 
-Diffusionsmodelle sind das Herz moderner Bildgeneratoren. 
- 
-Die Idee ist einfach: Ein Bild wird zuerst immer stärker verrauscht, bis nur noch Zufall übrig bleibt. Das Modell lernt dann, diesen Prozess umzukehren. 
- 
-  - Vorwärtsprozess: Bild wird schrittweise verrauscht 
-  - Rückwärtsprozess: Rauschen wird wieder in ein Bild umgewandelt 
-  - Anwendung: Man startet mit Zufall und erzeugt daraus ein Bild 
- 
-<WRAP tip> 
-Man kann sich das so vorstellen: Aus chaotischem Rauschen entsteht Schritt für Schritt ein klares Bild. 
-</WRAP> 
- 
- 
-==== Latent Diffusion Models ==== 
- 
-Um schneller zu sein, wird die Diffusion nicht direkt auf dem Bild durchgeführt, sondern im latenten Raum. 
- 
-Das spart viel Rechenleistung und macht moderne Modelle erst praktikabel.((GuideGlare: Diffusionsmodelle erklärt. https://www.guideglare.com/de/plattform/bild-suite/technologie/diffusionsmodelle-ki-bildgeneratoren)) 
- 
- 
-===== 3. Wichtige Modelltypen ===== 
- 
-^ Modelltyp ^ Funktionsweise ^ Bedeutung ^ 
-| GANs | Zwei Netze konkurrieren miteinander | Heute weniger wichtig für Text zu Bild | 
-| VAE | Komprimiert und rekonstruiert Bilder | Bestandteil moderner Modelle | 
-| DDPM | Schrittweises Entrauschen | Grundlage von Diffusion | 
-| LDM | Diffusion im latenten Raum | Basis aktueller Systeme | 
-| DiT | Transformer im Diffusionsprozess | Neue skalierbare Modelle | 
- 
- 
-===== 4. Wie funktioniert ein Bildgenerator? ===== 
- 
-Typischer Ablauf: 
- 
-<WRAP box> 
-  - Der Prompt wird in Zahlen umgewandelt 
-  - Zufälliges Rauschen wird erzeugt 
-  - Das Modell entfernt Schritt für Schritt das Rauschen 
-  - Der Prompt steuert den Prozess 
-  - Am Ende entsteht das Bild 
-</WRAP> 
- 
- 
-==== Wichtige Parameter ==== 
- 
-^ Parameter ^ Bedeutung ^ 
-| Seed | Bestimmt den Zufall | 
-| Guidance Scale | Stärke des Prompts | 
-| Steps | Anzahl Schritte | 
-| Negativer Prompt | Was vermieden werden soll | 
- 
- 
-==== ControlNet ==== 
- 
-ControlNet erlaubt zusätzliche Kontrolle, zum Beispiel über Formen oder Posen. 
- 
-Das Modell übernimmt die Struktur und kombiniert sie mit dem Stil aus dem Prompt.((theblue.ai: Diffusionsmodelle erklärt. https://theblue.ai/blog-de/trends/diffusionsmodelle-generative-ki/)) 
- 
- 
-===== 5. Video Generatoren ===== 
- 
-Ein Video besteht aus vielen einzelnen Bildern, die zeitlich zusammenpassen müssen. 
- 
-<WRAP important> 
-Die grösste Herausforderung ist die zeitliche Konsistenz. Objekte sollen sich stabil und logisch bewegen. 
-</WRAP> 
- 
- 
-==== Ansätze ==== 
- 
-^ Ansatz ^ Beschreibung ^ 
-| Video Diffusion | Erweiterung von Bilddiffusion auf mehrere Frames | 
-| Kaskadenmodell | Mehrstufige Verbesserung | 
-| Latent Video Diffusion | Effizientere Verarbeitung | 
-| Spacetime Patches | Verarbeitung über Raum und Zeit | 
- 
- 
-==== Tipps für Prompts ==== 
- 
-  * Bewegung beschreiben 
-  * Kamera angeben 
-  * Szene nicht zu komplex machen 
- 
- 
-===== 6. Tools und Modelle ===== 
- 
-^ Tool ^ Besonderheit ^ 
-| Stable Diffusion | Open Source | 
-| Midjourney | Sehr hohe Bildqualität | 
-| DALL E 3 | Gute Umsetzung von Text | 
-| Firefly | Lizenzierte Daten | 
-| Runway | Video | 
-| Pika | Einfache Bedienung | 
-| Sora | Sehr realistische Videos | 
- 
- 
-===== 7. Anwendungsbereiche ===== 
- 
-KI Bild und Videogeneratoren werden in vielen Bereichen eingesetzt. Um einen besseren Überblick zu behalten, kann man die Anwendungen in verschiedene Kategorien einteilen: 
- 
-==== Kreative Anwendungen ==== 
- 
-  * Kunst und Design: Unterstützung bei Ideen, Entwürfen und Visualisierungen 
-  * Film und Medien: Erstellung von Storyboards, visuellen Effekten und Konzeptbildern 
-  * Spieleentwicklung: Generierung von Figuren, Landschaften und Texturen 
- 
-==== Praktische und berufliche Anwendungen ==== 
- 
-  * Architektur und Produktdesign: Realistische Visualisierung von Gebäuden und Objekten 
-  * Marketing: Erstellung von Bildern und Videos für Werbung und soziale Medien 
-  * Bildung: Veranschaulichung von komplexen Inhalten, z. B. historische Szenen oder wissenschaftliche Prozesse 
- 
-==== Wissenschaft und Technik ==== 
- 
-  * Forschung: Generierung von synthetischen Daten für das Training anderer KI Modelle 
-  * Medizin: Simulationen und Visualisierungen, vor allem in Ausbildung und Forschung 
- 
-==== Alltag ==== 
- 
-  * Private Nutzung: Erstellung von Bildern, Videos oder kreativen Projekten 
-  * Social Media: Inhalte für Posts, Profile oder persönliche Projekte 
- 
- 
-===== 8. Risiken und gesellschaftliche Fragen ===== 
- 
-==== Deepfakes und Desinformation ==== 
- 
-Mit generativer KI lassen sich sehr realistische Bilder und Videos von Personen erzeugen, sogenannte Deepfakes. 
- 
-Diese können gezielt eingesetzt werden, um falsche Informationen zu verbreiten oder Menschen Dinge in den Mund zu legen, die sie nie gesagt haben. 
- 
-Das Problem ist, dass solche Inhalte für viele Menschen kaum von echten Aufnahmen zu unterscheiden sind. 
- 
-Dadurch wird es schwieriger, zwischen Wahrheit und Manipulation zu unterscheiden.((BSI: Deepfakes Gefahren und Gegenmassnahmen. https://www.bsi.bund.de)) 
- 
- 
-==== Verlust von Vertrauen ==== 
- 
-Wenn immer mehr Inhalte künstlich erzeugt werden, kann das langfristig das Vertrauen in Medien schwächen. 
- 
-Fotos und Videos galten früher oft als Beweis. Heute ist das nicht mehr selbstverständlich. 
- 
-Das betrifft zum Beispiel Journalismus, soziale Medien und auch politische Kommunikation. 
- 
- 
-==== Urheberrecht und Autorschaft ==== 
- 
-Ein zentrales Problem ist die Frage, wem ein KI erzeugtes Bild gehört. 
- 
-In vielen Fällen gilt: Wenn kein Mensch kreativ beteiligt ist, gibt es kein klassisches Urheberrecht. 
- 
-Schwierig wird es, wenn ein Mensch aktiv am Ergebnis mitarbeitet, zum Beispiel durch gezielte Prompts oder Nachbearbeitung. 
- 
-Hier ist die Rechtslage noch nicht eindeutig geklärt. 
- 
- 
-==== Bias und Repräsentation ==== 
- 
-KI Modelle lernen aus grossen Datenmengen aus dem Internet. Diese Daten enthalten oft unbewusste Verzerrungen. 
- 
-Das kann dazu führen, dass bestimmte Gruppen stereotyp dargestellt werden oder weniger sichtbar sind. 
- 
-Solche Verzerrungen nennt man Bias und sie spiegeln gesellschaftliche Ungleichheiten wider. 
- 
- 
-==== Missbrauch und Manipulation ==== 
- 
-Neben Deepfakes gibt es weitere Risiken: 
- 
-  * Erstellung von Fake Bildern für Betrug 
-  * Manipulation von Beweismaterial 
-  * Automatisierte Propaganda 
- 
-Dadurch entsteht ein neues Feld von digitalen Sicherheitsproblemen. 
- 
- 
-==== Umwelt und Ressourcen ==== 
- 
-Das Training grosser Modelle benötigt viel Rechenleistung und Energie. 
- 
-Das führt zu einem hohen Stromverbrauch und damit zu Umweltbelastung. 
- 
-Neue Methoden versuchen, diese Kosten zu reduzieren, aber das Problem bleibt bestehen. 
- 
- 
-===== 9. Zusammenfassung ===== 
- 
-<WRAP tip> 
-  - KI kann aus Text Bilder und Videos erzeugen 
-  - Diffusionsmodelle sind das zentrale Verfahren 
-  - Parameter steuern das Ergebnis 
-  - Videos sind komplexer als Bilder 
-  - Die gesellschaftlichen Auswirkungen sind zentral 
-</WRAP> 
  • ef/ki/grundissen.1776796588.txt.gz
  • Zuletzt geändert: 2026/04/21 20:36
  • von bauert