Künstliche Intelligenz überall Gesammelte Videovorträge

Ich habe seit dem 30. November 2022 (dem Tag, als ChatGPT in der Version 3.5 der Öffentlichkeit zugänglich gemacht wurde) mehrere Beiträge veröffentlicht, Vorträge gehalten - u.a. auf einer Betriebsversammlung und vor dem Hochschulrat - und mit vielen KI-Systemen experimentiert. Nun habe ich diese Vorträge und Teile der KI-Experimente mal in drei Videovorträge zusammengeschnitten:

  1. "Künstliche Intelligenz" und ihre Auswirkungen
    Grundlagen: Funktionsweise, Anwendungsbeispiele, Einsatzszenarien, Risiken.
    Länge: 43 min.
  1. KI in Video und Stimme
    Videogenerierung, KI-Avatare, Stimmsynthese, Stimmklone, Foto-Animation, Videoübersetzungen, Deepfakes.
    Länge: 17 min.
  1. KI in Bild und Musik
    Bildmanipulation und -generierung, Musikanalyse, Spurentrennung, Musikgenerierung.
    Länge: 21 min.

Viel Spaß & gute Unterhaltung!

 

Künstliche Intelligenz: ChatGPT und Konsorten

Das Video holt Einsteigende auch ohne Vorwissen ab. Es basiert zum größten Teil auf dem Blogbeitrag "Künstliche Intelligenz und Hochschule" und erläutert die Grundlagen (so weit ich sie selber verstanden habe 😉).

Die Inhalte sind größtenteils auf dem Stand von Frühjahr 2023

"Künstliche Intelligenz und ihre Auswirkungen" von Martin Smaxwil, Lizenz: CC by-sa 4.0
Die in diesem Video genutzten Materialien von Dritten und Videozitate unterliegen tlw. abweichenden Lizenzen und Nutzungsbedingungen.

Inhalte
  • 00:00 - 01:40 | Intro
  • 01:40 - 09:51 | Wer oder was ist ChatGPT?
  • 09:51 - 12:33 | Wie funktioniert "Künstliche Intelligenz"?
  • 12:33 - 16:00 | Was ist "Maschinelles Lernen"?
  • 16:00 - 22:03 | Was ist "Deep Learning"?
  • 22:03 - 25:47 | Finetuning, Gewichtungen & Parameter
  • 25:47 - 30:07 | Weitere generative Dienste (Übersetzung, Umformulierung, Bild- und Videogenerierung)
  • 30:07 - 39:55 | Einsatzszenarien, Vorteile, Nachteile, Gefahren
  • 39:55 - 42:00 | Ausblick: Wo geht die Reise hin?
  • 42:00 - 43:03 | Abschluss, Abspann
Quellenangaben

 

Videos, Stimmen, Avatare und Deepfakes

Hier geht es um die Erstellung synthetischer Stimmen und sog. Avatare, also synthetischer (aber recht echt wirkender) "Talking Heads" und (Deep-) Fakes.

"Künstliche Intelligenz in Video & Stimme" von Martin Smaxwil, Lizenz: CC by-sa 4.0
Die in diesem Video genutzten Materialien von Dritten und Videozitate unterliegen tlw. abweichenden Lizenzen und Nutzungsbedingungen.

Inhalt
  • 00:00 - 01:36 | Ein paar technische Grundlagen
  • 01:36 - 03:18 | Videogenerierung allgemein
  • 03:18 - 03:58 | Stimmen generieren und austauschen
  • 03:58 - 04:34 | KI-Avatare auf Basis einer Tonspur animieren
  • 04:34 - 05:02 | KI-Avatare auf Basis von Texteingaben animieren
  • 05:02 - 06:28 | Bestehende Videos übersetzen
  • 06:28 - 07:07 | Stimmen klonen
  • 07:07 - 09:11 | Personenfotos aub Basis einer Tonspur animieren
  • 09:11 - 10:46 | "AI Covers": Musik mit anderer Stimme
  • 10:46 - 12:06 | KI-basitere Trailer zu Filmen und Spielen
  • 12:06 - 15:43 | Gefahren und Beispiele für "Deepfakes"
  • 15:43 - 16:52 | Abschluss, Abspann
Quellenangaben

 

Bild- und Musikmanipulation und -generierung

In diesem Video geht es im Abschnitt "Bilder" um Werkzeuge und Möglichkeiten, bestehende Bilder zu manipulieren und Bilder mittels Texteingaben neu zu erstellen. Beim Thema "Musik" geht es um automatische Erstellung, Analyse von Songs und Manipulation von Gesang.

"Künstliche Intelligenz in Bild & Musik" von Martin Smaxwil, Lizenz: CC by-sa 4.0
Die in diesem Video genutzten Materialien von Dritten und Videozitate unterliegen tlw. abweichenden Lizenzen und Nutzungsbedingungen.

Inhalt:
  • 00:00 - 00:36 | Intro "Bilder"
  • 00:36 - 02:11 | Inhaltsbasierte Füllungs- und Reparaturwerkzeuge für Bilder
  • 02:11 - 02:55 | automatisiertes Freistellen von Vordergrund-Objekten
  • 02:55 - 03:41 | automatisiertesFärben von S/W-Fotos
  • 03:41 - 03:57 | nachträgliches Ändern von Fokus und Bokeh
  • 03:57 - 04:39 | Portraitmanipulationen
  • 04:39 - 05:40 | Bildgenerierung auf Basis von Textprompts
  • 05:40 - 08:11 | Biases von Bildgeneratoren
  • 08:11 - 09:00 | nachträgliche Generierung von Bildteilen
  • 09:00 - 09:43 | 3D Bewegungen in Standbildern, Upscaling von Rastergrafiken
  • 09:43 - 10:57 | Automatische Texterkennung und -übersetzung von Bildern, Bilderkennung von Chatbots
  • 10:57 - 11:16 | Intro "Musik"
  • 11:16 - 14:15 | Automatisiert erstellte (Hintergrund-) Musik
  • 14:15 - 14:54 | Harmonie-Analyse von bestehenden Songs
  • 14:54 - 16:53 | Spurentrennung und Erstellung von Karaoke-Versionen
  • 16:53 - 18:58 | Musikgenerierung auf Basis von Textprompts
  • 18:58 - 20:29 | KI-Gesangsstimmen
  • 20:29 - 21:10 | Abschluss
Quellenangaben

Der Artikel "Künstliche Intelligenz überall" von Martin Smaxwil ist incl. aller Videos lizenziert unter einer CC by-sa 4.0-Lizenz. Weitere Details dazu finden Sie unter https://moodle.thga.de/licensing.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Folgende HTML-Tags sind möglich:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>