1. Startseite
  2. Podcast-Produktion
  3. Stimme mit KI erstellen: Alles zu den Programmen und deren Qualität

Stimme mit KI erstellen: Alles zu den Programmen und deren Qualität

In letzter Zeit gibt es hitzige Diskussionen in der Sprecherbranche. Der Einsatz von KI-Stimmen sorgt für Aufregung und Fragen. Können sie menschliche Sprecherinnen und Sprecher ersetzen? Wie gut ist die KI-Sprachsynthese mittlerweile? Diese Fragen haben wir in diesem Blogbeitrag untersucht.

Sie sehen gerade einen Platzhalterinhalt von Youtube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden. Mehr Informationen

Sie sehen gerade einen Platzhalterinhalt von Youtube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden. Mehr Informationen

Die KI aus Sicht eines Profi-Sprechers

Ich bin selbst Sprecher, Produzent und Inhaber des Content-Marketing-Unternehmens kurt creative. Mit über 800 Vertonungen von Videos, Audiospots und Podcasts verfüge ich über reichlich Erfahrung in diesem Bereich. Bei kurt creative arbeiten wir mit professionellen menschlichen SprecherInnen, da unsere Audio-Dienstleistungen ein hohes Maß an Feingefühl und Kreativität erfordern. Aber wie sieht die Zukunft aus? Hier kommt die KI ins Spiel, die in immer mehr kreative Felder vordringt. Die Frage lautet: Kann KI eines Tages menschliche SprecherInnen ersetzen?

👉 Unsere Schritt-für-Schritt-Anleitung für deinen Podcast:

Das KI-Programm Elevenlabs

Eines der fortschrittlichsten Programme, das ich getestet habe, heißt Elevenlabs. Elevenlabs ist ein Software-Startup, das intensiv in die Sprachsynthese investiert hat. Es bietet die Möglichkeit, Text in Sprache umzuwandeln, mit verschiedenen voreingestellten Stimmen oder sogar durch das Klonen der eigenen Stimme.

Praktische Tests und Resultate

Um zu überprüfen, wie gut KI-Stimmen wirklich sind, habe ich Elevenlabs ausprobiert. Hier sind die Anwendungsfälle, die ich getestet habe:

1. Telefonansagen

Die Ergebnisse waren akzeptabel, wenn man ausreichend Zeit investiert, um Aussprachfehler zu korrigieren. Dennoch ist die Qualität ähnlich wie die eines rhetorisch begabten Laien, also bestenfalls eine Note 3+.

2. Podcast-Intros und -Outros

Dieser Test zeigte deutliche Schwächen der KI. Die emotionalen und kreativen Nuancen, die einmenschlicher Sprecher einbringen kann, fehlen komplett. Selbst Anpassungen führten nicht zu zufriedenstellenden Ergebnissen. Für diesen Anwendungsfall würde ich der KI eine Note 4- geben.

3. Podcast-Moderation

Für eine Solo-Podcast-Moderation ist die KI ebenfalls ungeeignet. Obwohl der Text gut strukturiert war, fehlte es der Sprachsynthese an Dynamik und Persönlichkeit. Hier würde ich der KI eine Note 4 geben.

4. Übersetzung von Videos

Beim Dubbing von Videos zeigte die KI ihre Stärken. Wenn das Skript selbst erstellt und übersetzt wurde, klangen die Ergebnisse flüssig und gefällig. Für diesen Anwendungsfall würde ich der KI eine Note 3 geben.

Fazit: Kombination von menschlicher Kreativität und KI

Die künstliche Intelligenz wird in bestimmten Bereichen der Informationsvermittlung nützlich sein. Für kreative Tätigkeiten, bei denen individuelle Persönlichkeit und emotionale Tiefe wichtig sind, bleibt die menschliche Stimme unersetzlich. Wie bei der Einführung des Buchdrucks wird die KI gewisse Aufgaben Routineaufgaben übernehmen können, doch die menschliche Kreativität bleibt in spezialisierten Bereichen unverzichtbar.

Podcast Intro professionell erstellen lassen

Wenn du selbst einen Podcast erstellen möchtest und ein professionelles Intro und Outro benötigst, findest du hier weitere Informationen über unsere Podcast-Intro-Angebote und kannst dir Demos unserer menschlichen Sprecherinnen und Sprecher anhören.

Mini-Webinar: Die 5 größten Fehler beim Podcast Start

Folge uns in den sozialen Medien

Für Tutorials und technische Tipps:

Für Insights aus der Audiobranche: