Je hebt vast al eens spraak omgezet naar tekst of tekst-naar-spraak gebruikt op je smartphone of slimme luidspreker. Deze technologie bestaat al een tijdje, maar is de afgelopen jaren veel nauwkeuriger en veelzijdiger geworden. Met generatieve AI ontstaan nieuwe mogelijkheden: van muziek maken en geluidseffecten creëren tot stemmen die emoties kunnen uitdrukken.
Laten we samen enkele prompts verkennen:
Nieuwe en betere stemmodellen maken het mogelijk om stemopnames te genereren die variëren in intonatie en emotie, afhankelijk van de inhoud. AI kan niet alleen voorlezen, maar ook fluisteren of zelfs hele scènes naspelen. Met maar enkele seconden stemopname, kan je al een stem klonen. Je kan zelfs unieke stemmen creëren door ze alleen te beschrijven. Bij tekst-naar-spraak-modellen werk je meestal niet met prompts. Je selecteert een stem en voert de tekst in die je wil laten uitspreken.
Beluister de onderstaande fragmenten en merk op wat elke stem bijzonder maakt.
Ook bij AI-stemmen zijn hele groepen uit onze samenleving ondervertegenwoordigd. Zo zijn er opvallend weinig vrouwelijke stemmen te bespeuren die spreken met een Vlaams accent.
Generatieve AI heeft de manier waarop we muziek maken compleet veranderd. Nieuwe modellen kunnen nu niet alleen instrumentale stukken produceren, maar ook volledige nummers met zang. Kortom, binnen een minuut maak je al een indrukwekkend nummer, maar je mist wel het plezier van een instrument bespelen en melodieën uitproberen.
Probeer het zelf uit. Zoek een gratis proefversie van een AI-muziekgenerator en maak een nummer dat je herinnert aan een vrolijk moment of helpt om dat ene, moeilijke begrip te onthouden. Je kan hiervoor de onderstaande prompt gebruiken of zelf een prompt schrijven.
Genereer een poplied met een opgewekte melodie en een refrein dat wordt gezongen. Het thema van het nummer is vriendschap.
Inspiratie nodig? Beluister de onderstaande nummers. Het Engelse nummer werd automatisch gegenereerd op basis van een eenvoudige prompt. Het tweede nummer gebruikt een bestaande tekst.
Met speech-to-speech-technologie kan je in realtime gesprekken omzetten naar een andere taal of stem. Het behoudt daarbij de intonatie, emotie en nuance van de spreker, waardoor het gesprek natuurlijker klinkt en menselijk aanvoelt. De technologie is ideaal voor live vertalingen, slimme stemassistenten die moeiteloos met gebruikers communiceren en nog zoveel meer.
Bekijk deze demo van OpenAI waarin een gebruiker spreekt tegen GPT-4o. Hij vraagt het LLM om te tellen, eerst sneller, dan met een gemiddelde snelheid, dan langzamer. Het model werkt in dit voorbeeld volledig met speech-to-speech-technologie.
Om de beste ervaringen te bieden, gebruiken wij technologieën zoals cookies om informatie over je apparaat op te slaan en/of te raadplegen. Door in te stemmen met deze technologieën kunnen wij gegevens zoals surfgedrag of unieke ID's op deze website verwerken. Als je geen toestemming geeft of uw toestemming intrekt, kan dit een nadelige invloed hebben op bepaalde functies en mogelijkheden.