Hoe je met ElevenLabs een AI-stem kunt creëren die klinkt als die van jou

Generatieve AI en deepfakes zijn diep geïntegreerd om geavanceerde audiotools te ontwikkelen. Het idee is simpel: je neemt een geluid en manipuleert het zodat het model de woorden uitspreekt die je eraan geeft.

Spraakproductietechnologie wordt beschouwd als een van de meest prominente ontwikkelingen in de wereld van de moderne technologie, omdat het mogelijk is om met behulp van tekstprompts een kunstmatige stem te creëren die ongelooflijk veel lijkt op de menselijke stem. Een van de innovatieve tools en platforms waarmee u deze indrukwekkende prestatie kunt bereiken, is ElevenLabs, dat een gratis te gebruiken laag biedt naast enkele geweldige betaalde opties.

In dit artikel gaan we dieper in op het gebruik van spraaksynthesetechnologie met ElevenLabs en de voordelen die daarmee gepaard gaan. We bespreken de belangrijkste stappen voor het maken van audio die nuttig kan zijn in een verscheidenheid aan toepassingen, van audio en reclame tot AI en machine learning-toepassingen. Verifiëren Is meeslepende technologie een winst of verlies voor cyberbeveiliging?

Hoe u een AI-stem kunt creëren die klinkt als die van u met ElevenLabs - Kunstmatige Intelligentie

Wat is ElfLabs?

ElevenLabs is opgericht door een voormalig machine learning-ingenieur bij Google en een voormalig strateeg bij Palantir Technologies, een onderzoeksbureau voor stemtechnologie. Een spraakmodel is een belangrijk onderdeel van de strategie, maar het uiteindelijke doel is om een ​​tool te creëren die “gesproken audio onmiddellijk omzet tussen verschillende talen.”

ElevenLabs Voice AI is een op AI gebaseerd tekst-naar-spraakmodel dat een realistisch klinkende menselijke stem kan creëren. Op de website staat:

“Onze missie is om on-demand meertalige stemondersteuning werkelijkheid te maken in het onderwijs, streaming, audioboeken, games, films en zelfs realtime chat.”

Google Translate en zijn alternatieven zijn iets dat al waarde biedt, maar kunt u zich een tool voorstellen die wat u hoort onmiddellijk in gesproken vorm kan vertalen? Het reproduceren van de stem van de spreker, zodat u het gesprek hoort zoals hij of zij zegt, is een belangrijk uitgangspunt om dit te bereiken.

Wat is AI-geluidsgeneratie?

Simpel gezegd: AI-stemgeneratie stelt je in staat een stem vast te leggen en deze te laten zeggen wat je wilt dat hij hoort. Kies gewoon een stem en zorg voor de dialoog, en de aangepaste sjabloon doet de rest.

Je zou kunnen zeggen: “Nou, Microsoft Sam deed dat in de jaren XNUMX” en je zou volkomen gelijk hebben. Maar Microsoft Sam en soortgelijke tools leken op bots. Ondertussen lijkt de tool van ElevenLabs veel dichter bij de mens.

ElevenLabs biedt drie spraak-AI-opties: de volledig gratis “vooraf ingestelde” stemmen, de AI-stemgenerator (waarmee u geslacht, leeftijd en accent kunt kiezen) en “kloon”-stemmen die u alleen voor een abonnement kunt downloaden.

Hier is een voorbeeld:

Opmerking: Het gebruik van AI voor creatieve doeleinden brengt een aantal ethische en intellectuele eigendomsverantwoordelijkheden met zich mee, en het creëren van stemmen met de AI-spraaktool van ElevenLabs is niet anders. Kortom, gebruik niemands stem zonder hun toestemming. Hoewel dit niet illegaal is, kunnen ze er wel van streek door raken.

Voordat we verder gaan, onthoud dat op het moment van schrijven de spraak-AI-tool van ElevenLabs zich in de bètafase bevindt. Dit betekent dat het niet het eindproduct is. Verifiëren Ontdek spannende AI-projecten die kunnen worden uitgevoerd met een Raspberry Pi.

Creëer een basis-AI-dialoog

De eenvoudigste manier om aan de slag te gaan is door de gratis, AI-gestuurde spraaktool van ElevenLabs te gebruiken.

Om het te gebruiken, ga naar beta.elevenlabs.io En maak een account aan (u kunt uw e-mail, Google-account of Facebook gebruiken).

Dit zijn de volgende stappen:

  • Klik Spraaksynthese.
  • Selecteer een van de vooraf ingestelde stemmen in de instellingen (mannen- en vrouwenstemmen zijn beschikbaar).
  • Vouw de Geluidsinstellingen uit om de schuifregelaars Stabiliteit en Helderheid + Gelijkenis verbeteren in te stellen (hogere stabiliteit is meestal eentonig, hogere helderheid ligt dichter bij het beoogde geluid).

Hoe u een AI-stem kunt creëren die klinkt als die van u met ElevenLabs - Kunstmatige Intelligentie

  • Kiezen Elf eentalig (Standaard Engels).
  • Voer de tekst in die u naar spraak wilt converteren.
  • Klik opbouwen.

Hoe u een AI-stem kunt creëren die klinkt als die van u met ElevenLabs - Kunstmatige Intelligentie

  • Zodra het proces is voltooid, zou het geluid automatisch moeten spelen; Zo niet, klik dan تشغيل.

U kunt het gegenereerde voorbeeld ook downloaden.

Hoe u AI-stem kunt creëren met ElevenLabs

Als u liever een nieuwe stem maakt, kunt u de knop Stem toevoegen gebruiken om naar het VoiceLab-scherm te gaan. Een nieuw geluid creëren op basis van ElevenLabs-presets:

  • Klik Geluid toevoegen -> Geluidsontwerp.

Hoe u een AI-stem kunt creëren die klinkt als die van u met ElevenLabs - Kunstmatige Intelligentie

  • Stel de velden voor geslacht, leeftijd en dialect in.
  • Pas de schuifregelaar voor focussterkte naar wens aan.
  • Voer de tekst in die u wilt converteren.
  • Klik opbouwen.

Hoe u een AI-stem kunt creëren die klinkt als die van u met ElevenLabs - Kunstmatige Intelligentie

  • Als je klaar bent, luister dan.

Tijdens het testen ontdekte ik dat zowel de vrouwelijke/jonge/Australische als de mannelijke/oude/Australische accenten duidelijk ‘Amerikaans’ waren. Dit probleem zal waarschijnlijk worden opgelost naarmate de technologie verbetert.

Creëer je eigen AI-stem

Hoewel de vooraf ingestelde en configureerbare opties interessant zijn, is het echt opwindende element van de technologie van ElevenLabs de optie “Instant Voice Reproduction”.

In tegenstelling tot andere opties vereist Instant Voice Reproduction een abonnement. Er zijn verschillende opties beschikbaar, waarvan de goedkoopste $ 5 per maand is. Op het moment van schrijven komt dat met een korting van 80% voor de eerste maand, wat neerkomt op slechts $ XNUMX.

Andere opties kosten $ 22, $ 99 en $ 330 per maand, met de mogelijkheid om tot 40 uur aan audio per maand te genereren.

Om de stemtranscriptie van ElevenLabs te gebruiken, heb je wat dialoog en een voorbeeld van je stem nodig. Alles is mogelijk, zolang het maar duidelijk is en in mp3-formaat. Hoe langer het monster, hoe beter, tot 5 minuten.

Vanuit het VoiceLab-scherm:

  • Klik Audio toevoegen -> Instant audiotranscriptie.
  • Wijs in het resulterende venster een naam toe.
  • Klik of sleep het juiste bestand om het audiofragment te laden (er kunnen maximaal 25 samples worden toegevoegd om de nauwkeurigheid te verbeteren).
  • Klik op Labels en selecteer Sleutel + Waarde (bijvoorbeeld Accent/British) — doe dit maximaal vijf keer.

Hoe u een AI-stem kunt creëren die klinkt als die van u met ElevenLabs - Kunstmatige Intelligentie

  • Voer een korte beschrijving van de audio in.
  • Selecteer het selectievakje Toestemming bevestigen en voeg vervolgens een geluid toe.

Als er audio is toegevoegd, kunt u dit aanpassen in het scherm voor spraaksynthese, zoals hierboven vermeld. Verifiëren Evaluatie van het gebruik van geluidsreproductietechnologie bij het creëren van grootschalige inhoud.

Wat kun je doen met AI-stem?

AI Voice heeft veel vooraf ingestelde en gereproduceerde stemmen met veel mogelijkheden. Zoals eerder vermeld is het uiteindelijke doel van ElevenLabs live vertaling, maar er zijn nog veel meer toepassingen bekend.

Audioboeken (misschien voorgelezen door een lang geleden overleden filmster) worden genoemd, samen met videogames (het gebruik van een AI-stem zou geld besparen op stemacteurs). Maar het heeft ook toepassingen die verder gaan, van muziek tot satire tot zelfhulp, en misschien nog wel meer.

Je kunt ook een podcast maken met AI-audio, hoewel de resultaten misschien vlak en saai klinken.

De intro voor deze Very Helpful podcastaflevering is geproduceerd met ElevenLabs:

Hoewel de resultaten niet helemaal waren wat we hadden gehoopt, zijn ze goed genoeg om te gebruiken, en de technologie kan alleen maar beter worden.

Ondertussen is ElevenLabs van plan om de “Voice Chat”-functie op een later tijdstip uit te rollen.

veelgestelde vragen

Vraag 1: Wat is de technologie voor het vervaardigen van geluiden?

Spraaksynthesetechnologie is een technologie die gebruik maakt van kunstmatige intelligentie en geluidsverwerkingstechnieken om een ​​kunstmatige stem te creëren die lijkt op de menselijke stem. Het kan worden gebruikt in een verscheidenheid aan toepassingen, zoals audio-, reclame- en kunstmatige intelligentie-toepassingen.

Vraag 2: Wat is ElevenLabs en wat biedt het?

ElevenLabs is een geavanceerd platform gebaseerd op gedegen productietechnologieën. Het biedt gebruikers krachtige tools om een ​​synthetische stem te creëren die vergelijkbaar kan zijn met hun persoonlijke stem. ElevenLabs helpt je geluiden aan te passen en voor verschillende doeleinden te gebruiken.

Vraag 3: Hoe kan ik ElevenLabs gaan gebruiken?

U kunt eenvoudig aan de slag gaan door u te registreren op het ElevenLabs-platform en de eenvoudige en gebruiksvriendelijke interface te verkennen. U krijgt de mogelijkheid om uw eigen synthetische stem te creëren en aan te passen en deze in uw project te gebruiken.

Vraag 4: Zijn er speciale vereisten voor het gebruik van goede productietechnologie?

U hebt geen geavanceerde technische kennis nodig om ElevenLabs te gebruiken, maar het is wel handig om de basisconcepten over audioverwerking te begrijpen en basistechnologieën te gebruiken. De gebruikersinterface en instructies zijn gebruiksvriendelijk en helpen u op weg.

Vraag 5: Wat zijn enkele veelvoorkomende toepassingen van de geluidsproductietechnologie van ElevenLabs?

Populaire toepassingen zijn onder meer gepersonaliseerde audioadvertenties, gepersonaliseerde spraakdiensten en kunstmatige-intelligentietoepassingen die synthetische stemmen manipuleren. Met ElevenLabs kunnen geluiden worden aangepast zodat ze precies bij uw project passen.

Gebruik je stem op een nieuwe manier met AI van ElevenLabs

Kunstmatige intelligentie heeft ons de afgelopen jaren een aantal fantastische nieuwe hulpmiddelen gebracht. Chat-GPT kan worden gebruikt om tekst te genereren, vragen te beantwoorden, rapporten te plannen en meer. halverwege de reis Het is een geweldig model dat kunst genereert op basis van claims.

Nu maakt de Speech AI-tool van ElevenLabs het gemakkelijker om met stem te werken. Het is net als nabootsing, maar dan met een kopie van de originele audio.

Hoewel er ethische argumenten zijn tegen het gebruik van stemmen zonder toestemming, is dit een krachtig hulpmiddel met enkele interessante toepassingen. Het beste van alles is dat het verrassend eenvoudig te gebruiken is en verbluffende resultaten oplevert. Je kunt nu bekijken De beste AI-kunstgenerator om creatieve kunst van foto's te maken.

DzTech

Ik ben een staatsingenieur met uitgebreide ervaring op het gebied van programmeren, website maken, SEO en technisch schrijven. Ik ben gepassioneerd door technologie en wijd mij aan het verstrekken van kwaliteitsinformatie aan het publiek. Ik kan een waardevollere bron worden voor gebruikers die op zoek zijn naar nauwkeurige en betrouwbare informatie over productrecensies en gespecialiseerde toepassingen op verschillende gebieden. Mijn niet-aflatende toewijding aan kwaliteit en nauwkeurigheid zorgt ervoor dat de verstrekte informatie betrouwbaar en nuttig is voor het publiek. Het voortdurende streven naar kennis drijft mij om op de hoogte te blijven van de nieuwste technologische ontwikkelingen en ervoor te zorgen dat gedeelde ideeën op een duidelijke en toegankelijke manier worden overgebracht.
Ga naar de bovenste knop