Robotstem programmeren: Difference between revisions

From Control Systems Technology Group
Jump to navigation Jump to search
No edit summary
No edit summary
Line 29: Line 29:


Om de snelheid van woorden afzonderlijk aan te passen gebruiken we Audacity. Dit is mogelijk door een specifiek stukje audio te selecteren en dan op effecten te klikken. Daar staat 'tempo wijzigen' tussen en de snelheid van het woord kan dan aangepast worden zonder dat de toonhoogte mee verandert.  
Om de snelheid van woorden afzonderlijk aan te passen gebruiken we Audacity. Dit is mogelijk door een specifiek stukje audio te selecteren en dan op effecten te klikken. Daar staat 'tempo wijzigen' tussen en de snelheid van het woord kan dan aangepast worden zonder dat de toonhoogte mee verandert.  
   
   
* '''Gemiddelde fundamentele frequentie (toonhoogte)'''
* '''Gemiddelde fundamentele frequentie (toonhoogte)'''

Revision as of 09:37, 16 September 2014

Terug: Week 3



http://www.oddcast.com/home/demos/tts/tts_example.php?sitepal

Dit is een website waarbij je een robotstem al een aantal functies kunt geven. We twijfelen nu om dit te gebruiken in plaats van het zelf te programmeren aangezien dat makkelijk is. Het enige probleem is dat we nog niet weten of we meerdere functies tegelijkertijd kunnen toepassen. We kunnen dit programma online gebruiken maar dan kunnen we maar 1 functie toepassen. Er is een trail versie die je kunt downloaden voor 15 dagen maar daarvoor heb je een creditcard nodig en die hebben wij allemaal niet.


https://acapela-box.com/AcaBox/index.php

Deze website heeft een bepaalde stem die we wel kunnen gebruiken. Namelijk English (US) - Will. Deze stem heeft daarnaast ook nog de functie om hem blij of verdrietig de tekst uit te laten spreken. Dit zouden we dus heel goed kunnen gebruiken zonder het zelf te hoeven programmeren. Helaas kost het hier ook geld om te bestanden op te slaan (€5 maar).

De volgende drie matlab scriptjes hebben we gemaakt. De recorder neemt een stem op vanuit een TTS en roept magPlot en timePlot aan. magPlot creëert het frequentie plot en timePlot creëert het tijdplot.


In het online programma kunnen we het volgende aanpassen:

  • Duration

Bij verdriet worden zinnen langzamer uitgesproken dan bij blijdschap, dit komt door langere pauzes en langzamere uitspraak. (Emotions and speech: some acoustic correlates) Volgens de bron spreekt een persoon gemiddeld 1.91 lettergrepen per seconde wanneer je verdrietig bent.

Bij blijdschap worden vooral woorden met één lettergreep erg versneld. Bij verdriet worden langere woorden 20% langzamer en korte woorden 10-20% langzamer. (Emotions in the voice - humanising a robotic voice))

Om de snelheid van woorden afzonderlijk aan te passen gebruiken we Audacity. Dit is mogelijk door een specifiek stukje audio te selecteren en dan op effecten te klikken. Daar staat 'tempo wijzigen' tussen en de snelheid van het woord kan dan aangepast worden zonder dat de toonhoogte mee verandert.

  • Gemiddelde fundamentele frequentie (toonhoogte)


Wat we daarna nog aan willen passen om het geluid te verbeteren:

  • Amplitude

Uit de bron blijkt dat bij dat onderzoek de maximale amplitude van het geluidsniveau bij blijheid rond de 100 dB ligt. Bij verdriet ligt deze waarde rond de 90 dB. We concluderen dat de piek waardes 10 dB uit elkaar moeten liggen om de stemmen zo optimaal mogelijk te laten klinken.


  • Lengte van de pauzes

Bij verdriet zijn rusten tussen woorden gemiddeld langer dan bij de andere emoties. De lengte van pauzes kunnen ook in Audacity worden aangepast via effecten. Ook blijkt dat wanneer je in Acapelabox een komma typt, dit systeem een langere pauze neemt. Dit maakt de intonatie van verdrietige zinnen vaak een stuk beter.