Robotstem programmeren
Terug: Week 3
http://www.oddcast.com/home/demos/tts/tts_example.php?sitepal
Dit is een website waarbij je een robotstem al een aantal functies kunt geven. We twijfelen nu om dit te gebruiken in plaats van het zelf te programmeren aangezien dat makkelijk is. Het enige probleem is dat we nog niet weten of we meerdere functies tegelijkertijd kunnen toepassen. We kunnen dit programma online gebruiken maar dan kunnen we maar 1 functie toepassen. Er is een trail versie die je kunt downloaden voor 15 dagen maar daarvoor heb je een creditcard nodig en die hebben wij allemaal niet.
https://acapela-box.com/AcaBox/index.php
Deze website heeft een bepaalde stem die we wel kunnen gebruiken. Namelijk English (US) - Will. Deze stem heeft daarnaast ook nog de functie om hem blij of verdrietig de tekst uit te laten spreken. Dit zouden we dus heel goed kunnen gebruiken zonder het zelf te hoeven programmeren. Helaas kost het hier ook geld om te bestanden op te slaan (€5 maar).
De volgende drie matlab scriptjes hebben we gemaakt. De recorder neemt een stem op vanuit een TTS en roept magPlot en timePlot aan. magPlot creëert het frequentie plot en timePlot creëert het tijdplot.
In het online programma kunnen we het volgende aanpassen:
- Duration (Bij verdriet worden zinnen langzamer uitgesproken dan bij blijdschap, dit komt door langere pauzes en langzamere uitspraak. (Emotions and speech: some acoustic correlates) Bij blijdschap worden vooral woorden met één lettergreep erg versneld. Bij verdriet worden langere woorden 20% langzamer en korte woorden 10-20% langzamer.
(Emotions in the voice - humanising a robotic voice))
Om de snelheid van woorden afzonderlijk aan te passen gebruiken we Audacity. Dit is mogelijk door een specifiek stukje audio te selecteren en dan op effecten te klikken. Daar staat 'tempo wijzigen' tussen en de snelheid van het woord kan dan aangepast worden zonder dat de toonhoogte mee verandert.
- Gemiddelde fundamentele frequentie (toonhoogte)
Wat we daarna nog aan willen passen om het te verbeteren:
- Amplitude
Uit de bron blijkt dat bij dat onderzoek blijheid een gemiddeld geluidsniveau van 100 dB had en verdrietigheid een niveau van 90 dB. We concluderen dat de stemmen zo optimaal mogelijk worden als de twee emoties qua intensiteit 10 dB uit elkaar liggen.
- Lengte van de pauzes (verdrietig); Bij verdriet zijn rusten tussen woorden gemiddeld langer dan bij de andere emoties.
De lengte van pauzes kunnen ook in Audacity worden aangepast via effecten.