Week 3

From Control Systems Technology Group
Revision as of 14:59, 16 October 2014 by S121223 (talk | contribs)
Jump to navigation Jump to search

Terug: PRE_Groep2


Robotstem programmeren

Kennis toepassen op onze zinnen

De zinnen die in de enquête worden gebruikt zijn de volgende 7 schuingedrukte zinnen.

  • 0. Hello I am Will! Thank you for joining. Let's see how your typical shower goes.


Do you take a shower every day? (yes/no)

  • 1. Yes: (Sad) It is such a shame that you choose to behave in this way.
  • 2. No: (Happy) Yes, that is the way to go!


On the average, do you shower longer than ten minutes? (yes/no)

  • 3. Yes: (Sad) You let me down. Please change your behavior.
  • 4. No: (Happy) That is what I would like to hear!


Do you turn off the shower when you are using shampoo or soap? (yes/no)

  • 5. No: (Sad) I am disappointed that you waste so much water.
  • 6. Yes: (Happy) That is fantastic. Keep up the good work!


Zin 1:

Duration:

Zin 1 heeft 14 lettergrepen. Uitgaande van 1.91 lettergrepen per seconde, zou het fragment rond de 7.3 seconden moeten duren. Het onderzoek dat dit zegt is daarentegen maar met drie mensen uitgevoerd. De resultaten zijn dus niet extreem betrouwbaar. (Emotions and Speech: some acoustic correlates.) Wij vinden persoonlijk dat 1.91 lettergrepen per seconde veel te langzaam is voor onze zin. Per zin is het natuurlijk ook verschillende, doordat spreeksnelheid ook afhangt van de lengte van alle woorden. Mede door de lage betrouwbaarheid van de bron en het feit dat wij een andere zin gebruiken, verhogen wij de snelheid naar 2.5 lettergrepen/sec. Dit komt overeen met -5 voor speech rate in acapelabox.

De langere woorden 'shame' en 'behave' hebben we relatief langzamer laten uitspreken dan de andere (korte) woorden. We hebben hiervoor 'shame' en 'behave' verlangzaamd (17%) en een aantal andere woorden versneld, omdat anders het totaal te langzaam werd. De woorden die versneld zijn, zijn; 'that you choose' (10%) en 'in this way'.


Gemiddelde toonhoogte (F0):

We hebben de waarde op -5 gezet in acapelabox.


Amplitude:

Verdriet is volgens onderzoek iets zachter dan neutraal, maar met het oogpunt op het feit dat het anders zo zou kunnen zijn dat participanten hun geluid zachter zetten na een blije stem (die 10 dB harder is) en vervolgens de verdrietige stem niet goed meer kunnen verstaan, hebben we de verdrietige stem net zo hard gemaakt als de neutrale stem.


Pitch variaties:

Uit de grafiekjes van (Prosody and speak state: paralinguistics, prgmatics, and proficiency) blijkt dat er vlak na het begin een kleine frequentieverhoging te horen is. Deze hebben we toegepast op 'shame'. De hoogte is met 5% toegenomen.


Zin 2:

Duration:

Zin 2 heeft 7 lettergrepen. De spreeksnelheid die uit onze bronnen blijkt ligt rond de 4.15 lettergrepen per seconde.(Emotions and Speech: some acoustic correlates.) (Emotions and speech: some acoustic correlates). We zetten de speech rate op +15. De snelheid komt dan neer op 3.5 lettergrepen per seconde.

Audacity: We willen meer nadruk leggen op 'that' en daarvoor moet we het tempo van dit woord verlagen en het woord dus verlengen. Verder passen we niets aan aan het tempo aangezien alle woorden 1 lettergreep hebben en het verschil verder dus niet uitmaakt.


Gemiddelde toonhoogte (F0):

We hebben de waarde op +5 gezet.


Amplitude:

We hebben de amplitde 7 dB hoger gezet dan die van de neutrale zin. De hoogste piek van de neutrale zin staat op -12 dB dus we hebben een nieuwe piekamplitude van -5 dB ingesteld voor zin 2 met blije emotie.

Zoals al genoemd willen we meer de nadruk leggen op 'that' dus hiervan hebben we amplitude nog wat hoger ingesteld door het gebruiken van de combinatietool. Daarnaast willen we minder nadruk lekker op 'way' dus verlagen wij hier de amplitude van.


Pitch variaties:

Er mag meer enthousiasme op de woorden 'Yes' en 'go'. Voor het woord 'Yes' hebben we de frequentie met 10% verhoogd. De frequentie van het woord 'go' is met 8% verhoogd.


Zin 3:

Duration:

Zin 3 heeft 11 lettergrepen. We zetten deze ook weer op -5. De snelheid van deze zin komt dan neer op 2.2 lettergrepen per seconde.

De woorden 'please' en 'behavior' zijn de langste woorden. Daarnaast klinkt het voor ons idee ook het natuurlijkste om deze het langer te maken. Beide woorden hebben we met 15% verlengd. 'Change' hebben we met 25% verkort omdat acapelabox het woord om een bepaalde reden erg langzaam uitspreekt. Daarnaast hebben we 'ange' nog eens 10% extra verkort.' 'Down' hebben 15% vertraagd.

'Let me' klonk erg snel achter elkaar, dus daar tussenin hebben we de spatie 50% verlengd. Daarnaast is 'let me' in z'n geheel nog met 20% verlengd.

Gemiddelde toonhoogte (F0):

We hebben de waarde op -5 gezet.


Amplitude:

De hardheid van de stem hebben we weer aangepast aan de neutrale zin, net als bij zin 1, om te voorkomen dat de zin onhoorbaar wordt.

Het begin van 'down' klinkt harder om het woord enigszins te benadrukken. Dit omdat wij hoorden dat wij het ook zo uitspreken wanneer we de zin zelf reproduceren.


Pitch variaties:

'Down' hebben we 5% verlaagd, om het einde van de eerste zin omlaag te laten gaan. Dit is een kenmerk voor verdriet. (Emotive Qualities in Robot Speech). De toonhoogte van 'let' hebben we 5% verhoogd zodat het karakteristieke golfje in frequentieverandering voor verdriet hoorbaar is. (Emotions and Speech: some acoustic correlates).

Ditzelfde principe hebben we toegepast op de tweede zin. 'Please' is verhoogd met 5% en 'havior' is verlaagd met 3%.


Zin 4:

Duration:

Zin 4 heeft 8 lettergrepen. Speech rate wordt ingesteld op +15. Snelheid komt dan neer op 4 lettergrepen per seconde.


Gemiddelde toonhoogte (F0):

We hebben de waarde op +5 gezet.

De lengte van het woord 'hear' hebben we met 25% verlengd, oftewel de spreeksnelheid 25% langzamer gezet.


Amplitude:

We hebben de blije versie van deze zin 7 dB harder gemaakt dan de neutrale versie van deze zin. De amplitude is nu veranderd van -12 naar -5.

We hebben de amplitude van 'what' en 'like' verlaagd, omdat de stem erg hakkelig sprak. Hierdoor wordt niet elk woord afzonderlijk even hard benadrukt en klinkt het dus vloeiender.

Voor 'hear' hebben we de amplitude verhoogd.


Pitch variaties:

Het woord 'hear' hebben we met 5% verhoogd in toonhoogte.


Zin 5:

Duration:

Zin 5 heeft 13 lettergrepen. We zetten de instellingen voor deze zin ook weer op -5. De snelheid van deze zin komt neer op 2.9 lettergrepen per seconde.

De lange woorden in deze zin zijn 'disappointed' en 'water'. Om de zin in het algemeen niet te langzaam te maken, versnellen we de korte woorden ipv vertragen van de langzame woorden.

'I am' en 'that you' hebben we met 15% versneld.

'Pointed' uit disappointed en 'water' zijn verlengd met 15%. Daarnaast is 'ter' uit water nog eens met 10% verlengd.


Gemiddelde toonhoogte (F0):

We hebben de waarde op -5 gezet.


Amplitude:

De maximale amplitude hebben we gelijkgetrokken met die van de neutrale zin.

De amplitude van 'dissapointed' is verhoogd. Geleidelijk wordt het woord weer zachter zodat het volume in de zin geen sprongen maakt.


Pitch variatie:

'am' is 5% verhoogd om de frequentie contour uit de grafiek van (Emotions and Speech: some acoustic correlates) te volgen.

'Ter' uit water hebben we met 5% verlaagd, om de zin lager af te laten lopen.


Zin 6:

Duration:

Zin 6 heeft 10 lettergrepen. We zetten de speech rate weer op +15. De snelheid komt dan neer op 3.3 lettergrepen per seconde.

In deze zin zit maar één woord met meerdere lettergrepen. Uit de literatuur weten we dat bij blijheid woorden met één lettergreep gemiddeld sneller worden gesproken. Aangezien alle andere woorden in deze zin één lettergreep bevatten, hebben we deze woorden niet allemaal versneld, maar we hebben 'fantastic' langzamer gemaakt. We hebben zelf beoordeeld hoeveel langzamer het woord het beste klinkt. Naast het hele woord hebben we 'ta' apart ook met 25% opgerekt om het gehele woord extra nadruk te geven.


Gemiddelde toonhoogte (F0):

We hebben de waarde op +5 gezet.


Amplitude:

De amplitude wordt weer 7 dB harder gezet vergeleken met de neutrale versie van deze zin. Dus de max. amplitude stijgt van -12 naar -5 dB.

'tas' uit 'fantastic' hebben we harder gemaakt.

De amplitude van 'good' hebben we verhoogd.


Pitch variaties:

De woorden 'fantastic', 'good' en 'work' hebben we met 5% verhoogd.


Bronnen persuasiveness

Om ons onderzoek op te stellen, zijn we eerst op zoek gegaan naar bronnen over persuasiveness. Dit om een beter idee te krijgen of een gebruiker beïnvloedt kan worden door spraak en emotie, zodat we een hypothese op kunnen stellen. Daarnaast zijn we op zoek gegaan naar vragenlijsten of andere methoden die gebruikt zijn in dit soort onderzoeken, om (deels) te gebruiken in ons eigen onderzoek.

"Creating More Credible and Persuasive Recommender Systems: The Influence of Source Characteristics on Recommender System Evaluations (2011)"

Yoo, K. H., & Gretzel, U. (2011). Creating more credible and persuasive recommender systems: The influence of source characteristics on recommender system evaluations. In Recommender systems handbook (pp. 455-477). Springer US.

"Recent research regarding the persuasiveness of technology suggests that technologies can be more credible and persuasive when leveraging social aspects that elicit social responses from their human users [88, 36]."

"Wang and Benbasat [134], for instance, found that users not only perceive recommender systems as having human characteristics and, consequently, treat systems as social actors, but that such social perceptions influence system evaluations."

Om te overtuigen is het belangrijk dat diegenen geloofwaardig is. Geloofwaardigheid wordt bepaald door vertrouwen en expertise. De perceptie bij human-human interactie hiervan wordt beïnvloedt door verschillende kenmerken: - Similarity: over de precieze invloed zijn onderzoekers het echter oneens.

- Likeability: vertrouwen wordt verhoogd.

- Symbolen van autoriteit: komt geloofwaardiger over.

- Spreekstijl: snelheid kan de geloofwaardigheid beïnvloeden, maar hier is geen duidelijkheid over.

- Aantrekkelijkheid: aantrekkelijkere personen zijn geloofwaardiger (heeft samenhang met likeability)

- Humor: hangt af van de context of dit bijdraagt aan geloofwaardigheid. Het draagt vooral bij aan vertrouwen en niet aan expertise.

"Media equation theory suggests that individuals’ interactions with computers, television sets, and new media are fundamentally social and natural, just like interactions in real life"

"Nass et al. [93] illustrated that people apply gender and ethnicity stereotypes to computers. Specifically, their study found that people evaluated the tutor computer as significantly more competent and likeable when it was equipped with a male voice than a female voice. They also found that the female-voiced computer was perceived as a better teacher of love and relationships and a worse teacher of computing than a male-voiced computer, even though they performed identically."

"Human voice is a very strong social cue that has been found to profoundly shape human-technology interactions [88]. However, findings in the context of embodied interface agents are not widely available and are currently inconclusive. The voice output of interface agents was found to be helpful in inducing social and affective responses from users in some studies [106, 82] but other studies found that sociability is higher when the system avatar only communicated with text [124]."

"What Makes Social Feedback from a Robot Work? Disentangling the Effect of Speech, Physical Appearance and Evaluation (2010)"

Vossen, S., Ham, J., & Midden, C. (2010). What makes social feedback from a robot work? disentangling the effect of speech, physical appearance and evaluation. In Persuasive technology (pp. 52-57). Springer Berlin Heidelberg.

Spraak en uiterlijk van de robot zijn twee onafhankelijke variabelen die van invloed kunnen zijn op persuasiveness. Als een van deze twee variabelen aanwezig is, is het dus al genoeg om gebruikers meer te overtuigen.


Opzet onderzoek

Questionnaire before the shower simulation:

Wij, Meike Berkhoff, Iris Huijben, Floor Fasen en Suzanne Vugs, zijn vier studenten aan de universiteit in Eindhoven. We doen een onderzoek voor een vak dat we dit kwartiel volgen.

Wij stellen het zeer op prijs dat u deel wilt nemen aan dit onderzoek. Als eerste zult u een enquête invullen. Het invullen van deze vragenlijst zal ongeveer 5 minuten duren. Deze vragenlijst is volledig anoniem en uw antwoorden zullen vertrouwelijk behandeld worden. De antwoorden op deze vragenlijst zullen alleen worden gebruikt voor dit onderzoek en zullen daarna worden vernietigd.

Na deze enquête volgt een korte simulatie. Dit zal tevens hooguit 5 minuten duren. De simulatie en de vragen zullen in het Engels zijn. Wij willen u nogmaals bedanken voor uw medewerking en wij hopen u op deze manier voldoende te hebben geïnformeerd.


1. Hoe oud bent u?

…… jaar


2. Wat is uw geslacht?

o Man

o Vrouw


3. Wat is uw hoogst genoten opleiding?

o Basisschool

o MAVO

o HAVO

o VWO

o MBO

o HBO

o Universitair


4. Burgerlijke staat

o Gehuwd

o Ongehuwd

o Samenwonend


Voor de volgende vragen geeft u aan in hoeverre u het met de stelling eens bent. U kunt dit aangeven door te klikken in het gewenste vakje. Wanneer u uw antwoord wil wijzigen dan kunt u dit doen door een ander vakje aan te klikken. Zodra u de vraag heeft beantwoord, krijgt u de volgende vraag te zien. Het is dan niet meer mogelijk om het vorige antwoord aan te passen.

1: helemaal mee oneens

2: mee oneens

3: neutraal

4: mee eens

5: helemaal mee eens


Enquete vragen 5 tot en met 25.png


Questionnaire 'shower'

Introduction:

We have created a device to keep track of your behavior when you shower. In this way you get more inside in your water consumption. Please click on the button below to meet ‘Will’. He will give you feedback on your showering habits.

Will: Hello I am Will! Thank you for joining. Let’s see how your typical shower goes.


Do you take a shower every day? (yes/no)

• Yes: (Sad) It is such a shame that you choose to behave in this way.

Question 1a: After hearing the comment of Will I feel convinced to change my behavior. (The participant answers the question with the aid of a Likert Scale, varying from totally disagree to totally agree)

• No: (Happy) Yes, that is the way to go!

Question 1b: After hearing the comment of Will I feel motivated to continue my behavior. (The participant answers the question with the aid of a Likert Scale, varying from totally disagree to totally agree)


On the average, do you shower longer than ten minutes? (yes/no)

• Yes: (Sad) You let me down. Please change your behavior.

Question 2a: After hearing the comment of Will I feel convinced to change my behavior. (The participant answers the question with the aid of a Likert Scale, varying from totally disagree to totally agree)


• No: (Happy) That is what I would like to hear!

Question 2b: After hearing the comment of Will I feel motivated to continue my behavior.(The participant answers the question with the aid of a Likert Scale, varying from totally disagree to totally agree)


Do you turn off the shower when you are using shampoo or soap? (yes/no)

• No: (Sad) I am disappointed that you waste so much water.

Question 3a: After hearing the comment of Will I feel convinced to change my behavior. (The participant answers the question with the aid of a Likert Scale, varying from totally disagree to totally agree)


• Yes: (Happy) That is fantastic. Keep up the good work!

Question 3b: After hearing the comment of Will I feel motivated to continue my behavior. (The participant answers the question with the aid of a Likert Scale, varying from totally disagree to totally agree)


Explanation at the end of the questionnaire:

Thank you for using our device! We will give you a short recap of what Will wanted to teach you: It is not necessary for your hygiene to take a shower every day. It is actually bad for the condition of your skin as it dehydrates it. Besides that it is bad for the environment and for your wallet. Most of the time taking a ten minute shower is more than enough. There are exceptions of course for example when you need to shave yourself under the shower or when you are using a conditioner. Nevertheless we tend to stay under the shower longer than necessary. Mostly when it is cold outside and a warm shower feels too nice or when a shower is a nice way to wake up in the morning. Finally, keeping your shower running while you are using shampoo or soap is a massive waste of water. Most people even turn the showerhead sideways so it does not wash away the soap too soon. We cannot emphasize enough that it is bad for the environment and as well for your wallet.


This is the end of the questionnaire. Thank you very much for your participation!

Overview of the simulation:


SimulatieShower.png

Mogelijkheden online enquête

Voor ons onderzoek willen we een online enquête af laten nemen. Hierin zullen vooral meerkeuzevragen en vragen met een schaal gesteld worden. Ook willen we de geluidsfragmenten van de robotstem in de enquête verwerken, dus het moet mogelijk zijn om deze in de enquête te implementeren. Met deze eisen zijn we op zoek gegaan naar een website waarbij we deze online enquête kunnen creëren. De mogelijkheden die we hebben bekeken zijn:

  • Google docs/drive:

Dit was onze eerste keus. Probleem is echter dat we geen geluidsfragmenten toe kunnen voegen, alleen foto's of video's. We zouden eventueel een video toe kunnen voegen, maar dit moet per se een YouTube video zijn en dan moeten we dus bedenken wat we als beeld gaan doen (gewoon zwart, of een stilstaande afbeelding?)

  • Survey Monkey:

Geluidsfragmenten kunnen niet worden toegevoegd. Het toevoegen van afbeeldingen en video's is wel mogelijk. Video's kunnen alleen via YouTube of Vimeo toegevoegd worden.

  • ThesisTools:

Toevoegen van geluidsfragmenten is niet mogelijk.

  • Enquetemaken.nu:

Geen afbeeldingen en video's toe te voegen, alleen als je extra betaalt.

  • NetQ:

Gratis trial van 30 dagen. Bij deze enquête kunnen wel geluidsfragmenten worden toegevoegd! Het programma spreekt niet echt voor zich, dus beter uitzoeken hoe het werkt. Nadeel is wel dat er maar een maximum van 100 participanten gevraagd kan worden.


Meeting donderdag 18-09-2014

Floor en Iris hebben gewerkt aan de robotstem en kunnen daar na vandaag aan verder gaan als ze weten welke zinnen er geprogrammeerd moeten worden. Meike heeft bronnen gezocht met vergelijkbare onderzoeken om te kijken hoe we het beste onze survey kunnen maken. Suzanne heeft alvast een idee bedacht voor welke vragen we kunnen stellen.


De vraag is of we between of within-design willen doen.

Within: Het idee wat nu naar boven is gekomen is dat we 2 verschillende situaties gaan schetsen (wasmachine en douchen). Het kan zijn dat het overtuigen voor een wasmachine heel veel verschilt van het overtuigen voor het douchen. Maar aan de andere kant; als je dezelfde vragen dubbel stelt met verschil in emotie dan is het misschien al snel duidelijk waar het onderzoek over gaat.

Between: Hiervoor moeten we heel veel participanten hebben en we weten niet of dat mogelijk is. Daarnaast weten we ook niet precies hoeveel participanten we nodig zouden hebben om een hoger power te hebben omdat we geen waardes hebben voor 'effect size'. Het nadeel is ook dat het een redelijk persoonlijke kwestie is dus als iemand sowieso al veel milieubewuster is bij beide experimenten al snel overtuigd wordt. Het voordeel is dat mensen de robotstem-verschillen niet kunnen vergelijken dus deze bias er in ieder geval niet is.


We kiezen voor between en gaan ervoor zorgen dat er 100 participanten de survey invullen. We kijken of het mogelijk is dat google docs zelf kan regelen dat de helft van de mensen in conditie 1 worden ingedeeld en de andere helft in conditie 2. Als dit niet mogelijk is zorgen we zelf ervoor dat de helft van de mensen de ene enquête krijgt en de andere helft van de mensen de andere enquête.


Nu gaan we door met het kijken naar welke vragen we precies willen gaan stellen en wat de robot precies moet zeggen. De survey gaan we in het Engels doen aangezien de robotstem die we gaan gebruiken Engels spreekt. Het blijkt dat het moeilijk is om zinnen te bedenken die al grammaticaal een emotionele waarde hebben. Als je de ik-persoon gebruikt in de zinnen kan de participant zich beter identificeren met de robot, maar dit is niet per se het doel van ons onderzoek. We kiezen er nu voor om meer gevoelswoorden toe te voegen en niet de ik-persoon te gebruiken. Dit zijn de uitgekomen zinnen die de robot uit moet gaan spreken:


Do you take a shower every day? (yes/no)

  • Yes: (Sad) It is such a shame that you choose to behave in this way.
  • No: (Happy) Yes, that is the way to go!


On the average, do you shower longer than ten minutes? (yes/no)

  • Yes: (Sad) You let me down. Please change your behavior.
  • No: (Happy) That is what I would like to hear!


Do you turn off the shower when you are using shampoo or soap? (yes/no)

  • No: (Sad) I am disappointed that you waste so much water.
  • Yes: (Happy) That is fantastic. Keep up the good work!


Daarnaast hebben we er over nagedacht wat onze hypothese is. De NULL-hypothese hebben we in ieder geval al bedacht en deze luidt: "Het toevoegen van emotie in de spraak op een grammaticaal emotionele zin heeft geen versterkend effect."


Persoonlijke feedback week 3

Iedereen:

  • Top: De samenwerking verloopt goed.
  • Top: We lopen goed op schema.

Meike:

  • Top: Fijn dat je dit weekend veel aan de enquête hebt gewerkt.
  • Tip: Je mag je mening wat meer uitspreken.
  • Zelfreflectie: Ik heb het deze week erg druk dus dat geef ik alvast aan.
  • Tip: Probeer in te zien wanneer commentaar genoeg is geweest, niet iedereen hoeft er iets van te zeggen.

Floor:

  • Top: Fijn dat je zo actief meedoet.
  • Zelfreflectie: Ik moet me minder druk maken als iets een keer niet precies af komt zoals ik had gehoopt.
  • Tip: Probeer in te zien wanneer commentaar genoeg is geweest, niet iedereen hoeft er iets van te zeggen.

Suzanne:

  • Top: Fijn dat je dit weekend veel aan de enquête hebt gewerkt.
  • Tip: Probeer je te bedenken hoe je je naar andere mensen uit en hoe dat overkomt.

Iris:

  • Top: Je bent goed gemotiveerd en motiveert daarmee ook anderen.
  • Tip: Probeer in te zien wanneer commentaar genoeg is geweest, niet iedereen hoeft er iets van te zeggen.
  • Zelfreflectie: Voor mij is het een puntje om aan te werken om objectiever te kijken naar hoe lang iedereen geconcentreerd kan blijven. Soms is het beter om te stoppen en een andere keer verder te werken.