Tal, musik och hörsel

Från Wikipedia

Tal, musik och hörsel (TMH) är en forskningsenhet vid KTH. TMH:s forskning kretsar kring alla former av mänskligt tal och kring talteknologi, och med över 60 år på nacken är det Sveriges äldsta forskningsenhet i sitt slag. Enheten är tvärvetenskaplig och bland de forskare som haft sin hemvist här finner man förutom ingenjörer och datavetare bland annat lingvister, fonetiker, kognitionsvetare, och psykologer[1].

Historia[redigera | redigera wikitext]

TMH grundades (då under namnet Taltransmissionslaboratoriet) 1951 av Gunnar Fant, som gick i bräschen för tidens internationella talforskning[2]. Den är sedan grundandet belägen på KTH:s Campus Vallhallavägen, där den inledningsvis var inhyst på Lindstedtsvägen 3 och senare på Drottning Kristinas väg 31. 2004 flyttades den till Lindstedtsvägen 24 på Campus Vallhallavägens övre borggård i samband med att Försvarshögskolan tog över huset på Drottning Kristinas väg.

Enheten har en stark tradition av att kultivera forskare. Efter Gunnar Fant själv följde Johan Sundberg, Björn Lindblom och Sven Öhman, som alla tre gick vidare till den absoluta internationella framkanten av sina områden (Johan Sundberg är än idag en högst aktiv kraft på TMH). Sedan dess har enheten producerat ytterligare ca 70 doktorer. Enheten är dessutom en attraktiv miljö för namnkunniga gästforskare, och ett stort antal av områdets storheter har tillbringat tid här, till exempel Julia Hirschberg, som under sin vistelse blev hedersdoktor på KTH[3].

Forskning[redigera | redigera wikitext]

Forskningsinriktningen var inledningsvis fokuserad på talproduktion och syntetiskt tal[4]. På 1950-talet var Orator Verbis Electris (OVE I) en av de första talsynteserna i världen[5] och under 1960-talet låg talsyntesen Orator Verbis Electris (OVE II) i täten när det gällde naturtrogen talsyntes[6][7].

Med tiden har forskningsområdet vidgats till att omfatta de flesta aspekter av tal och talad kommunikation. Till de mer framstående områdena hör:

  • multimodal interaktion, där hänsyn tas inte bara till talet utan även till andra fenomen som gester, blickar, ansiktsuttryck
  • interaktion mellan människor och avatarer eller robotar
  • situationerad interaktion, där omgivningen i vilken interaktionen äger rum tas med i beräkningen
  • tal- och samtalsstudier som går längre än vad som sägs, och dessutom tittar på hur det sägs

Enheten bedriver ungefär lika delar grundforskning och applikationsforskning. På det senare området undersöker man hur talanalys och talteknologi kan komma till nytta i en rad skilda områden utöver kommunikation, från vård och hälsa till tillverkning och verksamhetsstöd till utbildning och underhållning.

Referenser[redigera | redigera wikitext]

  1. ^ ”Division of Speech, Music and Hearing” (på brittisk engelska). KTH. https://www.kth.se/is/tmh/division-of-speech-music-and-hearing-1.780110. Läst 1 maj 2021. 
  2. ^ Ohala, John J.; Bruce, Gösta (2009-12-XX). ”In Memoriam: Ralph L. Vanderslice and Gunnar Fant” (på engelska). Journal of the International Phonetic Association 39 (3): sid. 387–389. doi:10.1017/S002510030999020X. ISSN 0025-1003. https://www.cambridge.org/core/product/identifier/S002510030999020X/type/journal_article. Läst 1 maj 2021. 
  3. ^ ”Hedersdoktorer vid KTH”. KTH. Arkiverad från originalet den 16 november 2020. https://web.archive.org/web/20201116181328/https://www.kth.se/aktuellt/akademiska-hogtider/fame/hedersdoktorer/hedersdoktorer-vid-kth-1.3974. Läst 1 maj 2021. 
  4. ^ Björn Lindblom, Johan Sundberg, Peter Branderud, Hassan Djamshidpey, Svante Granqvist (2010). ”The Gunnar Fant Legacy in the Study of Vocal Acoustics”. 10ème Congrès Français d'Acoustique. https://hal.archives-ouvertes.fr/hal-00539775/document. 
  5. ^ Tonini, Marco (23 juli 2008). ”Formant Synthesis Demo” (på engelska). Tertium Auris. https://marcotonini.wordpress.com/2008/07/23/formant-synthesis-demo/. Läst 1 maj 2021. 
  6. ^ ”NMAH | Smithsonian Speech Synthesis History Project (ss_rit.htm)”. amhistory.si.edu. https://amhistory.si.edu/archives/speechsynthesis/ss_rit.htm. Läst 1 maj 2021. 
  7. ^ ”"Klatt Record" Audio Examples”. www.festvox.org. http://www.festvox.org/history/klatt.html. Läst 1 maj 2021.