Språkteknologi
Språkteknologi, datalingvistik eller datorlingvistik, är ett tvärvetenskapligt forskningsområde som omfattar all utveckling av datorprogram för att analysera och generera mänskligt språk, till exempel svenska eller engelska, och även modellering och simulering av mänskligt språkligt beteende med hjälp av datorer. Språkteknologi bygger till exempel på kunskaper inom datavetenskap, lingvistik, artificiell intelligens och kognitiv psykologi.
Språkteknologi är fortfarande främst ett forskningsämne, men utvecklingen går snabbt fram och tillämpningarna blir fler och fler. Exempel på tillämpningar är:
- grammatikkontroll/rättstavningshjälp i ordbehandlingsprogram (till exempel Word)
- automatiska talsvarssystem (till exempel biljettbokning hos SJ)
- automatisk översättning mellan två språk
- sökmotorer
- innehållsbaserad klassificering (engelska: content based classification) , det vill säga från en given text klassificera vilka ämnesområden den handlar om
- textsummering, framtagning av korta sammanfattningar som anger vad en längre text handlar om
- programvaruutveckling, spårbarhetsverktyg mellan mjukvaruartefakter som krav- och testdokumentation, källkod och defektrapporter. Duplikatanalys av defekter.
- Textanalys, t.ex. genreklassifiering, läsbarhetsmått, författaridentifiering m.m.
På senare år har ämnet influerats starkt av statistiska metoder och maskininlärning. Intresset för multimodal kommunikation där till exempel tal samverkar med gester, symboler och textuell information har också ökat.
Vanliga komponenter [redigera]
- Analys / syntes av tal
- Morfologisk analys
- Ordklassmärkning
- Syntaktisk analys
- Tolkning av mångtydiga ord (word sense disambiguation)
Externa länkar [redigera]
- Språkteknologi.se - nationellt centrum för svensk språkteknologi med populärvetenskapliga artiklar om språkteknologi och dess delområden
- Språkteknologi för samiska
- Centre for Language Technology, Göteborgs universitet
- Språkbanken
- Uppsala universitets sida om språkteknologi
- GATE - a General Architecture for Text Engineering
- CrossCheck svensk grammatikkontroll för andraspråksskribenter
- Euroling AB - SiteSeeker-sökmotorn
- Connexor Oy
- Lingsoft
- Tricom Solutions
- SpeechCom Systemutveckling
- Adeptic Technologies AB - Fritextsökning med feltolerans
- Hapax