Skip to main content

Hva er talegjenkjenning?

Talegjenkjenning vs. transkribering. Hva er raskest? (Kan 2024)

Talegjenkjenning vs. transkribering. Hva er raskest? (Kan 2024)
Anonim

Talegenkjenning er en teknologi som tillater talte innspill i systemer. Du snakker med datamaskinen, telefonen eller enheten, og den bruker det du sa som input for å utløse en handling. Teknologien brukes til å erstatte andre metoder for inngang som å skrive, klikke eller velge på andre måter. Det er et middel til å gjøre enheter og programvare mer brukervennlige og for å øke produktiviteten.

Det er mange applikasjoner og områder der talegjenkjenning brukes, inkludert militæret, som hjelpemiddel for personer med nedsatt funksjonsevne (forestille seg en person med krøllete eller ingen hender eller fingre), på det medisinske feltet, i robotikk etc. I nær fremtid, nesten alle vil bli utsatt for talegjenkjenning på grunn av utbredelsen blant vanlige enheter som datamaskiner og mobiltelefoner.

Enkelte smarttelefoner gjør interessant bruk av talegjenkjenning. IPhone- og Android-enhetene er eksempler på det. Gjennom dem kan du starte en samtale til en kontakt ved å bare få talte instruksjoner som "Call office." Andre kommandoer kan også bli underholdt, som "Slå på Bluetooth."

Problemer med talegjenkjenning

Talegenkjenning, i sin versjon som kalles tale til tekst (STT), har også lenge vært brukt til å oversette talte ord til tekst. «Du snakker, den typen», som ViaVoice ville si på boksen sin. Men det er ett problem med STT som vi kjenner det. ViaVoice er en av de beste i bransjen, så forestill deg resten. Teknologien er modnet og forbedret, men tale til tekst gjør at folk stiller spørsmål. En av sine største vanskeligheter er de enorme variasjonene mellom mennesker som uttaler ord.

Ikke alle språk er ment for talegjenkjennelse, og de som gjør ofte støttes ikke så godt som engelsk. Som et resultat utfører de fleste enheter som kjører talegjenkjenningssoftware, bare rimelig på engelsk.

Et sett med maskinvarekrav gjør det vanskelig å distribuere talegjenkjenning i visse tilfeller. Du trenger en mikrofon som er intelligent nok til å filtrere bort bakgrunnsstøy, men samtidig kraftig nok til å fange stemme naturlig.

Når det gjelder bakgrunnsstøy, kan det føre til at et helt system mislykkes. Som et resultat, mislykkes talegjenkjenning i mange tilfeller på grunn av støy som er utenfor brukerens kontroll.

Taleegenkjenning viser seg å være bedre som en inngangsmetode for nye telefoner og kommunikasjonsteknologier som VoIP, enn som et produktivitetsverktøy for masseinntekter.

Søknader om talegjenkjenning

Teknologien er stadig mer populær på mange områder, og har lykkes i følgende:

  • Enhetskontroll. Bare å si "OK Google" til en Android-telefon brenner opp et system som er helt ører til dine talekommandoer.
  • Bil Bluetooth-systemer. Mange biler er utstyrt med et system som kobler radiomekanismen til smarttelefonen din via Bluetooth. Du kan da ringe og motta samtaler uten å berøre smarttelefonen, og kan til og med ringe numre ved å bare si dem.
  • Stemme transkripsjon. I områder der folk må skrive mye, fanger noen intelligent programvare sine talte ord og transkriberer dem til tekst. Dette er aktuelt i visse tekstbehandlingsprogrammer. Stemme transkripsjon fungerer også med visuell talepost.