Kontor

Sådan fungerer Skype-oversætteren

Indholdsfortegnelse:

Anonim

Science fiction er fuld af referencer til teknologisk avancerede enheder, hvis funktion, for at omskrive det mytiske udtryk, ikke kan skelnes fra magi. Som følge af deres forfatteres kreative sind er det svært at forestille sig, hvornår sådanne opfindelser kunne være i vores hænder, og vi ender med at acceptere, at deres eksistens ikke bliver en del af vores livscyklus. Men en gang imellem sniger en af ​​dem sig ind i vores liv for tidligt. Det er tilfældet med den re altidsoversættelse, som Microsoft og Skype er ved at gøre mulig

"Opgaven er alt andet end simpel.Det involverer Skypes evne til at videokonferencer, Microsoft Azures store netværk af cloud-servere, Microsoft Researchs teknologiske innovationer og de seneste fremskridt inden for flere områder såsom statistik og maskinlæring. Alt dette stillet til rådighed for dig, så snart du udtaler en sætning på dit sprog, genkender systemet, hvad du siger, oversætter det og sender det til din kontaktperson på et andet sprog. Hvordan er det muligt?"

Teknologien der gør det muligt

… . Skype Translator er resultatet af årtiers forskning i talegenkendelse, maskinoversættelse og maskinlæringsteknikker. På alle disse områder hviler driften af ​​et system, der ikke ville have været muligt uden de seneste fremskridt inden for dem.

Skype Translator er resultatet af årtiers forskning i talegenkendelse, maskinoversættelse og maskinlæringsteknikker.

Begynder med Talegenkendelse, en teknologi, der har været under undersøgelse i nogen tid, men hvis anvendelse altid har været påvirket af det store antal af fejl og overdreven følsomhed af eksisterende systemer. Et sekunds tvivl, små variationer i accenten eller et minimum af støj var nok til at forvirre computeren og få den til at forstå, hvad den ville. Sådan var det, indtil udviklingen af ​​'deep learning'-teknikker og skabelsen af ​​kunstige neurale netværk eksploderede, som Microsoft Research ved noget om. Takket være dem har det været muligt at reducere fejlprocenten betydeligt og forbedre pålideligheden og robustheden af ​​talegenkendelse, et nødvendigt første skridt for at Skype Translator kan fungere.

maskinoversættelse er den anden åbenlyse søjle, som Skype Translator hviler på. Her bruger Microsoft igen intern teknologi og bruger Bing-oversættelsesmotoren til at oversætte tekst fra et sprog til et andet.Hans system bruger en kombination af syntaksgenkendelsesteknikker og statistiske modeller til at forfine resultatet. Desuden er motoren ved denne lejlighed blevet specialuddannet til at genkende den type sprog, der forekommer i t alte samtaler, langt fra den korrekthed og pænhed, der norm alt antages på skrift. Således kombinerer Skype Translator-systemet Bing Translator's store sprogkundskabsbase sammen med et omfattende lag af ord og sætninger, der almindeligvis bruges i dagligdagssprog.

Men tale og sprog er kompliceret terræn. De ændrer sig konstant, de kommer i flere varianter og varianter, hver person har deres egen særlige stil osv. Skype Translator skal følge med alt dette, hvilket kræver konstant træning og optimering af både talegenkendelse og maskinoversættelse. For at gøre dette er systemet bygget på en robust 'machine learning' platform, en gren af ​​kunstig intelligens, der har til formål at udvikle teknikker, der tillader maskiner og algoritmer at lære ved at træne med eksempeldata.Brugen af ​​disse teknikker, der er almindelige inden for statistikområdet, gør det muligt for tjenesten at forbedre sig, efterhånden som den bruges, ved at udnytte de data, der genereres, når de bruges, til yderligere at forfine talegenkendelse og automatisk oversættelse.

Nogle af disse testdata genereres automatisk fra en lang række kilder, herunder sociale netværk såsom Facebook, oversatte websider, videoer med undertekster eller endda samtaler oprettet til formålet og transskriberet og oversat manuelt . Men en anden del af dataene kommer fra faktiske samtaler afholdt gennem tjenesten. Dette er vigtigt, fordi som Microsoft giver dig besked ved hvert opkald, bør du vide, at Skype Translator kan optage samtaler og holde dem anonyme, så de senere kan analyseres af dens algoritmer og introduceret i træningsprocessen af ​​deres statistiske modeller.

Skype Translator kan kun fungere korrekt, hvis den er i stand til at lære gennem en proces baseret på dens brug i rigtige menneskelige samtaler

"

Systemet kunne ikke fungere uden denne læreproces. Mens mennesker taler, holder vi pause og gentager ting, laver fejl og ændrer vores tankegang, mens vi introducerer ahs, ehms, uhms>kun at lære om dets faktiske brug kan gøre det bedre "

Fra et talesprog til et andet på få sekunder

Understøttet af alle disse fremskridt nøglen er, at Skype Translator er i stand til at udføre hele genkendelses- og oversættelsesprocessen hurtigt og gennemsigtigt for brugeren Hver gang vi taler, skal systemet genkende, hvad vi siger, oversætte det til modtagerens sprog og kommunikere det til ham på en måde, der forbliver tro mod det, vi oprindeligt forsøgte at kommunikere.Jo mindre vi bemærker de mellemliggende trin, jo bedre.

Så snart systemet registrerer, at vi taler, begynder det at optage, hvad vi siger, og starter talegenkendelsesprocessen Dette er ikke om ikke kun at genkende hvert ord, vi udtaler, men også at eliminere alt overflødigt, slette meningsløse udtryk og støj, opdage opdelingen af ​​teksten i sætninger, med inklusion af tegnsætningstegn og store bogstaver, og give den en kontekst det hjælper på din fortolkning. Når man tænker lidt over det, indser man, hvor svært det er at bestemme alt dette ud fra talesproget.

Skype Translator har brug for, at talegenkendelsen er så nøjagtig som muligt, fordi det følgende er forberedelse af den indsamlede information for at sammenligne den med de statistiske modeller, der er blevet forbedret gennem sit 'machine learning'-system.Her består processen i at finde ligheder mellem det, systemet har forstået, at vi sagde, og de ord og sammenhænge, ​​der er indeholdt i modellerne, for efterfølgende at anvende tidligere lærte transformationer, der vil konvertere lyden til tekst og oversætte den til fremmedsproget.

I det sidste trin har Skype forberedt et par bots, med kvindelige og mandlige stemmer, der fungerer som tolke i opkaldet Når en er valgt af brugeren, vil han være ansvarlig for at kommunikere vores oversatte besked til modtageren, så ikke kun de skrevne transskriptioner og oversættelser vises på skærmen, men han kan også høre dem højt, som om et tredje menneske var formidler mellem os.. Disse bots er i stand til hurtigt at kommunikere beskeden, så den, der lytter på den anden side af skærmen, modtager beskeden få sekunder efter, vi har udt alt den.

Testprogrammet som udgangspunkt

Netop tilstedeværelsen af ​​bots som tredjepartstalere i samtalen er en af ​​de detaljer, der stadig mangler at blive poleret. Microsoft erkender, at det er nemt for folk, der er vant til at tale gennem en tolk, at tilpasse sig dem, men for andre kræver det en læringsperiode. Og det er, at Microsoft og Skype kan være fast besluttet på at skabe den bedste oversættelsesoplevelse i re altid, der findes, men for at gøre det har de brug for, at vi lærer både os selv og maskinerneSkype Translator-forhåndsvisningen er blot endnu et trin i den proces.

Testprogrammet gik live i midten af ​​december og introducerede t alt oversættelse mellem to sprog: engelsk og spansk og skriftlig oversættelse til mere end 40 For at få adgang til den kræves en invitation, som vi kan anmode om ved tilmelding på programmets hjemmeside. Hvis vi er glade for det, kan vi prøve Skype Translator fra Skype-applikationerne til Windows 8.1 eller Windows 10 Technical Preview. Ellers må vi vente på, at tjenesten udvides og offentliggøres officielt.

"… Før du er færdig, stop her et øjeblik og tænk på det år, du lige har læst: to tusind fjorten>"

Via | Skype Blogs I, II

Kontor

Valg af editor

Back to top button