వాయిస్ రికగ్నిషన్ టెక్నాలజీ: సహాయకారిగా లేదా బాధాకరంగా ఉందా?

రచయిత: Judy Howell
సృష్టి తేదీ: 28 జూలై 2021
నవీకరణ తేదీ: 1 జూలై 2024
Anonim
వాయిస్ రికగ్నిషన్ టెక్నాలజీ: సహాయకారిగా లేదా బాధాకరంగా ఉందా? - టెక్నాలజీ
వాయిస్ రికగ్నిషన్ టెక్నాలజీ: సహాయకారిగా లేదా బాధాకరంగా ఉందా? - టెక్నాలజీ

విషయము


Takeaway:

సంభాషణ ఎలక్ట్రానిక్స్‌తో పరస్పర చర్య చేయడం సర్వసాధారణం అవుతోంది - మరియు అవసరం. కానీ ఇప్పటివరకు, ఫలితాలు నిర్ణయాత్మకంగా మిశ్రమంగా ఉన్నాయి.

మీతో సంభాషణ జరపాలని కోరుకునే ఆహ్లాదకరమైన రికార్డ్ చేసిన స్వరంతో మాత్రమే స్వాగతం పలకడానికి మీరు ఎప్పుడైనా కొంత సహాయం పొందడానికి లేదా మీ బిల్లు చెల్లించడానికి ఒక సంస్థను పిలిచారా - కాని మీరు చెబుతున్న దానిలో సగం అర్థం చేసుకోలేదా? లేదా మీరు ఐఫోన్‌ను కలిగి ఉండవచ్చు, మరియు సిరి మొదట మంచి మిత్రుడిలా కనిపించినప్పటికీ, కొన్నిసార్లు (సరే, నిజాయితీగా ఉండటానికి వీలు కల్పిస్తుంది) ఆమె దానిని పొందలేదా? స్పీచ్-టు- అని కూడా పిలువబడే వాయిస్ రికగ్నిషన్ టెక్నాలజీ (విఆర్టి) ఒక సాధారణ ఉచ్చులో పడిపోతుంది: ఇది చాలా చల్లగా ఉండే అవకాశం ఉంది (మరియు బాలుడు, మేము దాని కోసం పాతుకుపోతున్నాము), కానీ చాలా తరచుగా, దాని దంతాలు రుబ్బుకునే వ్యాయామం నిరాశతో.

సైన్స్ ఫిక్షన్ రంగానికి చెందిన ఒక ఆలోచన, 1950 వ దశకంలో, వాయిస్ గుర్తింపు దాని శైశవదశలోనే పెరిగింది, బెల్ లాబొరేటరీస్ ఆడ్రీ వ్యవస్థ ఒకే స్వరంలో మాట్లాడే అంకెలను గుర్తించడానికి రూపొందించబడినప్పుడు, ఇప్పుడు మనం సంభాషించే సంభాషణ ఎలక్ట్రానిక్స్ యొక్క ఆధునిక నెట్‌వర్క్‌కు రోజువారీగా - మిశ్రమ ఫలితాలతో.

మానవుడితో మాట్లాడటానికి, దయచేసి 0 నొక్కండి

నేటి వ్యాపారాలు చాలా ఇప్పుడు కస్టమర్ సేవా కాల్‌లను నిర్వహించడానికి ఇంటరాక్టివ్ వాయిస్ రెస్పాన్స్ (IVR) అని పిలువబడే వ్యవస్థలను ఉపయోగిస్తాయి. వాయిస్-నావిగేటెడ్ మెనుల కోసం చాలా సాధారణ ఉపయోగం, కానీ కొన్ని కంపెనీలు కస్టమర్ ఖాతా సమాచారాన్ని యాక్సెస్ చేయగల మరియు చిన్న ప్రశ్నలకు సమాధానం ఇవ్వగల IVR వ్యవస్థలను ఉపయోగిస్తాయి. మెనూ IVR సాఫ్ట్‌వేర్ సాధారణంగా పరిమిత పదజాలం కలిగి ఉంటుంది, ఇది "అవును," "లేదు" మరియు సంఖ్యలకు పరిమితం కావచ్చు. మరింత సంక్లిష్టమైన వ్యవస్థలు సంస్థ-నిర్దిష్ట పదాలు మరియు పదబంధాలను గుర్తించగలవు.

ఈ వ్యవస్థలు మరింత ప్రాచుర్యం పొందుతున్నాయి - కనీసం వ్యాపారాల కోసం - ఒక సాధారణ కారణం కోసం: అవి ఖర్చుతో కూడుకున్నవి. వాల్ స్ట్రీట్ జర్నల్ యొక్క 2010 నివేదిక ప్రకారం, ఒక ఏజెంట్‌ను చేరే సాధారణ కస్టమర్ కాల్ $ 3 మరియు $ 9 మధ్య ఖర్చవుతుంది, అయితే ఆటోమేటెడ్ సిస్టమ్ ద్వారా నిర్వహించబడే కాల్‌కు ఐదు నుండి ఏడు సెంట్లు మాత్రమే ఖర్చవుతుంది. మరియు, వాస్తవానికి, కంప్యూటర్ ప్రోగ్రామ్‌లు అలసిపోవు, అనారోగ్యంతో పిలవవు, లేదా కస్టమర్‌లతో విసుగు చెందవు (కస్టమర్లు ఖచ్చితంగా వారితో విసుగు చెందినా!).

అదృష్టవశాత్తూ, ఇది ఎల్లప్పుడూ IVR వ్యక్తుల నుండి ఉద్యోగాలను తీసుకుంటుందని కాదు - లేదా కనీసం ప్రజలందరూ కాల్ సెంటర్ల నుండి కనుమరుగవుతున్నారని కాదు. ఈ వాయిస్-యాక్టివేటెడ్ హెల్పర్స్ కాల్స్ దర్శకత్వం మరియు సాధారణ ప్రశ్నలకు సమాధానం ఇవ్వడం ద్వారా మానవ కస్టమర్ సేవా ప్రతినిధులను మరింత ఉత్పాదకంగా ఉండటానికి అనుమతిస్తాయి.

ఈ సాంకేతిక పరిజ్ఞానాలతో సంభాషించే మానవ వినియోగదారులకు, ఇది ఎల్లప్పుడూ సున్నితమైన నౌకాయానం కాదు. ఐవిఆర్ టెక్నాలజీలో ఉచ్ఛారణలతో ఇబ్బంది వంటి సాధారణ సమస్యలను మెరుగుపరచడానికి టెక్నాలజీ సహాయపడుతుంది, అయితే ఆటోమేటెడ్ సిస్టమ్స్‌ను తొలగించడం ఇప్పటికీ ఆన్‌లైన్‌లో సాధారణ ఇతివృత్తం. వాయిస్ గుర్తింపుతో కూడిన ఎలివేటర్ గురించి ఈ కామెడీ స్కిట్‌ను చూడండి, ఇది IVR వ్యవస్థల్లోని లోపాలు ఉత్పత్తి చేయగల నిరాశను హైలైట్ చేస్తుంది.

వ్యక్తిగత ఫోన్ అనువర్తనాలు: సిరి, గూగుల్ నౌ

స్మార్ట్‌ఫోన్‌ల కోసం వాయిస్ రికగ్నిషన్ గురించి చాలా మందికి తెలుసు. 2011 లో ఐఫోన్ 4 ఎస్ కోసం స్వల్పంగా వ్యంగ్యంగా, వాయిస్-యాక్టివేట్ చేసిన "పర్సనల్ అసిస్టెంట్" అయిన సిరిని ఆపిల్ పరిచయం చేసినప్పుడు తాజా ఫోన్ మోడళ్లలో ఎక్కువ భాగం విఆర్ తో వచ్చినప్పటికీ, వారి ప్రజాదరణ మరియు అపఖ్యాతి పెరిగింది. గూగుల్ త్వరలో ప్రత్యక్ష పోటీదారుని సృష్టించింది: గూగుల్ ఇప్పుడు Android Jelly Bean OS కోసం. రెండు వ్యవస్థలు స్త్రీ స్వరాలు మరియు అధునాతన గుర్తింపు లక్షణాలను కలిగి ఉంటాయి, ఇవి వినియోగదారులను సాధారణ భాషని ఉపయోగించి వారి ఫోన్‌లతో "మాట్లాడటానికి" అనుమతిస్తాయి.

ఈ వ్యవస్థలు వారి పూర్వీకుల కంటే చాలా అధునాతనమైనవి మరియు క్రియాత్మకమైనవి అయినప్పటికీ, సాంకేతిక పరిజ్ఞానం ఇంకా చాలా దూరం వెళ్ళవలసి ఉందని వారు చూపిస్తున్నారు. సిరిస్ వైఫల్యం గురించి జోకులు ఒక ప్రముఖ ఇంటర్నెట్ పోటిగా మారాయి. సిరిస్ సామర్థ్యాలకు సంబంధించి తప్పుడు ప్రకటనల కోసం ఒక వ్యక్తి ఆపిల్‌పై కేసు పెట్టాడు.

ఆపిల్ సిరిని అధునాతనంగా మరియు సమాచారంగా సృష్టించినప్పటికీ, VR సాఫ్ట్‌వేర్ కూడా సాసీ వైపు కొద్దిగా ఉంటుంది. ఉదాహరణకు, మీరు 1968 చిత్రం "2001: ఎ స్పేస్ ఒడిస్సీ" - "పాడ్ బే తలుపులు తెరవండి" నుండి సినిమా చరిత్రలో అత్యంత అపఖ్యాతి పాలైన ఇంటెలిజెన్స్ టెక్నాలజీ లైన్లలో ఒకటి మాట్లాడితే - సిరి సినిమా నుండి సమాధానమిచ్చే పంక్తితో ప్రతిస్పందిస్తారు, " క్షమించండి (మీ పేరు), నేను అలా చేయలేనని భయపడుతున్నాను "లేదా మరింత వ్యంగ్యంగా," మేం ఇంటెలిజెన్స్ ఏజెంట్లు ఎప్పటికీ జీవించరు, స్పష్టంగా. "

సిరిని ప్రేమించడం సులభతరం చేయడానికి ప్రయత్నించే ఫంక్షన్లలో ఒకటి, మరియు కొంచెం ఎక్కువ మానవుడు. VR అసిస్టెంట్ కాల్స్ చేయడానికి, డిక్టేషన్ మరియు లు తీసుకోవటానికి, సమాచారం కోసం ఇంటర్నెట్ శోధనలు చేయటానికి, సమీపంలోని దుకాణాలను కనుగొనటానికి, డ్రైవింగ్ దిశలను ఇవ్వడానికి మరియు మరెన్నో వాయిస్ ఆదేశాలను అనుసరించవచ్చు. సమాధానాలు ఒకేసారి ఫోన్ ద్వారా మాట్లాడబడతాయి మరియు తెరపై ప్రదర్శించబడతాయి.

గూగుల్ నౌ, ఆండ్రాయిడ్ జెల్లీబీన్ ప్లాట్‌ఫాం యొక్క వీఆర్ భాగం సిరికి చాలా పోలి ఉంటుంది. సాధారణ ప్రసంగాన్ని ఆదేశాలకు అనువదించడం ద్వారా సిస్టమ్ అదే విస్తృతమైన గుర్తింపు సామర్థ్యాలను అందిస్తుంది, ఇది వినియోగదారులను కాల్స్, లు, శోధనలు అమలు చేయడం, లెక్కలు మరియు మార్పిడులు చేయడం, పద నిర్వచనాలను పట్టుకోవడం, అలారాలను సెట్ చేయడం, పాటలు ప్లే చేయడం మరియు పటాలు మరియు దిశలను పొందడానికి అనుమతిస్తుంది.

సిరి మరియు గూగుల్ నౌ వంటి వ్యక్తిగత వాయిస్ అసిస్టెంట్లతో, ప్రయోజనాలు స్పష్టంగా ఉన్నాయి. కాల్ చేయడం మరియు శోధించడం మరియు వినోదం వరకు ప్రతిదీ వేగంగా మరియు సులభంగా ఉంటుంది. మీకు కావలసినది చెప్పండి మరియు (ఎక్కువ సమయం) VR అనువర్తనం మీ కోసం దాన్ని పట్టుకుంటుంది. డ్రైవింగ్ చేసేటప్పుడు వీఆర్ యొక్క హ్యాండ్-ఆఫ్ టెక్నాలజీ ముఖ్యంగా సహాయపడుతుంది. చాలా మంది ప్రజలు సిరిస్ లోపాలను ఖండించారు, మరియు యూజర్స్ జీవితాలను తప్పనిసరిగా నడిపించే గూగుల్ నౌస్ సామర్థ్యం రెండూ కొంచెం అవమానకరమైనవి అని రచయితలు వాదించారు, చాలా మంది ఇప్పటికీ ఈ భవిష్యత్ సాంకేతికతలు చాలా బాగున్నాయని భావిస్తున్నారు.

వాస్తవానికి, సిరి మరియు గూగుల్ నౌ వంటి వ్యక్తిగత ఫోన్ అనువర్తనాలు సంపూర్ణంగా లేవు - అయినప్పటికీ భవిష్యత్తులో ఈ సాంకేతిక పరిజ్ఞానం ఎక్కడికి వెళ్ళగలదో వారు చూపిస్తారు. అంటే, సిరి తప్పు సమాధానం చెప్పినప్పుడు కూడా, ఆమెను నవ్వించి, క్షమించే అవకాశం ఉంది, తరువాతి వెర్షన్ చాలా బాగుంటుందని తెలుసుకోవడం.

ఎక్కడ విఆర్ ఫాల్స్ ఫ్లాట్

మీరు వ్యాపారాన్ని పిలిచినప్పుడు మీరు ఎప్పుడైనా IVR ను ఎదుర్కొన్నట్లయితే, మీరు కమ్యూనికేషన్‌కు కొన్ని అడ్డంకులను గమనించవచ్చు. కొన్ని ప్రోగ్రామ్‌లు పదాలను తప్పుగా ఉచ్చరించే మరియు అర్థం చేసుకోవడం కష్టతరం చేసే రోబోటిక్-టు-స్పీచ్ వాయిస్‌ని ఉపయోగిస్తాయి. ఇతరులకు సున్నితత్వ సమస్యలు ఉన్నాయి, ఫలితంగా మీరు చాలా బిగ్గరగా, చాలా మృదువుగా లేదా జాగ్రత్తగా ప్రోత్సహించకపోతే సాఫ్ట్‌వేర్ మీరు చెప్పేదాన్ని ప్రాసెస్ చేయలేకపోతుంది.

అదనంగా, చాలా మంది ఇప్పటికీ యంత్రంతో మాట్లాడటం సుఖంగా లేదు. మీరు IVR లో కొన్ని శోధనలు నడుపుతుంటే, ప్రజలు IVR వ్యవస్థలను దాటవేయడానికి మరియు "నిజమైన వ్యక్తి" ను పొందటానికి మార్గాలను కలిపిన జాబితాలను మీరు ఎదుర్కొంటారు. ఈ పరిష్కారాలు "ఆపరేటర్ కోసం 0 నొక్కడం కొనసాగించండి" నుండి "యంత్రాన్ని మనిషిని పొందే వరకు ప్రమాణం చేయటం" వరకు ఉంటాయి. తత్ఫలితంగా, ఐవిఆర్ వ్యవస్థలలో ఇటీవలి అభివృద్ధిలో ఎక్కువ భాగం మానవులకు మరింత రుచికరమైనదిగా మారాయి; స్వరాలను మరింత సానుభూతితో మరియు తక్కువ రోబోటిక్గా మార్చడం, సిస్టమ్‌ను నావిగేట్ చేయడం సులభం చేస్తుంది మరియు మొత్తం విషయం ప్రారంభం నుండి చివరి వరకు ఎంత సమయం పడుతుందో కాలర్లకు తెలియజేయండి. మెరుగైన సాంకేతిక పరిజ్ఞానం ఇక్కడ సగం యుద్ధం మాత్రమే అని సూచిస్తుంది; మిగతా సగం యంత్రంతో మాట్లాడటం ద్వారా వినియోగదారులను బోర్డులోకి తీసుకువస్తోంది.

వాట్ ది ఫ్యూచర్

ఈ సవాళ్లు ఉన్నప్పటికీ, వాయిస్ రికగ్నిషన్ టెక్నాలజీ అన్ని సమయాలలో మెరుగుపడుతోంది. సిరి మరియు గూగుల్ నౌ వంటి అనువర్తనాలు - లోపాలు మరియు అన్నీ ఇప్పటికీ వాటి పనితీరులో అసాధారణంగా ఆకట్టుకుంటాయి మరియు అనేక కంపెనీలు VR సామర్థ్యాలను ఇతర అనువర్తనాలకు విస్తరిస్తున్నాయి.

ఉదాహరణకు, డ్రాగన్ నేచురల్లీ స్పీకింగ్ స్పీచ్-టు-సాఫ్ట్‌వేర్ సృష్టికర్తలు అయిన న్యూయాన్స్ ఇప్పటికే టెలివిజన్లు మరియు ఆటోమొబైల్స్ కోసం వాయిస్ నియంత్రణలను అభివృద్ధి చేశారు మరియు ఈ సాంకేతిక పరిజ్ఞానం యొక్క సంస్కరణలు కొన్ని శామ్‌సంగ్ టీవీలు మరియు కొన్ని ఫోర్డ్ వాహనాల్లో ఉపయోగించే SYNC వినోద వ్యవస్థల్లో పొందుపరచబడ్డాయి.

గూగుల్ మరియు ఆపిల్ వారి వాయిస్ రికగ్నిషన్ టెక్నాలజీల కోసం కొత్త ఉపయోగాలను కనుగొనడం కొనసాగిస్తున్నప్పుడు, మా టెలివిజన్ల నుండి మా టోస్టర్ల వరకు అన్ని రకాల రోజువారీ యంత్రాలతో ఎక్కువగా మాట్లాడే అవకాశం ఉంది. మరియు, మరోసారి, సైన్స్ ఫిక్షన్ సరైనదనిపిస్తోంది. ఆ తెలివైన రచయితలు ఒక విషయం గురించి తప్పుగా ఉన్నారని ఆశించాలి. ఈ యంత్రాలు స్వాధీనం చేసుకుంటే, మీరు సిరిని "పాడ్ బే తలుపులు తెరవమని" అడిగినప్పుడు మీరు చాలా ఇబ్బందుల్లో పడవచ్చు.