ఉపబల అభ్యాసం Vs. లోతైన ఉపబల అభ్యాసం: తేడా ఏమిటి?

రచయిత: Laura McKinney
సృష్టి తేదీ: 5 ఏప్రిల్ 2021
నవీకరణ తేదీ: 26 జూన్ 2024
Anonim
Dr Subbarao on ’Challenges of the Corona Crisis - the Economic Dimensions’ [Subs Hindi & Telugu]
వీడియో: Dr Subbarao on ’Challenges of the Corona Crisis - the Economic Dimensions’ [Subs Hindi & Telugu]

విషయము


Takeaway:

మేము నిపుణుల వద్దకు వెళ్లి, ఉపబల అభ్యాసం మరియు లోతైన ఉపబల అభ్యాసం మధ్య ముఖ్యమైన తేడాలకు సమాధానం చెప్పమని వారిని కోరారు

మెషీన్ లెర్నింగ్ అల్గోరిథంలు జీవితాన్ని మరియు పనిని సులభతరం చేస్తాయి, మొత్తం వ్యక్తుల బృందాల కంటే వేగంగా మరియు తెలివిగా పనిచేసేటప్పుడు అనవసరమైన పనుల నుండి మమ్మల్ని విముక్తి చేస్తాయి. అయితే, వివిధ రకాల యంత్ర అభ్యాసాలు ఉన్నాయి. ఉదాహరణకు, ఉపబల అభ్యాసం మరియు లోతైన ఉపబల అభ్యాసం ఉన్నాయి.

"ఉపబల అభ్యాసం మరియు లోతైన ఉపబల అభ్యాసం రెండూ స్వయంచాలకంగా నేర్చుకునే యంత్ర అభ్యాస పద్ధతులు అయినప్పటికీ, కొన్ని తేడాలు ఉన్నాయి" అని న్యూజెర్సీలోని వేన్లోని విలియం పాటర్సన్ విశ్వవిద్యాలయంలో కంప్యూటర్ సైన్స్ అసిస్టెంట్ ప్రొఫెసర్ డాక్టర్ కిహో లిమ్ తెలిపారు. "ఉపబల అభ్యాసం ఫలితాన్ని పెంచడానికి ట్రయల్ మరియు ఎర్రర్ పద్దతితో డైనమిక్‌గా నేర్చుకుంటుంది, అయితే లోతైన ఉపబల అభ్యాసం ఇప్పటికే ఉన్న జ్ఞానం నుండి నేర్చుకోవడం మరియు క్రొత్త డేటా సమితికి వర్తింపజేయడం."

కానీ, ఖచ్చితంగా, దీని అర్థం ఏమిటి? మేము నిపుణుల వద్దకు వెళ్ళాము - మరియు ఉదాహరణలు పుష్కలంగా అందించమని వారిని కోరారు!


ఉపబల అభ్యాసం అంటే ఏమిటి?

లిమ్ చెప్పినట్లుగా, ఉపబల అభ్యాసం అనేది ట్రయల్ మరియు ఎర్రర్ - మరియు ప్రాక్టీస్ ద్వారా నేర్చుకోవడం. WA లోని రెడ్‌మండ్‌లోని డేటా సైన్స్ డోజోలో డేటా సైంటిస్ట్ ట్రైనీ హునైద్ హమీద్ ప్రకారం, “ఈ క్రమశిక్షణలో, ఒక మోడల్ సరైన అంచనా కోసం రివార్డ్ చేయబడటం మరియు తప్పు అంచనాలకు జరిమానా విధించడం ద్వారా విస్తరణలో నేర్చుకుంటుంది. (రీన్ఫోర్స్‌మెంట్ లెర్నింగ్ చదవండి మార్కెటింగ్‌కు చక్కని డైనమిక్ స్పిన్ ఇవ్వగలదు.)

"ఉపబల అభ్యాసం సాధారణంగా AI ఆటలలో కనిపిస్తుంది మరియు కాలక్రమేణా ఆట ఆడటంలో మెరుగుపడుతుంది."

ఉపబల అభ్యాసంలో మూడు ముఖ్యమైన భాగాలు ఏజెంట్, చర్య మరియు బహుమతి. "ఉపబల అభ్యాసం ఒక నిర్దిష్ట పద్దతికి కట్టుబడి ఉంటుంది మరియు ఉత్తమ ఫలితాన్ని పొందటానికి ఉత్తమమైన మార్గాలను నిర్ణయిస్తుంది" అని CA లోని మౌంటెన్ వ్యూలోని ఫిడ్లెర్ ల్యాబ్స్ వద్ద డేటా సైన్స్ హెడ్ డాక్టర్ అంకుర్ టాలీ చెప్పారు. "ఇది మేము వీడియో గేమ్ ఎలా ఆడుతున్నామో దాని నిర్మాణానికి చాలా పోలి ఉంటుంది, దీనిలో పాత్ర (ఏజెంట్) అత్యధిక స్కోరు (బహుమతి) పొందటానికి వరుస ప్రయత్నాలలో (చర్యలలో) పాల్గొంటుంది."


అయితే, ఇది స్వయంప్రతిపత్తి స్వీయ-బోధనా వ్యవస్థ. వీడియో గేమ్ ఉదాహరణను ఉపయోగించి, స్కోరు లేదా పాయింట్లను పెంచడం ద్వారా సానుకూల బహుమతులు రావచ్చని, మరియు ప్రతికూల రివార్డులు అడ్డంకులుగా మారడం లేదా అననుకూలమైన కదలికలు చేయడం వల్ల సంభవించవచ్చు అని టాలీ చెప్పారు.

శాన్ఫ్రాన్సిస్కో యొక్క CEO క్రిస్ నికల్సన్, CA- ఆధారిత స్కైమైండ్ అల్గోరిథంలు ట్రయల్ మరియు ఎర్రర్ ద్వారా ఎలా నేర్చుకుంటాయో ఉదాహరణను రూపొందిస్తుంది. ”సూపర్ మారియో బ్రదర్స్‌ను మొదటిసారి ఆడుకోవడం మరియు ఎలా గెలవాలో తెలుసుకోవడానికి ప్రయత్నిస్తున్నట్లు Ima హించుకోండి: మీరు స్థలాన్ని అన్వేషించండి, మీరు బాతు, దూకడం, నాణెం కొట్టడం, తాబేలుపై దిగడం, ఆపై ఏమి జరుగుతుందో మీరు చూస్తారు. ”

బగ్స్ లేవు, ఒత్తిడి లేదు - మీ జీవితాన్ని నాశనం చేయకుండా జీవితాన్ని మార్చే సాఫ్ట్‌వేర్‌ను రూపొందించడానికి స్టెప్ గైడ్ ద్వారా మీ దశ

సాఫ్ట్‌వేర్ నాణ్యత గురించి ఎవరూ పట్టించుకోనప్పుడు మీరు మీ ప్రోగ్రామింగ్ నైపుణ్యాలను మెరుగుపరచలేరు.

మంచి చర్యలు మరియు చెడు చర్యలను నేర్చుకోవడం ద్వారా, ఆట ఎలా ప్రవర్తించాలో నేర్పుతుంది. "ఉపబల అభ్యాసం ఏ పరిస్థితిలోనైనా చేస్తుంది: వీడియో గేమ్స్, బోర్డ్ గేమ్స్, వాస్తవ ప్రపంచ వినియోగ కేసుల అనుకరణలు." వాస్తవానికి, నికల్సన్ తన సంస్థ ఉపబల అభ్యాసం మరియు అనుకరణలను ఉపయోగిస్తుందని కంపెనీలు సంక్లిష్ట పరిస్థితుల ద్వారా ఉత్తమ నిర్ణయ మార్గాన్ని గుర్తించడంలో సహాయపడతాయి.

ఉపబల అభ్యాసంలో, పెద్ద లక్ష్యాన్ని సాధించడానికి ఏజెంట్ అనేక చిన్న నిర్ణయాలు తీసుకుంటాడు. మరో ఉదాహరణ రోబోట్ నడవడానికి నేర్పడం. “ఒక అడుగు ఎత్తడానికి, మోకాలిని వంచి, అణిచివేసేందుకు హార్డ్-కోడింగ్ ఆదేశాలకు బదులుగా, ఒక ఉపబల అభ్యాస విధానం రోబోట్ ప్రయోగాన్ని వేర్వేరు సన్నివేశాలతో కలిగి ఉండవచ్చు మరియు ఏ కలయికలు అత్యంత విజయవంతమవుతాయో తెలుసుకోండి కాలేజ్ పార్క్, MD లోని ఇమ్యుటాలో డేటా సైంటిస్ట్ మరియు అనలిటిక్స్ టూల్ నిపుణుడు స్టీఫెన్ బెయిలీ చెప్పారు.

వీడియో గేమ్స్ మరియు రోబోటిక్స్ పక్కన పెడితే, ఉపబల అభ్యాసం ఎలా పనిచేస్తుందో వివరించడానికి సహాయపడే ఇతర ఉదాహరణలు ఉన్నాయి. వాషింగ్టన్ డి.సి.లోని బాబెల్ స్ట్రీట్‌లోని చీఫ్ డేటా సైంటిస్ట్ బ్రాండన్ హేనీ దీనిని సైకిల్ తొక్కడం మానవ అభ్యాసంతో పోల్చారు. "మీరు స్థిరంగా ఉండి, పెడలింగ్ లేకుండా మీ పాదాలను ఎత్తండి, పతనం లేదా జరిమానా - ఆసన్నమైంది."

అయితే, మీరు పెడల్ ప్రారంభిస్తే, మీరు బైక్‌పై ఉంటారు - రివార్డ్ - మరియు తదుపరి రాష్ట్రానికి పురోగతి.

"ఉపబల అభ్యాసంలో ఆర్థిక నిర్ణయాలు, రసాయన శాస్త్రం, తయారీ మరియు రోబోటిక్స్ వంటి అనేక రంగాలలో విస్తరించిన అనువర్తనాలు ఉన్నాయి" అని హేనీ చెప్పారు.

డీప్ రీన్‌ఫోర్స్‌మెంట్ లెర్నింగ్ అంటే ఏమిటి?

ఏదేమైనా, రీన్ఫోర్స్డ్ లెర్నింగ్ విధానానికి నిర్ణయాలు చాలా క్లిష్టంగా మారడం సాధ్యమే. అల్గోరిథం అన్ని రాష్ట్రాల నుండి నేర్చుకోవడం మరియు రివార్డ్ మార్గాన్ని నిర్ణయించడం చాలా ఎక్కువ అని హేనీ చెప్పారు. "లోతైన ఉపబల అభ్యాసం ఇక్కడ సహాయపడుతుంది: ప్రతి పరిష్కారాన్ని మ్యాప్ చేయకుండా రాష్ట్రాలను అంచనా వేయడానికి నాడీ నెట్‌వర్క్ యొక్క అనువర్తనాన్ని‘ లోతైన ’భాగం సూచిస్తుంది, నిర్ణయ ప్రక్రియలో మరింత నిర్వహించదగిన పరిష్కార స్థలాన్ని సృష్టిస్తుంది.”

ఇది క్రొత్త భావన కాదు. 1970 ల నుండి ఇది ఉనికిలో ఉందని హేనీ చెప్పారు. "కానీ చౌక మరియు శక్తివంతమైన కంప్యూటింగ్ రావడంతో, నాడీ నెట్‌వర్క్‌ల యొక్క అదనపు ప్రయోజనాలు ఇప్పుడు పరిష్కారం యొక్క సంక్లిష్టతను తగ్గించడానికి ప్రాంతాలను పరిష్కరించడంలో సహాయపడతాయి" అని ఆయన వివరించారు. (చదవండి ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ మరియు న్యూరల్ నెట్‌వర్క్‌ల మధ్య తేడా ఏమిటి?)

కాబట్టి, ఇది ఎలా పని చేస్తుంది? టెరాడాటాలోని అమెరికాల AI బృందం నాయకుడు పీటర్ మాకెంజీ ప్రకారం, పట్టికలలో నిల్వ చేయడానికి ఇది చాలా ఎక్కువ సమాచారం, మరియు పట్టిక పద్ధతులకు ఏజెంట్ ప్రతి రాష్ట్ర మరియు చర్య కలయికను సందర్శించాల్సిన అవసరం ఉంది.

ఏదేమైనా, లోతైన ఉపబల అభ్యాసం రాష్ట్ర విలువలను అంచనా వేసే పట్టిక పద్ధతులను ఫంక్షన్ ఉజ్జాయింపుతో భర్తీ చేస్తుంది. "ఫంక్షన్ ఉజ్జాయింపు అన్ని రాష్ట్ర మరియు విలువ జతలను పట్టికలో నిల్వ చేయవలసిన అవసరాన్ని తొలగించడమే కాదు, ఇలాంటి రాష్ట్రాల విలువలను ఉపయోగించడం ద్వారా ఇది ఇంతకు ముందెన్నడూ చూడని, లేదా పాక్షిక సమాచారాన్ని కలిగి ఉన్న రాష్ట్రాల విలువను సాధారణీకరించడానికి ఏజెంట్‌ను అనుమతిస్తుంది." మాకెంజీ చెప్పారు.

"అపారమైన రాష్ట్ర ప్రదేశాలలో సాధారణీకరించడానికి నాడీ నెట్‌వర్క్‌ల యొక్క బలమైన సామర్థ్యం కారణంగా లోతైన ఉపబల అభ్యాసంలో చాలా ఉత్తేజకరమైన పురోగతులు వచ్చాయి." మరియు మాకెంజీ కొన్ని ఉత్తమ మానవ పోటీదారులను ఓడించిన ప్రోగ్రామ్‌లలో లోతైన ఉపబల అభ్యాసం ఉపయోగించబడిందని పేర్కొన్నాడు. చెస్ మరియు గో వంటి ఆటలలో మరియు రోబోటిక్స్లో చాలా పురోగతికి కూడా బాధ్యత వహిస్తారు. (AI, మెషిన్ లెర్నింగ్ మరియు రోబోటిక్స్లో 7 మంది మహిళా నాయకులను చదవండి.)

"ఈ సంవత్సరం ప్రారంభంలో, ఆల్ఫాస్టార్ అనే AI ఏజెంట్ ప్రపంచంలోని ఉత్తమ స్టార్‌క్రాఫ్ట్ II ప్లేయర్‌ను ఓడించాడు - మరియు ఇది చాలా ఆసక్తికరంగా ఉంటుంది ఎందుకంటే చెస్ మరియు గో వంటి ఆటల మాదిరిగా కాకుండా, స్టార్‌క్రాఫ్ట్‌లోని ఆటగాళ్లకు తమ ప్రత్యర్థి ఏమి చేస్తున్నారో తెలియదు." బదులుగా, వారు తమ ప్రత్యర్థి ఏమి ప్లాన్ చేస్తున్నారో తెలుసుకున్నట్లుగా వారు ఒక ప్రారంభ వ్యూహాన్ని తయారు చేసుకోవలసి ఉందని ఆయన చెప్పారు.

కానీ అది కూడా ఎలా సాధ్యమవుతుంది? ఒక మోడల్ ఐదు పొరల కంటే ఎక్కువ న్యూరల్ నెట్‌వర్క్ కలిగి ఉంటే, అధిక డైమెన్షనల్ డేటాను తీర్చగల సామర్థ్యం దీనికి ఉందని హమీద్ చెప్పారు. "ఈ కారణంగా, మోడల్ మానవ ఇంజనీర్ క్యూరేట్ లేకుండా సొంతంగా నమూనాలను గుర్తించడం నేర్చుకోవచ్చు మరియు నేర్చుకోవటానికి మోడల్‌లోకి ఇన్‌పుట్ చేయవలసిన వేరియబుల్స్‌ను ఎంచుకోవచ్చు" అని ఆయన వివరించారు.

ఓపెన్-ఎండ్ దృశ్యాలలో, లోతైన ఉపబల అభ్యాసం యొక్క అందాన్ని మీరు నిజంగా చూడవచ్చు. టాలీ రెస్టారెంట్‌లో టేబుల్‌ను బుక్ చేసుకోవడం లేదా ఒక వస్తువు కోసం ఆర్డర్ ఇవ్వడం యొక్క ఉదాహరణను ఉపయోగిస్తుంది - ఇతర చివర నుండి ఏదైనా ఇన్‌పుట్‌కు ఏజెంట్ ప్రతిస్పందించాల్సిన పరిస్థితులు.

"సంభాషణ ఏజెంట్‌కు నేరుగా లేదా మరొక చివర నుండి ఆడియో సిగ్నల్‌కు శిక్షణ ఇవ్వడానికి లోతైన ఉపబల అభ్యాసం ఉపయోగపడుతుంది" అని ఆయన చెప్పారు. "ఆడియో సిగ్నల్‌ను ఉపయోగిస్తున్నప్పుడు, విరామం, శబ్దం, మరియు సెటెరా వంటి ఆడియోలోని సూక్ష్మ సూచనలను ఎంచుకోవడం కూడా ఏజెంట్ నేర్చుకోవచ్చు - ఇది లోతైన ఉపబల అభ్యాసం యొక్క శక్తి."

లోతైన ఉపబల అభ్యాసం యొక్క కొత్త అనువర్తనాలు వెలువడుతున్నాయి. కస్టమర్‌తో సన్నిహితంగా ఉండటానికి తదుపరి ఉత్తమ చర్యను నిర్ణయించడంలో, మాకెంజీ "రాష్ట్రం మరియు చర్యలలో అన్ని విభిన్న ఛానెల్‌లలో ఉత్పత్తులు, ఆఫర్‌లు మరియు మెసేజింగ్ యొక్క అన్ని కలయికలు ఉంటాయి, ప్రతి ఒక్కటి వ్యక్తిగతీకరించబడినవి - పదాలు, చిత్రాలు, రంగులు, ఫాంట్‌లు."

మరొక ఉదాహరణ సరఫరా గొలుసు ఆప్టిమైజేషన్, ఉదాహరణకు, యుఎస్ అంతటా పాడైపోయే ఉత్పత్తులను పంపిణీ చేయడం “సాధ్యమయ్యే రాష్ట్రాలలో అన్ని రకాల రవాణా యొక్క ప్రస్తుత స్థానం, అన్ని ప్లాంట్లు, గిడ్డంగులు మరియు రిటైల్ అవుట్లెట్లలోని జాబితా మరియు అందరికీ డిమాండ్ సూచన ఉన్నాయి. దుకాణాలు, ”మాకెంజీ చెప్పారు.

"రాష్ట్రం మరియు కార్యాచరణ స్థలాన్ని సూచించడానికి లోతైన అభ్యాసాన్ని ఉపయోగించడం వలన తక్కువ ఖర్చుతో ఎక్కువ సకాలంలో సరుకు రవాణాకు దారితీసే మెరుగైన లాజిస్టిక్ నిర్ణయాలు తీసుకోవడానికి ఏజెంట్‌ను అనుమతిస్తుంది."