ఉపబల అభ్యాసం

రచయిత: Lewis Jackson
సృష్టి తేదీ: 11 మే 2021
నవీకరణ తేదీ: 15 మే 2024
Anonim
noc19 ge04 lec03 Learning, Instruction and Assessment
వీడియో: noc19 ge04 lec03 Learning, Instruction and Assessment

విషయము

నిర్వచనం - ఉపబల అభ్యాసం అంటే ఏమిటి?

ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ యొక్క కాన్ లో, ఉపబల మరియు శిక్షా విధానాన్ని ఉపయోగించి అల్గోరిథంలకు శిక్షణ ఇచ్చే డైనమిక్ ప్రోగ్రామింగ్ యొక్క ఒక రకమైన ఉపబల అభ్యాసం.


ఉపబల అభ్యాస అల్గోరిథం లేదా ఏజెంట్ దాని వాతావరణంతో సంభాషించడం ద్వారా నేర్చుకుంటుంది. ఏజెంట్ సరిగ్గా పని చేయడం ద్వారా రివార్డులు మరియు తప్పుగా చేసినందుకు జరిమానాలు పొందుతారు. ఏజెంట్ దాని ప్రతిఫలాన్ని పెంచడం ద్వారా మరియు దాని జరిమానాను తగ్గించడం ద్వారా మానవుడి జోక్యం లేకుండా నేర్చుకుంటాడు.

మైక్రోసాఫ్ట్ అజూర్ మరియు మైక్రోసాఫ్ట్ క్లౌడ్‌కు పరిచయం | ఈ గైడ్ మొత్తంలో, క్లౌడ్ కంప్యూటింగ్ అంటే ఏమిటి మరియు క్లౌడ్ నుండి మీ వ్యాపారాన్ని తరలించడానికి మరియు అమలు చేయడానికి మైక్రోసాఫ్ట్ అజూర్ మీకు ఎలా సహాయపడుతుందో మీరు నేర్చుకుంటారు.

టెకోపీడియా ఉపబల అభ్యాసాన్ని వివరిస్తుంది

ప్రవర్తనా మనస్తత్వశాస్త్రం ద్వారా ప్రేరణ పొందిన యంత్ర అభ్యాసానికి ఉపబల అభ్యాసం ఒక విధానం. పిల్లవాడు క్రొత్త పనిని ఎలా నేర్చుకుంటాడో అదే విధంగా ఉంటుంది. ఉపబల అభ్యాసం ఇతర యంత్ర అభ్యాస విధానాలతో విభేదిస్తుంది, దీనిలో అల్గోరిథం ఒక పనిని ఎలా చేయాలో స్పష్టంగా చెప్పబడలేదు, కానీ సమస్య ద్వారా దాని స్వంతంగా పనిచేస్తుంది.

ఒక ఏజెంట్‌గా, ఇది స్వీయ-డ్రైవింగ్ కారు లేదా చదరంగం ఆడే ప్రోగ్రామ్, దాని వాతావరణంతో సంకర్షణ చెందుతుంది, ఇది ఎలా పని చేస్తుందో బట్టి రివార్డ్ స్థితిని పొందుతుంది, గమ్యస్థానానికి సురక్షితంగా నడపడం లేదా ఆట గెలవడం వంటివి. దీనికి విరుద్ధంగా, రహదారిపైకి వెళ్లడం లేదా చెక్‌మేట్ చేయడం వంటి తప్పుగా చేసినందుకు ఏజెంట్ జరిమానా పొందుతాడు.


కాలక్రమేణా ఏజెంట్ దాని బహుమతిని పెంచడానికి మరియు డైనమిక్ ప్రోగ్రామింగ్ ఉపయోగించి దాని జరిమానాను తగ్గించడానికి నిర్ణయాలు తీసుకుంటాడు. ఆర్టిఫిషియల్ ఇంటెలిజెన్స్‌కు ఈ విధానం యొక్క ప్రయోజనం ఏమిటంటే, ఒక ప్రోగ్రామర్ లేకుండా ఒక AI ప్రోగ్రామ్ ఒక ఏజెంట్ ఈ పనిని ఎలా చేయాలో స్పెల్లింగ్ లేకుండా నేర్చుకోవడానికి అనుమతిస్తుంది.