డేటా మైనింగ్ మరియు డేటా సైన్స్ నేర్చుకోవడానికి 7 దశలు

రచయిత: Eugene Taylor
సృష్టి తేదీ: 12 ఆగస్టు 2021
నవీకరణ తేదీ: 22 జూన్ 2024
Anonim
6 నెలల్లో డేటా సైన్స్ నేర్చుకోవడానికి దశల వారీ రోడ్‌మ్యాప్ | పూర్తి డేటా సైన్స్ రోడ్‌మ్యాప్
వీడియో: 6 నెలల్లో డేటా సైన్స్ నేర్చుకోవడానికి దశల వారీ రోడ్‌మ్యాప్ | పూర్తి డేటా సైన్స్ రోడ్‌మ్యాప్

విషయము


మూలం: పాల్ ఫ్లీట్ / డ్రీమ్‌స్టైమ్.కామ్

Takeaway:

డేటా సైన్స్ చేయడం ద్వారా ఉత్తమంగా నేర్చుకుంటారు, కాని గణాంకాలు మరియు యంత్ర అభ్యాస విషయాల యొక్క మంచి పునాది.

డేటా మైనింగ్ మరియు డేటా సైన్స్ ఎలా నేర్చుకోవాలో నన్ను తరచుగా అడుగుతారు. ఇక్కడ నా సారాంశం ఉంది.

మీరు డేటా మైనింగ్ మరియు డేటా సైన్స్ చేయడం ద్వారా ఉత్తమంగా నేర్చుకోవచ్చు, కాబట్టి మీకు వీలైనంత త్వరగా డేటాను విశ్లేషించడం ప్రారంభించండి! అయినప్పటికీ, సిద్ధాంతాన్ని నేర్చుకోవడం మర్చిపోవద్దు, ఎందుకంటే మీరు ఏమి చేస్తున్నారో అర్థం చేసుకోవడానికి మరియు పెద్ద డేటా యొక్క శబ్దంలో విలువ యొక్క నిజమైన నగ్గెట్లను కనుగొనటానికి మీకు మంచి గణాంక మరియు యంత్ర అభ్యాస పునాది అవసరం.

డేటా మైనింగ్ మరియు డేటా సైన్స్ నేర్చుకోవడానికి ఇక్కడ ఏడు దశలు ఉన్నాయి. అవి లెక్కించబడినప్పటికీ, మీరు వాటిని సమాంతరంగా లేదా వేరే క్రమంలో చేయవచ్చు.

  1. భాషలు: R, పైథాన్ మరియు SQL నేర్చుకోండి
  2. ఉపకరణాలు: డేటా మైనింగ్ మరియు విజువలైజేషన్ సాధనాలను ఎలా ఉపయోగించాలో తెలుసుకోండి
  3. పుస్తకాలు: ప్రాథమికాలను అర్థం చేసుకోవడానికి పరిచయ పుస్తకాలను చదవండి
  4. విద్య: వెబ్‌నార్‌లను చూడండి, కోర్సులు తీసుకోండి మరియు డేటా సైన్స్‌లో సర్టిఫికేట్ లేదా డిగ్రీని పరిగణించండి (బెన్ లోరికాస్‌లో మరింత చదవండి డేటా సైంటిస్ట్‌ను ఎలా పెంచుకోవాలి.)
  5. డేటా: అందుబాటులో ఉన్న డేటా వనరులను తనిఖీ చేయండి మరియు అక్కడ ఏదైనా కనుగొనండి
  6. పోటీలు: డేటా మైనింగ్ పోటీలలో పాల్గొనండి
  7. సోషల్ నెట్‌వర్క్‌లు, సమూహాలు మరియు సమావేశాల ద్వారా ఇతర డేటా శాస్త్రవేత్తలతో సంభాషించండి

ఈ వ్యాసంలో, నేను డేటా మైనింగ్ మరియు డేటా సైన్స్ ను పరస్పరం ఉపయోగిస్తాను. నా ప్రెజెంటేషన్, అనలిటిక్స్ ఇండస్ట్రీ అవలోకనం చూడండి, ఇక్కడ నేను గణాంకాలు, జ్ఞాన ఆవిష్కరణ, డేటా మైనింగ్, ప్రిడిక్టివ్ అనలిటిక్స్, డేటా సైన్స్ మరియు పెద్ద డేటా వంటి విభిన్న పదాల పరిణామం మరియు ప్రజాదరణను చూస్తున్నాను.


1. భాషలను నేర్చుకోవడం

డేటా మైనింగ్ కోసం అత్యంత ప్రాచుర్యం పొందిన భాషలు R, పైథాన్ మరియు SQL అని ఇటీవలి KDnuggets పోల్ కనుగొంది. ప్రతిదానికి చాలా వనరులు ఉన్నాయి, ఉదాహరణకు:

  • R తో డేటా సైన్స్ పై ఉచిత ఇ-బుక్
  • డేటా సైన్స్ కోసం పైథాన్‌తో ప్రారంభించడం
  • డేటా విశ్లేషణ కోసం పైథాన్: రియల్ వరల్డ్ డేటా కోసం చురుకైన సాధనాలు
  • ఒక అనివార్యమైన పైథాన్: డేటా సోర్సింగ్ టు డేటా సైన్స్
  • W3 పాఠశాలలు SQL నేర్చుకోవడం

2. సాధనాలు: డేటా మైనింగ్, డేటా సైన్స్ మరియు విజువలైజేషన్ సాఫ్ట్‌వేర్

వేర్వేరు పనుల కోసం చాలా డేటా మైనింగ్ సాధనాలు ఉన్నాయి, కాని డేటా విశ్లేషణ యొక్క మొత్తం ప్రక్రియకు మద్దతు ఇచ్చే డేటా మైనింగ్ సూట్‌ను ఎలా ఉపయోగించాలో నేర్చుకోవడం మంచిది. మీరు KNIME, RapidMiner మరియు Weka వంటి ఓపెన్ సోర్స్ (ఉచిత) సాధనాలతో ప్రారంభించవచ్చు.

అయినప్పటికీ, అనేక అనలిటిక్స్ ఉద్యోగాల కోసం మీరు ప్రముఖ వాణిజ్య సాధనం మరియు విస్తృతంగా ఉపయోగించబడే SAS ను తెలుసుకోవాలి. MATLAB, StatSoft STATISTICA, Microsoft SQL Server, Tableau, IBM SPSS మోడలర్ మరియు రాటిల్ ఇతర ప్రసిద్ధ విశ్లేషణలు మరియు డేటా మైనింగ్ సాఫ్ట్‌వేర్.


బగ్స్ లేవు, ఒత్తిడి లేదు - మీ జీవితాన్ని నాశనం చేయకుండా జీవితాన్ని మార్చే సాఫ్ట్‌వేర్‌ను రూపొందించడానికి స్టెప్ గైడ్ ద్వారా మీ దశ

సాఫ్ట్‌వేర్ నాణ్యత గురించి ఎవరూ పట్టించుకోనప్పుడు మీరు మీ ప్రోగ్రామింగ్ నైపుణ్యాలను మెరుగుపరచలేరు.

ఏదైనా డేటా విశ్లేషణలో విజువలైజేషన్ ఒక ముఖ్యమైన భాగం. మైక్రోసాఫ్ట్ ఎక్సెల్ (చాలా సరళమైన పనులకు మంచిది), R గ్రాఫిక్స్, (ముఖ్యంగా ggplot2) మరియు టేబులో - విజువలైజేషన్ కోసం ఒక అద్భుతమైన ప్యాకేజీని ఎలా ఉపయోగించాలో తెలుసుకోండి. ఇతర మంచి విజువలైజేషన్ సాధనాలు TIBCO స్పాట్‌ఫైర్ మరియు మినెర్ 3 డి.

3. పుస్తకాలు

అనేక డేటా మైనింగ్ మరియు డేటా సైన్స్ పుస్తకాలు అందుబాటులో ఉన్నాయి, కానీ మీరు వీటిని తనిఖీ చేయవచ్చు:

  • డేటా మైనింగ్ మరియు విశ్లేషణ: ఫండమెంటల్ కాన్సెప్ట్స్ అండ్ అల్గోరిథమ్స్, ఉచిత పిడిఎఫ్ డౌన్‌లోడ్ (డ్రాఫ్ట్), మొహమ్మద్ జాకీ మరియు వాగ్నెర్ మీరా జూనియర్ చేత.
  • డేటా మైనింగ్: ప్రాక్టికల్ మెషిన్ లెర్నింగ్ టూల్స్ అండ్ టెక్నిక్స్, ఇయాన్ విట్టెన్, ఈబే ఫ్రాంక్ మరియు మార్క్ హాల్, వీకా రచయితల నుండి, మరియు వెకాను ఉదాహరణలలో విస్తృతంగా ఉపయోగించడం
  • ట్రెవర్ హస్టీ, రాబర్ట్ టిబ్షిరాణి, జెరోమ్ ఫ్రైడ్మాన్ రచించిన ది ఎలిమెంట్స్ ఆఫ్ స్టాటిస్టికల్ లెర్నింగ్, డేటా మైనింగ్, ఇన్ఫెరెన్స్ అండ్ ప్రిడిక్షన్. గణితశాస్త్ర ఆధారిత గొప్ప పరిచయం
  • లయన్‌బుక్: రాబర్టో బట్టిటి మరియు మౌరో బ్రూనాటో రచించిన లెర్నింగ్ అండ్ ఇంటెలిజెంట్ ఆప్టిమైజేషన్, వెబ్‌లో ఉచితంగా లభిస్తుంది, అధ్యాయం వారీగా
  • మైనింగ్ ఆఫ్ భారీ డేటాసెట్స్ బుక్, ఎ. రాజరామన్, జె. ఉల్మాన్
  • స్టాట్‌సాఫ్ట్ ఎలక్ట్రానిక్ స్టాటిస్టిక్స్ పుస్తకం (ఉచిత), అనేక డేటా మైనింగ్ అంశాలను కలిగి ఉంది

4. విద్య: వెబ్‌నార్లు, కోర్సులు, సర్టిఫికెట్లు మరియు డిగ్రీలు

విశ్లేషణలు, పెద్ద డేటా, డేటా మైనింగ్ మరియు డేటా సైన్స్ వంటి తాజా అంశాలపై అనేక ఉచిత వెబ్‌నార్లు మరియు వెబ్‌కాస్ట్‌లను చూడటం ద్వారా మీరు ప్రారంభించవచ్చు.

చాలా ఆన్‌లైన్ కోర్సులు కూడా ఉన్నాయి, చిన్నవి మరియు పొడవైనవి, వాటిలో చాలా ఉచితం. (KDnuggets ఆన్‌లైన్ విద్య డైరెక్టరీ చూడండి.)

ముఖ్యంగా ఈ కోర్సులను తనిఖీ చేయండి:

  • మెషీన్ లెర్నింగ్, కోర్సెరాలో, ఆండ్రూ ఎన్.జి బోధించారు
  • కాల్టెక్ ప్రొఫెసర్ యాసర్ అబూ-మోస్టాఫా బోధించిన ఎడ్ఎక్స్ వద్ద డేటా నుండి నేర్చుకోవడం
  • సిరక్యూస్ ఐస్కూల్ నుండి అప్లైడ్ డేటా సైన్స్లో ఆన్‌లైన్ కోర్సును తెరవండి
  • వెకాతో డేటా మైనింగ్, ఉచిత ఆన్‌లైన్ కోర్సు
  • డేటా మైనింగ్‌లో సెమిస్టర్-పొడవు పరిచయ కోర్సు అయిన నా డేటా మైనింగ్ కోర్సు నుండి ఉచిత ఆన్‌లైన్ స్లైడ్‌లను కూడా తనిఖీ చేయండి

చివరగా, డేటా మైనింగ్, మరియు డేటా సైన్స్ లేదా డేటా సైన్స్ లో మాస్టర్స్ డిగ్రీ వంటి అడ్వాన్స్డ్ డిగ్రీలలో సర్టిఫికెట్లు పొందడం గురించి ఆలోచించండి.

5. డేటా

విశ్లేషించడానికి మీకు డేటా అవసరం - డేటా మైనింగ్ కోసం డేటాసెట్ల యొక్క KD నగ్గెట్స్ డైరెక్టరీని చూడండి, వీటిలో:

  • ప్రభుత్వం, సమాఖ్య, రాష్ట్రం, నగరం, స్థానిక మరియు పబ్లిక్ డేటా సైట్లు మరియు పోర్టల్స్
  • డేటా API లు, హబ్‌లు, మార్కెట్ ప్రదేశాలు, ప్లాట్‌ఫారమ్‌లు, పోర్టల్స్ మరియు సెర్చ్ ఇంజన్లు
  • ఉచిత పబ్లిక్ డేటాసెట్‌లు

6. పోటీలు

మళ్ళీ, మీరు చేయడం ద్వారా ఉత్తమంగా నేర్చుకుంటారు, కాబట్టి కాగ్లే పోటీలలో పాల్గొనండి. మెషిన్ లెర్నింగ్ ఉపయోగించి టైటానిక్ సర్వైవల్‌ను ic హించడం వంటి అనుభవశూన్యుడు పోటీలతో ప్రారంభించండి.

7. ఇంటరాక్ట్: సమావేశాలు, గుంపులు మరియు సోషల్ నెట్‌వర్క్‌లు

మీరు అనేక పీర్ గ్రూపులలో చేరవచ్చు. అనలిటిక్స్, బిగ్ డేటా, డేటా మైనింగ్ మరియు డేటా సైన్స్ కోసం టాప్ 30 లింక్డ్ఇన్ సమూహాలను చూడండి.

అనలిటిక్స్ బ్రిడ్జ్ అనలిటిక్స్ మరియు డేటా సైన్స్ కోసం చురుకైన సంఘం.

మీరు అనలిటిక్స్, బిగ్ డేటా, డేటా మైనింగ్, డేటా సైన్స్, & నాలెడ్జ్ డిస్కవరీపై అనేక సమావేశాలు మరియు సమావేశాలకు హాజరుకావచ్చు.

అలాగే, వార్షిక KDD సమావేశాన్ని నిర్వహించే ACM SIGKDD లో చేరడాన్ని పరిగణించండి - ఈ రంగంలో ప్రముఖ పరిశోధనా సమావేశం.

ఈ వ్యాసం KDNuggets.com నుండి రెల్లు. ఇది రచయిత అనుమతితో ఉపయోగించబడింది.