డేటా సైంటిస్ట్‌ను ఎలా పెంచుకోవాలి

రచయిత: Judy Howell
సృష్టి తేదీ: 26 జూలై 2021
నవీకరణ తేదీ: 21 జూన్ 2024
Anonim
డేటా సైంటిస్టుల అతి ముఖ్యమైన నైపుణ్యాలు | జోస్ మిగుల్ కాన్సాడో | TEDxIEMadrid
వీడియో: డేటా సైంటిస్టుల అతి ముఖ్యమైన నైపుణ్యాలు | జోస్ మిగుల్ కాన్సాడో | TEDxIEMadrid

విషయము


Takeaway:

డేటా శాస్త్రవేత్తలను పెంపొందించడానికి, కంపెనీలు సంస్కృతి మరియు సంస్థాగత నిర్మాణంపై ఎక్కువ దృష్టి పెట్టాలి.

టెక్నాలజీ స్టార్టప్‌లలో, డేటా సైంటిస్ట్ అనేది సాంప్రదాయకంగా డేటా ఇంటెలిజెన్స్ యొక్క ప్రత్యేకమైన క్రియాత్మక ప్రాంతాలను వంతెన చేయగల డేటా గీక్‌లను సూచించడానికి ఉపయోగించే సాధారణ పదం. డేటా సైంటిస్ట్ అంటే డేటా ఇంటెలిజెన్స్ ప్రాజెక్టుల యొక్క అనేక (అన్ని కాకపోయినా) అంశాలను నిర్వహించడం సౌకర్యంగా ఉంటుంది:

  1. డేటా సముపార్జన: ఇది సాంప్రదాయేతర డేటా వనరుల కోసం నిర్దిష్ట వెబ్ సేవలను లేదా API లను లక్ష్యంగా చేసుకునే కస్టమ్ పార్సర్‌లు మరియు వెబ్ క్రాలర్లు లేదా స్క్రిప్ట్‌లను వ్రాయడం అవసరం.
  2. డేటా మేనేజ్‌మెంట్: డేటాబేస్, కీ-వాల్యూ స్టోర్స్ లేదా హడూప్‌లో డేటాను ETL, మార్చండి, ప్రశ్నించండి మరియు నిర్వహించండి.
  3. సమాచార విజువలైజేషన్: ఫ్లాష్, జావాస్క్రిప్ట్ లేదా ప్రాసెసింగ్ ఆధారంగా స్టాటిక్ విజువలైజేషన్ టూల్‌కిట్లు మరియు / లేదా ఇంటరాక్టివ్ ప్లాట్‌ఫారమ్‌ల ద్వారా నమూనాలను వెలికి తీయడం.
  4. విశ్లేషణలు: ఇది మల్టీవియారిట్ స్టాటిస్టిక్స్, మెషిన్ లెర్నింగ్ మరియు ఎన్‌ఎల్‌పిలో సాధారణ నుండి సంక్లిష్టమైన పద్ధతుల వరకు ఉంటుంది.
  5. అంతర్దృష్టి: విస్తృత ప్రేక్షకులకు ముఖ్య ఫలితాలను సంగ్రహించండి, సంగ్రహించండి మరియు ప్రదర్శించండి.

అనేక సాధనాలు, నైపుణ్యాలు మరియు సాంకేతిక వివరాలు ఉన్నాయి మరియు పైన పేర్కొన్న ప్రతి అంశాలను మాస్టరింగ్ చేయడానికి సంవత్సరాలు గడపవచ్చు. డేటా సైంటిస్ట్ ఏ ప్రాంతాలలోనైనా నిజమైన నిపుణుల జ్ఞానాన్ని కలిగి ఉండకపోవచ్చు, అతను లేదా ఆమె సౌకర్యవంతంగా వెనుకకు వెనుకకు దాటవేయడం మరియు వాటిలో అన్నిటిలో ప్రాథమిక పనులను చేయడం. ఫలితం ఒక డేటా ప్రాజెక్ట్ను త్వరగా పరిశోధించడానికి మరియు నిర్వహణ నుండి (ఉన్నత-స్థాయి) ప్రశ్నలకు సమాధానాలు ఇవ్వడానికి సరిపోయే డేటా గీక్. (డేటా సైంటిస్ట్స్: ది న్యూ రాక్ స్టార్స్ ఆఫ్ ది టెక్ వరల్డ్ లోని డేటా సైంటిస్టుల గురించి మరింత చదవండి.)


డేటా శాస్త్రవేత్తలను పెంపొందించడానికి, కంపెనీలు సంస్కృతి మరియు సంస్థాగత నిర్మాణంపై ఎక్కువ దృష్టి పెట్టాలి. డేటా ఇంటెలిజెన్స్ యొక్క బహుళ రంగాలలో త్వరగా ఉత్పాదకత సాధించడానికి చాలా మంది డేటా వర్కర్లకు తగినంత నైపుణ్యాలు మరియు శిక్షణ ఉంది. సమస్య ఏమిటంటే చాలా మంది డేటా సైంటిస్టులుగా మారడానికి ప్రోత్సహించే వాతావరణంలో పనిచేయరు. వారు గొయ్యిలో చిక్కుకున్నారు మరియు డేటా ఇంటెలిజెన్స్ యొక్క ఒకటి లేదా రెండు ప్రాంతాలకు పరిమితం. తరచుగా, వారు వారి నిర్వాహకులు "ఆమోదించిన" సాధనాలను ఉపయోగించడానికి పరిమితం చేయబడతారు.

పెద్ద మరియు చిన్న సంస్థలలో పనిచేసిన తరువాత, డేటా శాస్త్రవేత్తలు ఎదుర్కొంటున్న ప్రధాన అడ్డంకి పనుల యొక్క కఠినమైన విభజన అని నాకు స్పష్టమైంది. డేటా విశ్లేషణ మరియు డేటా నిర్వహణ మధ్య విభజన చాలా సాధారణ అభివ్యక్తి. చాలా పెద్ద కంపెనీలలో, చాలా మంది విశ్లేషకులు / గణాంకవేత్తలు నియమించబడిన డేటా గిడ్డంగుల బృందం నుండి డేటా కోసం వేచి ఉండాలి మరియు చాలా సందర్భాలలో వారు వేర్వేరు డేటా గిడ్డంగుల యొక్క బహుళ యజమానుల నుండి డేటా కోసం వేచి ఉంటారు.

ఒక సంస్థలో డేటా సైన్స్ ను ఎలా ప్రోత్సహించాలి

ప్రస్తుతానికి, డేటా శాస్త్రవేత్తలు చిన్న స్టార్టప్‌లు, ఇంటర్నెట్ కంపెనీలు మరియు ఇతర సంస్థలలో అభివృద్ధి చెందుతారు, ఇక్కడ నిర్వచించిన పాత్రలు మరియు పనులకు తక్కువ ప్రాధాన్యత ఉంటుంది. పెద్ద మరియు పరిణతి చెందిన సంస్థలు సరదాగా చేరడానికి ఎటువంటి కారణం లేదు. (మీ గణాంకవేత్తలు సాధారణ వెబ్ స్క్రాపర్‌లను ఎలా వ్రాయాలో నేర్చుకోలేరు మరియు మీ డేటాబేస్ ప్రజలు సాధారణ గణాంకాలు మరియు విజువలైజేషన్‌ను ఎందుకు నేర్చుకోలేరు అనే దానికి కారణం లేదు.) ఇది ఎలా చేయాలో ఇక్కడ కొన్ని సూచనలు ఉన్నాయి:


డేటా శాస్త్రవేత్తల బృందాన్ని ఏర్పాటు చేయడానికి మీరు కట్టుబడి ఉంటే, ప్రొఫైల్‌కు సరిపోయే ప్రస్తుత ఉద్యోగులను గుర్తించడం ద్వారా మీరు ప్రారంభించవచ్చు. వారు ఓపెన్ మైండెడ్, టీమ్ ఓరియెంటెడ్, మరియు పైన వివరించిన ప్రాంతాలలో ఒకదానిలో కొన్ని ప్రోగ్రామింగ్ నైపుణ్యాలను కలిగి ఉండాలి. ఆదర్శవంతంగా మీరు కంప్యూటర్ సైన్స్, స్టాటిస్టిక్స్ / క్వాంటిటేటివ్ లేదా డేటా-ఓరియెంటెడ్ నేపథ్యాల వ్యక్తుల మిశ్రమాన్ని కలిగి ఉంటారు. సరళమైన ఉపకరణాలు, హక్స్ మరియు పద్ధతులను ఒకదానితో ఒకటి పంచుకోవడానికి జట్టు సభ్యులు సిద్ధంగా ఉండాలి. జట్టు సభ్యులు ఒకరినొకరు నేర్చుకోవడం పట్ల ఉత్సాహంగా ఉంటే క్రాస్ ఫెర్టిలైజేషన్ సహజంగా జరుగుతుంది. పద్ధతులు, సాధనాలు మరియు ఆలోచనలను పంచుకోవడానికి ఇష్టపడని ఉద్యోగులు పురోగతికి ఆటంకం కలిగిస్తారు.

సాఫ్ట్‌వేర్ నాణ్యత గురించి ఎవరూ పట్టించుకోనప్పుడు మీరు మీ ప్రోగ్రామింగ్ నైపుణ్యాలను మెరుగుపరచలేరు.

క్రొత్త డేటా వనరులతో జట్టు ఆడుతున్న నిర్వాహకులు కొరడాతో కొట్టిన తర్వాత, వారు అడ్డంకులు పెట్టడానికి ప్రయత్నించవచ్చు ("డేటా సమగ్రత గురించి ఏమిటి? వారు సరైన యంత్ర అభ్యాస / గణాంక పద్ధతులను ఉపయోగించడం లేదు! ప్రయోగాత్మక రూపకల్పన తప్పు! వారు ఎలా చేయగలరు? మా డేటాతో కలపాలా? "). రాజకీయ మద్దతు లేకుండా, మీ డేటా శాస్త్రవేత్తల బృందం (స్నేహపూర్వక) అగ్నిని ఎదుర్కోబోతోంది. క్రొత్త విషయాలు బెదిరింపులుగా గుర్తించబడతాయి, కాబట్టి డేటా శాస్త్రవేత్తలు వారు చేసే పనులను పూర్తి చేస్తారని నిర్వాహకులకు త్వరగా భరోసా ఇవ్వడం మంచిది. మీ చిన్న డేటా శాస్త్రవేత్తల బృందం కనుగొన్న అంతర్దృష్టులను మరింత అధికారిక డేటా / విశ్లేషణాత్మక ప్రాజెక్టులకు తెలియజేయడానికి ఉపయోగించవచ్చు. డేటా శాస్త్రవేత్తలు గణాంకవేత్తల అవసరాన్ని తొలగించబోతున్నారు, కాని వారు వాటిని వేర్వేరు డేటా సెట్లు మరియు ప్రశ్నల వైపు చూపవచ్చు.

డేటా సైంటిస్టుల మీ ప్రారంభ బృందాన్ని సువార్తికులుగా ఉపయోగించండి

మీరు మీ ప్రారంభ డేటా శాస్త్రవేత్తల బృందాన్ని సరిగ్గా ఎంచుకుంటే, వారు మీ ఫలితాలను మీ కంపెనీలోని ఇతరులకు ప్రదర్శించడం సౌకర్యంగా ఉండాలి. ఇంకా మంచిది, వారు దాని గురించి ఉత్సాహంగా ఉంటారు! మిగిలిన కంపెనీ డేటా ఇంటెలిజెన్స్‌ను ఎలా చూస్తుందో ప్రభావితం చేయడానికి మరియు నెమ్మదిగా ఆ గోతులు పడగొట్టడానికి వాటిని ఉపయోగించండి.

మీరు డేటా శాస్త్రవేత్తల యొక్క మీ బృందాన్ని ఏర్పాటు చేస్తున్నప్పుడు కొత్త శిక్షణ మరియు సంస్థ సాధనాలు చివరికి అవసరం లేదని నేను అనడం లేదు. సాంస్కృతిక మరియు సంస్థాగత నిర్మాణాలను పరిష్కరించడం ద్వారా, చాలా కంపెనీలు తమ సొంత ఉద్యోగులను ఉచిత సాధనాలతో పాటు, డేటా శాస్త్రవేత్తల యొక్క చిన్న బృందానికి విత్తనం చేయవచ్చని నేను భావిస్తున్నాను. నేను అనుభవం నుండి మాట్లాడుతున్నాను, పెద్ద కంపెనీల కోసం పనిచేశాను - ప్రతిభ ఉంది మరియు పద్ధతులు నేర్చుకోవడం చాలా కష్టం కాదు, కాని సంస్థాగత గోతులు అధిగమించడం కష్టం. వారి ర్యాంకుల్లో ఇప్పటికే ప్రకాశించటానికి సిద్ధంగా ఉన్న ప్రతిభావంతులు ఉన్నారు, కాకపోతే వారు చేయగలిగే వాటిని పరిమితం చేసే కఠినమైన కార్పొరేట్ నిర్మాణాల కోసం.


Http://practicalquant.blogspot.ca మరియు బెన్ లోరికా నుండి అనుమతితో తిరిగి ప్రచురించబడింది. అసలు కథనాన్ని ఇక్కడ చూడవచ్చు: http://practicalquant.blogspot.ca/2010/07/how-to-nurture-data-scientists.html