![డేటా సైంటిస్టుల అతి ముఖ్యమైన నైపుణ్యాలు | జోస్ మిగుల్ కాన్సాడో | TEDxIEMadrid](https://i.ytimg.com/vi/qrhRfPY4F4w/hqdefault.jpg)
విషయము
- ఒక సంస్థలో డేటా సైన్స్ ను ఎలా ప్రోత్సహించాలి
- డేటా సైంటిస్టుల మీ ప్రారంభ బృందాన్ని సువార్తికులుగా ఉపయోగించండి
Takeaway:
డేటా శాస్త్రవేత్తలను పెంపొందించడానికి, కంపెనీలు సంస్కృతి మరియు సంస్థాగత నిర్మాణంపై ఎక్కువ దృష్టి పెట్టాలి.
టెక్నాలజీ స్టార్టప్లలో, డేటా సైంటిస్ట్ అనేది సాంప్రదాయకంగా డేటా ఇంటెలిజెన్స్ యొక్క ప్రత్యేకమైన క్రియాత్మక ప్రాంతాలను వంతెన చేయగల డేటా గీక్లను సూచించడానికి ఉపయోగించే సాధారణ పదం. డేటా సైంటిస్ట్ అంటే డేటా ఇంటెలిజెన్స్ ప్రాజెక్టుల యొక్క అనేక (అన్ని కాకపోయినా) అంశాలను నిర్వహించడం సౌకర్యంగా ఉంటుంది:
- డేటా సముపార్జన: ఇది సాంప్రదాయేతర డేటా వనరుల కోసం నిర్దిష్ట వెబ్ సేవలను లేదా API లను లక్ష్యంగా చేసుకునే కస్టమ్ పార్సర్లు మరియు వెబ్ క్రాలర్లు లేదా స్క్రిప్ట్లను వ్రాయడం అవసరం.
- డేటా మేనేజ్మెంట్: డేటాబేస్, కీ-వాల్యూ స్టోర్స్ లేదా హడూప్లో డేటాను ETL, మార్చండి, ప్రశ్నించండి మరియు నిర్వహించండి.
- సమాచార విజువలైజేషన్: ఫ్లాష్, జావాస్క్రిప్ట్ లేదా ప్రాసెసింగ్ ఆధారంగా స్టాటిక్ విజువలైజేషన్ టూల్కిట్లు మరియు / లేదా ఇంటరాక్టివ్ ప్లాట్ఫారమ్ల ద్వారా నమూనాలను వెలికి తీయడం.
- విశ్లేషణలు: ఇది మల్టీవియారిట్ స్టాటిస్టిక్స్, మెషిన్ లెర్నింగ్ మరియు ఎన్ఎల్పిలో సాధారణ నుండి సంక్లిష్టమైన పద్ధతుల వరకు ఉంటుంది.
- అంతర్దృష్టి: విస్తృత ప్రేక్షకులకు ముఖ్య ఫలితాలను సంగ్రహించండి, సంగ్రహించండి మరియు ప్రదర్శించండి.
అనేక సాధనాలు, నైపుణ్యాలు మరియు సాంకేతిక వివరాలు ఉన్నాయి మరియు పైన పేర్కొన్న ప్రతి అంశాలను మాస్టరింగ్ చేయడానికి సంవత్సరాలు గడపవచ్చు. డేటా సైంటిస్ట్ ఏ ప్రాంతాలలోనైనా నిజమైన నిపుణుల జ్ఞానాన్ని కలిగి ఉండకపోవచ్చు, అతను లేదా ఆమె సౌకర్యవంతంగా వెనుకకు వెనుకకు దాటవేయడం మరియు వాటిలో అన్నిటిలో ప్రాథమిక పనులను చేయడం. ఫలితం ఒక డేటా ప్రాజెక్ట్ను త్వరగా పరిశోధించడానికి మరియు నిర్వహణ నుండి (ఉన్నత-స్థాయి) ప్రశ్నలకు సమాధానాలు ఇవ్వడానికి సరిపోయే డేటా గీక్. (డేటా సైంటిస్ట్స్: ది న్యూ రాక్ స్టార్స్ ఆఫ్ ది టెక్ వరల్డ్ లోని డేటా సైంటిస్టుల గురించి మరింత చదవండి.)
డేటా శాస్త్రవేత్తలను పెంపొందించడానికి, కంపెనీలు సంస్కృతి మరియు సంస్థాగత నిర్మాణంపై ఎక్కువ దృష్టి పెట్టాలి. డేటా ఇంటెలిజెన్స్ యొక్క బహుళ రంగాలలో త్వరగా ఉత్పాదకత సాధించడానికి చాలా మంది డేటా వర్కర్లకు తగినంత నైపుణ్యాలు మరియు శిక్షణ ఉంది. సమస్య ఏమిటంటే చాలా మంది డేటా సైంటిస్టులుగా మారడానికి ప్రోత్సహించే వాతావరణంలో పనిచేయరు. వారు గొయ్యిలో చిక్కుకున్నారు మరియు డేటా ఇంటెలిజెన్స్ యొక్క ఒకటి లేదా రెండు ప్రాంతాలకు పరిమితం. తరచుగా, వారు వారి నిర్వాహకులు "ఆమోదించిన" సాధనాలను ఉపయోగించడానికి పరిమితం చేయబడతారు.
పెద్ద మరియు చిన్న సంస్థలలో పనిచేసిన తరువాత, డేటా శాస్త్రవేత్తలు ఎదుర్కొంటున్న ప్రధాన అడ్డంకి పనుల యొక్క కఠినమైన విభజన అని నాకు స్పష్టమైంది. డేటా విశ్లేషణ మరియు డేటా నిర్వహణ మధ్య విభజన చాలా సాధారణ అభివ్యక్తి. చాలా పెద్ద కంపెనీలలో, చాలా మంది విశ్లేషకులు / గణాంకవేత్తలు నియమించబడిన డేటా గిడ్డంగుల బృందం నుండి డేటా కోసం వేచి ఉండాలి మరియు చాలా సందర్భాలలో వారు వేర్వేరు డేటా గిడ్డంగుల యొక్క బహుళ యజమానుల నుండి డేటా కోసం వేచి ఉంటారు.
ఒక సంస్థలో డేటా సైన్స్ ను ఎలా ప్రోత్సహించాలి
ప్రస్తుతానికి, డేటా శాస్త్రవేత్తలు చిన్న స్టార్టప్లు, ఇంటర్నెట్ కంపెనీలు మరియు ఇతర సంస్థలలో అభివృద్ధి చెందుతారు, ఇక్కడ నిర్వచించిన పాత్రలు మరియు పనులకు తక్కువ ప్రాధాన్యత ఉంటుంది. పెద్ద మరియు పరిణతి చెందిన సంస్థలు సరదాగా చేరడానికి ఎటువంటి కారణం లేదు. (మీ గణాంకవేత్తలు సాధారణ వెబ్ స్క్రాపర్లను ఎలా వ్రాయాలో నేర్చుకోలేరు మరియు మీ డేటాబేస్ ప్రజలు సాధారణ గణాంకాలు మరియు విజువలైజేషన్ను ఎందుకు నేర్చుకోలేరు అనే దానికి కారణం లేదు.) ఇది ఎలా చేయాలో ఇక్కడ కొన్ని సూచనలు ఉన్నాయి:
డేటా శాస్త్రవేత్తల బృందాన్ని ఏర్పాటు చేయడానికి మీరు కట్టుబడి ఉంటే, ప్రొఫైల్కు సరిపోయే ప్రస్తుత ఉద్యోగులను గుర్తించడం ద్వారా మీరు ప్రారంభించవచ్చు. వారు ఓపెన్ మైండెడ్, టీమ్ ఓరియెంటెడ్, మరియు పైన వివరించిన ప్రాంతాలలో ఒకదానిలో కొన్ని ప్రోగ్రామింగ్ నైపుణ్యాలను కలిగి ఉండాలి. ఆదర్శవంతంగా మీరు కంప్యూటర్ సైన్స్, స్టాటిస్టిక్స్ / క్వాంటిటేటివ్ లేదా డేటా-ఓరియెంటెడ్ నేపథ్యాల వ్యక్తుల మిశ్రమాన్ని కలిగి ఉంటారు. సరళమైన ఉపకరణాలు, హక్స్ మరియు పద్ధతులను ఒకదానితో ఒకటి పంచుకోవడానికి జట్టు సభ్యులు సిద్ధంగా ఉండాలి. జట్టు సభ్యులు ఒకరినొకరు నేర్చుకోవడం పట్ల ఉత్సాహంగా ఉంటే క్రాస్ ఫెర్టిలైజేషన్ సహజంగా జరుగుతుంది. పద్ధతులు, సాధనాలు మరియు ఆలోచనలను పంచుకోవడానికి ఇష్టపడని ఉద్యోగులు పురోగతికి ఆటంకం కలిగిస్తారు.
సాఫ్ట్వేర్ నాణ్యత గురించి ఎవరూ పట్టించుకోనప్పుడు మీరు మీ ప్రోగ్రామింగ్ నైపుణ్యాలను మెరుగుపరచలేరు.
క్రొత్త డేటా వనరులతో జట్టు ఆడుతున్న నిర్వాహకులు కొరడాతో కొట్టిన తర్వాత, వారు అడ్డంకులు పెట్టడానికి ప్రయత్నించవచ్చు ("డేటా సమగ్రత గురించి ఏమిటి? వారు సరైన యంత్ర అభ్యాస / గణాంక పద్ధతులను ఉపయోగించడం లేదు! ప్రయోగాత్మక రూపకల్పన తప్పు! వారు ఎలా చేయగలరు? మా డేటాతో కలపాలా? "). రాజకీయ మద్దతు లేకుండా, మీ డేటా శాస్త్రవేత్తల బృందం (స్నేహపూర్వక) అగ్నిని ఎదుర్కోబోతోంది. క్రొత్త విషయాలు బెదిరింపులుగా గుర్తించబడతాయి, కాబట్టి డేటా శాస్త్రవేత్తలు వారు చేసే పనులను పూర్తి చేస్తారని నిర్వాహకులకు త్వరగా భరోసా ఇవ్వడం మంచిది. మీ చిన్న డేటా శాస్త్రవేత్తల బృందం కనుగొన్న అంతర్దృష్టులను మరింత అధికారిక డేటా / విశ్లేషణాత్మక ప్రాజెక్టులకు తెలియజేయడానికి ఉపయోగించవచ్చు. డేటా శాస్త్రవేత్తలు గణాంకవేత్తల అవసరాన్ని తొలగించబోతున్నారు, కాని వారు వాటిని వేర్వేరు డేటా సెట్లు మరియు ప్రశ్నల వైపు చూపవచ్చు.
డేటా సైంటిస్టుల మీ ప్రారంభ బృందాన్ని సువార్తికులుగా ఉపయోగించండి
మీరు మీ ప్రారంభ డేటా శాస్త్రవేత్తల బృందాన్ని సరిగ్గా ఎంచుకుంటే, వారు మీ ఫలితాలను మీ కంపెనీలోని ఇతరులకు ప్రదర్శించడం సౌకర్యంగా ఉండాలి. ఇంకా మంచిది, వారు దాని గురించి ఉత్సాహంగా ఉంటారు! మిగిలిన కంపెనీ డేటా ఇంటెలిజెన్స్ను ఎలా చూస్తుందో ప్రభావితం చేయడానికి మరియు నెమ్మదిగా ఆ గోతులు పడగొట్టడానికి వాటిని ఉపయోగించండి.
మీరు డేటా శాస్త్రవేత్తల యొక్క మీ బృందాన్ని ఏర్పాటు చేస్తున్నప్పుడు కొత్త శిక్షణ మరియు సంస్థ సాధనాలు చివరికి అవసరం లేదని నేను అనడం లేదు. సాంస్కృతిక మరియు సంస్థాగత నిర్మాణాలను పరిష్కరించడం ద్వారా, చాలా కంపెనీలు తమ సొంత ఉద్యోగులను ఉచిత సాధనాలతో పాటు, డేటా శాస్త్రవేత్తల యొక్క చిన్న బృందానికి విత్తనం చేయవచ్చని నేను భావిస్తున్నాను. నేను అనుభవం నుండి మాట్లాడుతున్నాను, పెద్ద కంపెనీల కోసం పనిచేశాను - ప్రతిభ ఉంది మరియు పద్ధతులు నేర్చుకోవడం చాలా కష్టం కాదు, కాని సంస్థాగత గోతులు అధిగమించడం కష్టం. వారి ర్యాంకుల్లో ఇప్పటికే ప్రకాశించటానికి సిద్ధంగా ఉన్న ప్రతిభావంతులు ఉన్నారు, కాకపోతే వారు చేయగలిగే వాటిని పరిమితం చేసే కఠినమైన కార్పొరేట్ నిర్మాణాల కోసం.
Http://practicalquant.blogspot.ca మరియు బెన్ లోరికా నుండి అనుమతితో తిరిగి ప్రచురించబడింది. అసలు కథనాన్ని ఇక్కడ చూడవచ్చు: http://practicalquant.blogspot.ca/2010/07/how-to-nurture-data-scientists.html