సూచన యొక్క శక్తి: డేటా కేటలాగ్ విశ్లేషకులను ఎలా శక్తివంతం చేస్తుంది

రచయిత: Lewis Jackson
సృష్టి తేదీ: 11 మే 2021
నవీకరణ తేదీ: 1 జూలై 2024
Anonim
డిమాండ్ అంచనా: భవిష్యత్తు కోసం ప్లాన్ చేయడానికి ప్రిడిక్టివ్ అనలిటిక్స్ ఎలా సహాయపడుతుంది
వీడియో: డిమాండ్ అంచనా: భవిష్యత్తు కోసం ప్లాన్ చేయడానికి ప్రిడిక్టివ్ అనలిటిక్స్ ఎలా సహాయపడుతుంది

Takeaway: హోస్ట్ రెబెక్కా జోజ్వియాక్ డేటా కేటలాగ్ల యొక్క ప్రయోజనాలను డెజ్ బ్లాంచ్ఫీల్డ్, రాబిన్ బ్లూర్ మరియు డేవిడ్ క్రాఫోర్డ్‌తో చర్చిస్తారు.




వీడియోను చూడటానికి మీరు ఈ ఈవెంట్ కోసం నమోదు చేసుకోవాలి. వీడియో చూడటానికి నమోదు చేయండి.

రెబెకా జోజ్వియాక్: లేడీస్ అండ్ జెంటిల్మెన్, హలో మరియు 2016 యొక్క హాట్ టెక్నాలజీస్ కు స్వాగతం. ఈ రోజు మనకు లభించింది, “సూచనల శక్తి: డేటా కాటలాగ్ విశ్లేషకులను ఎలా శక్తివంతం చేస్తుంది.” నేను మీ హోస్ట్ రెబెకా జోజ్వియాక్, ఈ రోజు మా సాధారణ హోస్ట్ ఎరిక్ కవనాగ్ కోసం నింపాను. ప్రపంచాన్ని పర్యటిస్తోంది, కాబట్టి మాతో చేరినందుకు ధన్యవాదాలు. ఈ సంవత్సరం వేడిగా ఉంది, నేను ఉన్న టెక్సాస్‌లో ఇది వేడిగా లేదు, కానీ అన్ని చోట్ల వేడిగా ఉంది. అన్ని రకాల కొత్త టెక్నాలజీల పేలుడు బయటకు వస్తోంది. మేము IoT, స్ట్రీమింగ్ డేటా, క్లౌడ్ స్వీకరణను పొందాము, హడూప్ పరిపక్వం చెందుతూనే ఉంది. మాకు ఆటోమేషన్, మెషీన్ లెర్నింగ్ ఉన్నాయి మరియు ఈ విషయాలన్నీ డేటా ద్వారా అండర్లైన్ చేయబడ్డాయి. మరియు ఎంటర్ప్రైజెస్ రోజుకు మరింత డేటాగా మారుతున్నాయి. వాస్తవానికి, జ్ఞానం మరియు ఆవిష్కరణకు దారితీసే పాయింట్ మరియు మీకు తెలిసిన, మంచి నిర్ణయాలు తీసుకోండి. కానీ డేటా నుండి నిజంగా ఎక్కువ విలువను పొందడానికి, దాన్ని పొందడం సులభం. మీరు దాన్ని లాక్ చేసి ఉంచినా, ఖననం చేసినా, లేదా ఎంటర్ప్రైజ్‌లోని కొద్ది మంది వ్యక్తుల మెదడులో ఉంచినా, అది మొత్తం సంస్థకు పెద్దగా చేయదు.


నేను డేటా కేటలాగింగ్ మరియు లైబ్రరీల కోర్సు గురించి ఆలోచిస్తున్నాను, చాలా కాలం క్రితం మీరు ఎక్కడైనా వెతకాలి, మీరు ఏదైనా కనుగొనవలసి వస్తే, మీరు ఒక అంశంపై పరిశోధన చేయాల్సిన అవసరం ఉంటే, లేదా కొంత సమాచారాన్ని వెతకాలి, మీరు లైబ్రరీకి వెళ్లారు , మరియు మీరు కార్డ్ కేటలాగ్ లేదా అక్కడ పనిచేసిన క్రాబీ లేడీకి వెళ్లారు. మీరు చుట్టూ చూడాలనుకుంటే, మరియు మీరు చక్కగా ఏదైనా కనుగొనగలరని ఖచ్చితంగా అనుకుంటే, మీకు తెలియని కొన్ని ఆసక్తికరమైన విషయాలను మీరు కనుగొనవచ్చు, కానీ మీరు నిజంగా ఏదో కనుగొనవలసి ఉంటే, మరియు మీరు వెతుకుతున్నది మీకు తెలుసు, మీకు కార్డ్ కేటలాగ్ అవసరం, మరియు ఎంటర్ప్రైజ్ సమానమైన డేటా కేటలాగ్, ఇది మా వినియోగదారులకు సుసంపన్నం చేయడానికి, కనుగొనటానికి, పంచుకునేందుకు, వినియోగించడానికి మరియు నిజంగా ప్రజలకు సహాయపడటానికి అన్ని డేటాపై కాంతిని ప్రకాశవంతం చేయడంలో సహాయపడుతుంది. డేటాకు వేగంగా మరియు సులభంగా.

కాబట్టి ఈ రోజు మనకు డెజ్ బ్లాంచ్ఫీల్డ్, మా స్వంత డేటా సైంటిస్ట్, మరియు మనకు డాక్టర్ రాబిన్ బ్లూర్ ఉన్నారు, మా స్వంత చీఫ్ అనలిస్ట్, మేము డేవిడ్ క్రాఫోర్డ్ ను అలేషన్ నుండి పొందాము, అతను తన కంపెనీ డేటా కేటలాగింగ్ కథ గురించి మాట్లాడబోతున్నాడు, కాని మొదట మేము వెళ్తున్నాము డెజ్తో ముందుకు సాగడానికి. డెజ్, నేను బంతిని మీ వద్దకు పంపుతున్నాను మరియు నేల మీదే.


డెజ్ బ్లాంచ్ఫీల్డ్: ధన్యవాదాలు, ఈ రోజు నన్ను కలిగి ఉన్నందుకు ధన్యవాదాలు. ఇది నాకు చాలా ఆసక్తి ఉన్న విషయం, ఎందుకంటే నా రోజువారీ పనిలో నేను చూసే ప్రతి సంస్థ, ప్రీ-షో పరిహాసంలో మేము చాలా క్లుప్తంగా మాట్లాడిన అదే సమస్యను నేను కనుగొన్నాను, మరియు అది కొన్ని సంవత్సరాలకు పైగా వ్యాపారంలో ఉన్న చాలా సంస్థలు సంస్థ, వివిధ ఆకృతుల చుట్టూ ఖననం చేయబడిన అనేక డేటాను కలిగి ఉన్నాయి మరియు వాస్తవానికి నాకు లోటస్ నోట్స్‌కు తిరిగి వెళ్ళే డేటా సెట్‌లను కలిగి ఉన్న క్లయింట్లు ఉన్నారు, కొన్ని డేటాబేస్లు ఇప్పటికీ నడుస్తున్నాయి కేసులు వారి నకిలీ ఇంటర్‌నెట్‌లు, మరియు అవి, వాస్తవానికి వారి డేటా ఎక్కడ ఉందో, మరియు దానికి ఎలా ప్రాప్యత పొందాలి, ఎవరికి ప్రాప్యతను అందించాలి, ఎప్పుడు వాటికి ప్రాప్యతను అందించాలి మరియు ఎలా పొందాలో ఈ సవాలులో పడ్డారు. కేటలాగ్ మరియు ప్రతి ఒక్కరూ చేయగలిగే ప్రదేశానికి ఎలా చేరుకోవాలి: ఎ) అక్కడ ఏమి ఉంది మరియు దానిలో ఏముందో తెలుసుకోండి మరియు బి), దానికి ప్రాప్యత ఎలా పొందాలో మరియు ఎలా ఉపయోగించాలో తెలుసుకోండి. కోర్సు యొక్క అతిపెద్ద సవాళ్ళలో ఒకటి దానిని కనుగొనడం, మరొక పెద్ద సవాలు ఏమిటంటే అక్కడ ఏమి ఉందో మరియు దానిని ఎలా యాక్సెస్ చేయాలో తెలుసుకోవడం.

నేను డజన్ల కొద్దీ డేటాబేస్లను పొందానని నాకు బాగా తెలుసు, కాని వాస్తవానికి అక్కడ ఏమి ఉందో లేదా అక్కడ ఉన్నదాన్ని ఎలా కనుగొనాలో నాకు తెలియదు, మరియు ప్రీ-షో డేటాలో మేము ఇప్పుడు కనుగొన్నప్పుడు, మీరు నడవడానికి మొగ్గు చూపుతారు. ఆఫీసు చుట్టూ మరియు ప్రశ్నలు అడగండి మరియు క్యూబికల్ గోడల మీదుగా అరుస్తూ ప్రయత్నించండి మరియు గుర్తించండి, తరచుగా నా అనుభవం ఏమిటంటే, మీరు ముందు డెస్క్, రిసెప్షన్, మరియు మీరు ఎవరో మీకు తెలుసా అని అడుగుతున్నారా? నేను మాట్లాడటానికి వెళ్తున్నాను. చాలా తరచుగా, ఇది ఎల్లప్పుడూ ఐటి జానపద కాదు ఎందుకంటే వారు డేటా సెట్ గురించి తెలియదు ఎందుకంటే ఎవరో దీనిని సృష్టించారు, మరియు ఇది చాలా సరళంగా ఉంటుంది - చాలా తరచుగా మేము ఐటి వాతావరణంలో నిలబడి ఉండే ఒక విధమైన ప్రాజెక్ట్ను కనుగొంటాము మరియు ప్రాజెక్ట్ మేనేజర్ అన్ని విషయాల స్ప్రెడ్‌షీట్‌ను ఉపయోగించారు, మరియు ఇది ఆస్తులు మరియు కాన్ మరియు పేర్ల చుట్టూ కొంత విలువైన సమాచారాన్ని సంపాదించింది మరియు మీకు ఆ ప్రాజెక్ట్ తెలియకపోతే మరియు ఆ వ్యక్తి మీకు తెలియకపోతే, మీరు ఆ సమాచారాన్ని కనుగొనలేరు. ఇది అందుబాటులో లేదు మరియు మీరు ఆ అసలు ఫైల్‌ను పట్టుకోవాలి.

డేటాకు సంబంధించి పరివర్తన చెందిన ఒక పదబంధం ఉంది మరియు నేను తప్పనిసరిగా దానితో ఏకీభవించను, కాని ఇది ఒక అందమైన చిన్న త్రోవే అని నేను అనుకుంటున్నాను మరియు కొంత మంది ప్రజలు డేటా కొత్త నూనె అని అనుకుంటారు, మరియు నేను ఖచ్చితంగా కొన్ని అంశాలలో, ఈ రోజు తరువాత దానిని కవర్ చేయబోతున్నాను. నేను గమనించినది, ఖచ్చితంగా ఆ పరివర్తనలో భాగం కావడం, వారి డేటాను విలువైనదిగా నేర్చుకున్న వ్యాపార సంస్థలు వారి పోటీదారులపై గణనీయమైన ప్రయోజనాన్ని పొందాయి.

ఐదు లేదా ఆరు సంవత్సరాల క్రితం ఐబిఎమ్ చేత ఒక ఆసక్తికరమైన కాగితం ఉంది, మరియు వారు ఇక్కడ ఆస్ట్రేలియాలో సుమారు 4,000 కంపెనీలను సర్వే చేసారు, మరియు వారు మొత్తం సమాచారం, అన్ని పనితీరు డేటా, అన్ని ఫైనాన్స్ డేటాను తీసుకొని మరిగే కుండలో ఉంచారు. దీనిని ఆస్ట్రేలియన్ స్కూల్ ఆఫ్ ఎకనామిక్స్కు పంపారు, మరియు వారు వాస్తవానికి ఇక్కడ ఒక సాధారణ ధోరణిని ప్రారంభించారు, మరియు సాంకేతిక పరిజ్ఞానాన్ని సాధించిన కంపెనీలు తమ తోటివారిపై మరియు పోటీదారులపై పోటీ పోటీని పొందాయి, వారి పోటీదారులు ఎప్పుడూ కలుసుకోరు, మరియు నేను అనుకుంటున్నాను ప్రజలు డిజిటల్ పరివర్తన అని పిలవడాన్ని మేము చూసిన డేటాతో ఇప్పుడు చాలా పరిస్థితి ఉంది, ఇక్కడ వారు పొందిన డేటాను ఎలా కనుగొనాలో, ఆ డేటాను అందుబాటులో ఉంచడానికి మరియు చాలా తేలికగా వినియోగించే వాటిలో అందుబాటులో ఉంచే సంస్థలు స్పష్టంగా కనుగొన్న సంస్థలు సంస్థకు ఫ్యాషన్, సంస్థకు ఎందుకు అవసరమో ఎల్లప్పుడూ తెలియకుండానే, మరియు పోటీదారులపై గణనీయమైన ప్రయోజనాన్ని పొందండి.

ఈ స్లయిడ్‌లో నాకు కొన్ని ఉదాహరణలు ఉన్నాయి, మీరు చూడగలరు. నా దృష్టిలో, దాదాపు ప్రతి పరిశ్రమ రంగంలో పెద్ద ఎత్తున అంతరాయం, నా దృష్టిలో, డేటా ద్వారా నడపబడుతోంది, మరియు ప్రస్తుత పోకడలు ఏమైనా ఉంటే, నా అభిప్రాయం ఏమిటంటే మనం నిజంగా సంపాదించాము ప్రారంభమైంది ఎందుకంటే దీర్ఘకాల బ్రాండ్లు చివరకు దీని అర్థం ఏమిటో మేల్కొని ఆటలోకి ప్రవేశించినప్పుడు, వారు టోకు వద్ద ఆటలోకి ప్రవేశించబోతున్నారు. డేటా పర్వతాలను కలిగి ఉన్న ప్రధాన రిటైలర్లు డేటాపై కొంత చారిత్రక విశ్లేషణను వర్తింపజేయడం ప్రారంభించినప్పుడు, అది ఉనికిలో ఉందని వారికి తెలిస్తే, అప్పుడు కొంతమంది ఆన్‌లైన్ ప్లేయర్‌లు కొంచెం మేల్కొలుపు కాల్‌ను పొందబోతున్నారు.

కానీ ఈ బ్రాండ్లలో చాలా వరకు, ప్రపంచంలోని అతిపెద్ద టాక్సీ సంస్థ అయిన ఉబెర్ మాకు లభించిందని నా ఉద్దేశ్యం. వారు ఏ టాక్సీలను కలిగి లేరు, కాబట్టి వాటిని మాయాజాలం చేస్తుంది, వారి డేటా ఏమిటి? Airbnb, అతిపెద్ద వసతి ప్రదాత, మాకు ప్రపంచంలోనే అతిపెద్ద ఫోన్ సంస్థ అయిన WeChat వచ్చింది, కాని వారికి అసలు మౌలిక సదుపాయాలు లేవు మరియు హ్యాండ్‌సెట్‌లు లేవు, ఫోన్ లైన్లు లేవు. అలీబాబా, గ్రహం మీద అతిపెద్ద చిల్లర, కానీ వారు ఏ జాబితాను కలిగి లేరు. , పదం లో అతిపెద్ద మీడియా సంస్థ. చివరి లెక్కలో వారు ఇప్పుడు 1.4 బిలియన్ యాక్టివ్ డేటా యూజర్లను కలిగి ఉన్నారని నేను అనుకుంటున్నాను, ఇది మనస్సును కదిలించే సంఖ్య. ఇది ఎక్కడా సమీపంలో లేదు - గ్రహం యొక్క పావు వంతు వాస్తవానికి ప్రతిరోజూ అక్కడ ఉందని ఎవరైనా వాదించారని నేను అనుకుంటున్నాను, ఇంకా ఇక్కడ కంటెంట్ ప్రొవైడర్ వాస్తవానికి కంటెంట్‌ను సృష్టించలేదు, వారు అందించే మొత్తం డేటా వారిచే సృష్టించబడలేదు, ఇది వారిచే సృష్టించబడింది చందాదారులు మరియు ఈ మోడల్ మనందరికీ తెలుసు.

సొసైటీఒన్, ఇది మీరు స్థానిక బ్రాండ్, కొన్ని దేశాలలో ఇది పీర్-టు-పీర్ రుణాలు ఇచ్చే బ్యాంకు అని నేను అనుకుంటున్నాను, కాబట్టి మరో మాటలో చెప్పాలంటే, దీనికి డబ్బు లేదు. ఇది చేస్తుంది అది లావాదేవీలను నిర్వహిస్తుంది మరియు డేటా దాని క్రింద ఉంటుంది. నెట్‌ఫ్లిక్స్, మనమందరం చాలా బాగా తెలుసు. ఇక్కడ ఆసక్తికరమైన వన్-లైనర్ ఉంది. నెట్‌ఫ్లిక్స్ ఆస్ట్రేలియాలో చట్టబద్ధంగా ఉపయోగించగలిగినప్పుడు, అధికారికంగా ప్రకటించినప్పుడు, మీరు దానిని పొందడానికి VPN ను ఉపయోగించాల్సిన అవసరం లేదు, ప్రపంచవ్యాప్తంగా చాలా మంది ప్రజలు - మీ స్థానిక ప్రాంతంలో దాన్ని పొందలేకపోతే - ఎప్పుడు నెట్‌ఫిక్స్ ఆస్ట్రేలియాలో ప్రారంభించబడింది, ఇది మా ఇంటర్నెట్ లింక్‌లపై అంతర్జాతీయ బ్యాండ్‌విడ్త్‌ను 40 శాతం పెంచింది, కాబట్టి ఇది ఆస్ట్రేలియాలో రాత్రిపూట ఇంటర్నెట్ వినియోగాన్ని దాదాపు రెట్టింపు చేసింది, కేవలం ఒక అప్లికేషన్ ద్వారా, డేటాతో ప్లే చేయడం తప్ప ఏమీ చేయని క్లౌడ్-హోస్ట్ అప్లికేషన్. ఇది మనసును కదిలించే గణాంకం.

వాస్తవానికి, మనందరికీ ఆపిల్ మరియు గూగుల్ గురించి బాగా తెలుసు, కానీ ఇవి గ్రహం మీద అతిపెద్ద సాఫ్ట్‌వేర్ వ్యాపారాలు, అయినప్పటికీ అవి వాస్తవానికి అనువర్తనాలను వ్రాయవు. ఈ అన్ని సంస్థలతో స్థిరమైన విషయం ఏమిటి? సరే, ఇది డేటా, మరియు వారు అక్కడకు రాలేదు ఎందుకంటే వారి డేటా ఎక్కడ ఉందో వారికి తెలియదు మరియు దానిని ఎలా జాబితా చేయాలో వారికి తెలియదు.

మేము ఇప్పుడు కనుగొన్నది ఏమిటంటే, డేటాగా సూచించబడే ఈ సరికొత్త ఆస్తి తరగతి ఉంది మరియు కంపెనీలు దీనికి మేల్కొంటున్నాయి. కానీ వారు ఎల్లప్పుడూ సాధనాలను కలిగి ఉండరు మరియు ఆ డేటాను మొత్తం మ్యాప్ చేయడానికి, ఆ డేటాను జాబితా చేయడానికి మరియు అందుబాటులో ఉంచడానికి, కానీ దాదాపు భౌతిక ఆస్తులు లేని కంపెనీలు రికార్డు సమయంలో అధిక మార్కెట్ విలువను పొందాయని మేము కనుగొన్నాము ఈ క్రొత్త డేటా ఆస్తి తరగతి ద్వారా. నేను చెప్పినట్లుగా, కొంతమంది పాత ఆటగాళ్ళు ఇప్పుడు దీనికి మేల్కొంటున్నారు మరియు ఖచ్చితంగా దాన్ని బయటకు తెస్తున్నారు.

నేను కొంచెం ప్రయాణంలో జానపదాలను తీసుకోవటానికి పెద్ద అభిమానిని, కాబట్టి పద్దెనిమిది వందలలో, పద్దెనిమిది వందల చివరలో, మరియు మీరు యుఎస్ మార్కెట్లో దీని గురించి బాగా తెలుసు, జనాభా గణనను అమలు చేయడానికి ఇది తేలింది ప్రతి సంవత్సరం లేదా అంతకుముందు, వారు ప్రతి పది సంవత్సరాలకు ఆ సమయంలో వాటిని నడిపించారని నేను అనుకుంటున్నాను, కానీ మీరు ప్రతి సంవత్సరం జనాభా గణనను నిర్వహించబోతున్నట్లయితే, డేటా విశ్లేషణ చేయడానికి మీరు ఎనిమిది లేదా తొమ్మిది సంవత్సరాలు పట్టవచ్చు. ఆ డేటా సెట్ అప్పుడు కాగితాల్లోని ప్రదేశాలలో పెట్టెల్లో మిగిలిపోయిందని మరియు దాదాపు ఎవరూ దానిని కనుగొనలేకపోయారని తేలింది. వారు ఈ నివేదికలను పంపిస్తూనే ఉన్నారు, కాని వాస్తవ డేటాను పొందడం చాలా కష్టమైంది, 1940 లలో, రెండవ ప్రపంచ యుద్ధంతో, మరొక ప్రపంచ ముఖ్యమైన క్షణంతో మనకు ఇలాంటి పరిస్థితి ఉంది, మరియు ఈ విషయం బ్లేచ్లీ పార్క్ బాంబే స్పెల్లింగ్ బాంబ్ , మరియు ఇది భారీ సంఖ్య-క్రంచింగ్ విశ్లేషణాత్మక సాధనం, ఇది చిన్న డేటా సెట్ల ద్వారా వెళ్లి అందులో సంకేతాలను కనుగొంటుంది మరియు ఎనిగ్మా ద్వారా సంకేతాలను పగులగొట్టడంలో సహాయపడుతుంది.

ఈ విషయం మళ్ళీ, తప్పనిసరిగా రూపొందించిన పరికరం, కేటలాగ్‌కు ఎక్కువ కాదు, డేటాను ట్యాగ్ చేయడానికి మరియు మ్యాప్ చేయడానికి మరియు నమూనాలను తీసుకొని డేటా సెట్స్‌లో కనుగొనడం సాధ్యపడుతుంది, ఈ సందర్భంలో, కోడ్‌లను విచ్ఛిన్నం చేయండి, కీలు మరియు పదబంధాలను కనుగొని కనుగొనండి అవి డేటా సెట్లలో క్రమం తప్పకుండా ఉంటాయి, కాబట్టి మేము డేటాలోని వస్తువులను కనుగొని, డేటాను జాబితా చేసే దిశగా ఈ ప్రయాణంలో ఉన్నాము.

ఆపై ఈ విషయాలు వచ్చాయి, ఈ భారీ తక్కువ-ధర యంత్రాలు, కేవలం ఆఫ్-ది-షెల్ఫ్ యంత్రాలు. మరియు మేము చాలా ఆసక్తికరమైన పనులు చేసాము, మరియు మేము వారితో చేసిన వాటిలో ఒకటి మేము చాలా తక్కువ ఖర్చుతో కూడిన క్లస్టర్‌లను నిర్మించాము, అది గ్రహం సూచికను ప్రారంభించగలదు మరియు చాలా ప్రసిద్ధంగా ఈ పెద్ద బ్రాండ్లు వచ్చాయి మరియు పోయాయి, కానీ బహుశా గూగుల్ యొక్క అత్యంత సాధారణ ఇల్లు మనమందరం విన్న బ్రాండ్ - ఇది వాస్తవ క్రియగా మారింది మరియు మీ బ్రాండ్ క్రియగా మారినప్పుడు మీరు విజయవంతమయ్యారని మీకు తెలుసు. గూగుల్ మనకు నేర్పించినది, అది గ్రహించకుండా, బహుశా వ్యాపార ప్రపంచంలో, వారు మొత్తం గ్రహంను ఒక నిర్దిష్ట స్థాయికి సూచించగలిగారు మరియు ప్రపంచవ్యాప్తంగా ఉన్న డేటాను జాబితా చేసి, దానిని చాలా తేలికగా అందుబాటులో ఉంచారు, కొంచెం చిన్న వన్-లైన్ ఫార్ములాలో అనుకూలమైన రూపం, దానిపై దాదాపు ఏమీ లేని వెబ్ పేజీ, మరియు మీరు మీ ప్రశ్నలో టైప్ చేస్తే, అది వెళ్లి కనుగొంటుంది ఎందుకంటే వారు అప్పటికే గ్రహంను క్రాల్ చేసారు, ఇండెక్స్ చేసి సులభంగా అందుబాటులో ఉంచారు.

మరియు మేము గమనించినది ఏమిటంటే, “బాగా వేలాడదీయండి, మేము దీన్ని సంస్థలలో చేయడం లేదు - అది ఎందుకు? మొత్తం గ్రహంను మ్యాప్ చేసి, దానిని ఇండెక్స్ చేయగల, క్రాల్ చేసి, ఇండెక్స్ చేసి, దానిని అందుబాటులోకి తెచ్చే ఒక సంస్థ మనకు ఎందుకు వచ్చింది, మనం దాని కోసం శోధించవచ్చు, ఆపై వెళ్లి దానిని కనుగొనవలసిన విషయంపై క్లిక్ చేయండి, మనం ఎలా వస్తాము అంతర్గతంగా అలా చేయలేదా? ”కాబట్టి ప్రపంచవ్యాప్తంగా ఈ చిన్న చిన్న యంత్రాలు చాలా ఉన్నాయి, అవి ఇంట్రానెట్ల కోసం మరియు వస్తువులను కనుగొంటాయి, కాని అవి ఇప్పటికీ సాంప్రదాయ వెబ్ పేజీకి మించి వెళ్ళాలనే ఆలోచనతో పట్టు సాధిస్తున్నాయి, లేదా ఫైల్ సర్వర్.

ఇప్పుడు ఈ తరువాతి తరం డేటా కేటలాగ్‌ను అనేక విధాలుగా ప్రవేశించే బదులు, పోస్ట్-ఇట్ నోట్స్ మరియు వాటర్ కూలర్ సంభాషణల ద్వారా డేటా యాక్సెస్‌ను కనుగొనడం నిజంగా డేటా డిస్కవరీ మరియు కేటలాగ్ చేయడానికి సరైన పద్ధతి కాదు, వాస్తవానికి, ఇది నిజంగానే అని నేను అనుకోను . గమనికలను పంపడం మరియు గమనికలను పోస్ట్ చేయడం మరియు దాని గురించి చాట్ చేసే వ్యక్తులకు మేము ఇకపై ఆ మొత్తం సవాలును నడిపించలేము. డేటా కేటలాగింగ్‌కు ఈ తదుపరి తరం విధానం వచ్చి పోయిన ప్రాంతానికి మేము ఇప్పుడు బాగానే ఉన్నాము. దాని చుట్టూ మన చేతులు పొందాలి. ఇది సులభమైన సమస్య అయితే, మేము ఇంతకు ముందే దీన్ని అనేక విధాలుగా పరిష్కరించాము, కాని ఇది అంత తేలికైన సమస్య కాదని నేను భావిస్తున్నాను, డేటాను ఇండెక్స్ చేయడం మరియు పిలవడం దానిలో ఒక భాగం మాత్రమే, డేటాలో ఏముందో తెలుసుకోవడం మరియు మెటాడేటాను నిర్మించడం మేము కనుగొన్న దాని చుట్టూ, ఆపై దానిని సులభంగా, వినియోగించదగిన రూపంలో, ముఖ్యంగా స్వీయ-సేవ మరియు విశ్లేషణలకు అందుబాటులో ఉంచడం. ఇది ఇప్పటికీ పరిష్కరించబడుతున్న సమస్య, కానీ ఐదేళ్ళలో పజిల్ యొక్క చాలా భాగాలు బాగా మరియు నిజంగా పరిష్కరించబడ్డాయి మరియు అందుబాటులో ఉన్నాయి.

మనకు తెలిసినట్లుగా, డేటాను జాబితా చేసే మానవులు వైఫల్యానికి ఒక రెసిపీ ఎందుకంటే డేటా ప్రాసెసింగ్‌లో మనం వ్యవహరించే గొప్ప పీడకలలలో మానవ లోపం ఒకటి, మరియు నేను ఈ విషయం గురించి క్రమం తప్పకుండా మాట్లాడుతాను, ఇక్కడ నా దృష్టిలో, కాగితపు రూపాలను నింపే మానవులు బహుశా గొప్ప పీడకల మేము పెద్ద డేటా మరియు విశ్లేషణలలో వ్యవహరిస్తాము, వారు చేసే పనులను నిరంతరం పరిష్కరించుకోవడం, తేదీలు మరియు ఫీల్డ్‌లు వంటి సాధారణ విషయాల వరకు, ప్రజలు దానిని తప్పు ఆకృతిలో ఉంచడం.

నేను చెప్పినట్లుగా, మేము ప్రతిరోజూ ఇంటర్నెట్ సెర్చ్ ఇంజన్లను ప్రపంచాన్ని సూచికగా చూశాము, కాబట్టి ఇప్పుడు మేము దానిని ఆవిష్కరణ ప్రక్రియలో వ్యాపార డేటా సెట్లలో చేయవచ్చనే ఆలోచనతో చేస్తున్నాము మరియు సాధనాలు మరియు వ్యవస్థలు ఇప్పుడు మీరు ఈ రోజు నేర్చుకోబోతున్నందున సులభంగా అందుబాటులో ఉంటుంది. కాబట్టి ట్రిక్, నిజంగా నా దృష్టిలో, సరైన సాధనాలను ఎంచుకోవడం, ఉద్యోగానికి ఉత్తమమైన సాధనాలు. మరియు దాని పైన మరింత సముచితంగా, ఈ మార్గాన్ని ప్రారంభించడంలో మీకు సహాయపడటానికి దాని యొక్క సరైన భాగాన్ని కనుగొనడం. ఈ రోజు మనం దాని గురించి వినబోతున్నామని నేను నమ్ముతున్నాను, కాని మేము అలా చేసే ముందు, నేను నా కాలేజీ రాబిన్ బ్లూర్‌కి వెళుతున్నాను మరియు ఈ అంశంపై ఆయన టేక్ వినబోతున్నాను. రాబిన్, నేను మీ దగ్గరకు వెళ్ళగలనా?

రాబిన్ బ్లూర్: అవును, ఖచ్చితంగా మీరు చేయగలరు. ఇది పనిచేస్తుందో లేదో చూద్దాం, ఓహ్ అవును. సరే, నేను నిజంగా డెజ్ కంటే వేరే దిశ నుండి వస్తున్నాను, కాని నేను అదే స్థలంలోనే ముగుస్తాను. ఇది డేటాకు కనెక్ట్ కావడం గురించి, కాబట్టి నేను డేటాకు కనెక్ట్ అయ్యే వాస్తవికత ద్వారా నడుస్తానని అనుకున్నాను, పాయింట్ బై పాయింట్.

డేటా ఇంతకుముందు కంటే చాలా విచ్ఛిన్నమైందనే వాస్తవం ఉంది. డేటా యొక్క పరిమాణం అసాధారణంగా పెరుగుతోంది, కానీ వాస్తవానికి, డేటా యొక్క వివిధ వనరులు కూడా నమ్మశక్యం కాని రేటుతో పెరుగుతున్నాయి, అందువల్ల డేటా అన్ని సమయాలలో విచ్ఛిన్నమవుతోంది. కానీ ముఖ్యంగా అనలిటిక్స్ అనువర్తనాల వల్ల - కాని అవి మాత్రమే అనువర్తనాలు కావు - ఈ డేటా మొత్తానికి కనెక్ట్ అవ్వడానికి మాకు మంచి కారణం ఉంది, కాబట్టి మేము కష్టమైన స్థలంలో చిక్కుకున్నాము, విచ్ఛిన్నమైన డేటా ప్రపంచంలో మేము చిక్కుకున్నాము, మరియు డేజ్ కొత్త చమురు అని పిలుస్తున్నందున డేటాలో అవకాశం ఉంది.

డేటా గురించి, ఇది ఫైల్ సిస్టమ్స్ లేదా డేటాబేస్లలో స్పిన్నింగ్ డిస్క్లో నివసించేది. ఇప్పుడు ఇది చాలా వైవిధ్యమైన వాతావరణంలో నివసిస్తుంది, ఇది ఫైల్ సిస్టమ్స్‌లో నివసిస్తుంది, అయితే ఇది ఈ రోజుల్లో హడూప్ సందర్భాల్లో లేదా స్పార్క్ ఉదంతాలలో కూడా నివసిస్తుంది. ఇది బహుళ జాతుల డేటాబేస్లో నివసిస్తుంది. చాలా కాలం క్రితం, మేము కొన్ని రిలేషనల్ డేటాబేస్ను ప్రామాణీకరించాము, గత ఐదేళ్ళలో విండో నుండి బయటకు వెళ్లిందని మీకు తెలుసు, ఎందుకంటే డాక్యుమెంట్ డేటాబేస్ల అవసరం ఉంది, మరియు గ్రాఫ్ డేటాబేస్ల అవసరం ఉంది, కాబట్టి మీకు తెలుసు, ఆట ఉంది మార్చబడింది. కనుక ఇది స్పిన్నింగ్ డిస్క్‌లో నివసించింది, కానీ ఇప్పుడు అది ఎస్‌ఎస్‌డిలో నివసిస్తుంది. SSD యొక్క తాజా మొత్తం - ఖచ్చితంగా తాజా SSD యూనిట్ శామ్సంగ్ నుండి వస్తోంది - ఇరవై గిగాబైట్లు, ఇది భారీగా ఉంది. ఇప్పుడు అది మెమరీలో నివసిస్తుంది, డేటా యొక్క ప్రధాన కాపీ డిస్క్‌లో కాకుండా మెమరీలో ఉండగలదు, మేము అలాంటి వ్యవస్థలను నిర్మించడానికి ఉపయోగించలేదు; మేము ఇప్పుడు చేస్తాము. మరియు అది మేఘంలో నివసిస్తుంది. అంటే ఈ విషయాలలో దేనినైనా, క్లౌడ్‌లో జీవించగలదని అర్థం, ఇది మేఘంలో ఎక్కడ ఉందో మీకు తెలియదు, మీకు దాని చిరునామా మాత్రమే ఉంటుంది.

పాయింట్‌ను ర్యామ్ చేయడానికి, హడూప్ ఇప్పటివరకు, విస్తరించదగిన డేటా స్టోర్‌గా విఫలమైంది. ఇది ఎక్స్‌టెన్సిబుల్ స్కేల్-అవుట్ డేటా స్టోర్‌గా మారుతుందని మేము ఆశించాము మరియు ఇది ప్రతిదానికీ ఒక ఫైల్ సిస్టమ్‌గా మారుతుంది, మరియు అది అవుతుంది - రెయిన్‌బోలు ఆకాశంలో కనిపిస్తాయి, ప్రాథమికంగా, మరియు యునికార్న్స్ చుట్టూ నృత్యం చేస్తాయి మరియు అది ఏదీ జరగలేదు. అంటే మనం డేటా రవాణా సమస్యతో ముగుస్తుంది, మరియు డేటా రవాణా కోసం కొన్ని సమయాల్లో అవసరం లేదు, కానీ ఇది కూడా ఒక కష్టం. ఈ రోజుల్లో డేటా నిజంగా గురుత్వాకర్షణను కలిగి ఉంది, ఒకసారి మీరు డేటా యొక్క బహుళ-టెరాబైట్లలోకి ప్రవేశించి, దాన్ని తీయడం మరియు చుట్టూ విసిరేయడం, మీ నెట్‌వర్క్‌లో లాటెన్సీలు కనిపించడానికి కారణాలు లేదా వివిధ ప్రదేశాలలో కనిపించడం. మీరు చుట్టూ డేటాను రవాణా చేయాలనుకుంటే, సమయం ఒక అంశం. దాదాపు ఎల్లప్పుడూ, ఈ రోజుల్లో, మీరు ఒక వస్తువును, ఒక డేటాను ఒక ప్రదేశం నుండి మరొక ప్రదేశానికి పొందటానికి ఎంత సమయం తీసుకున్నారు అనే దానిపై కొన్ని పరిమితులు ఉన్నాయి. బ్యాచ్ విండోస్ అని మేము అనుకునేది ఉండేది, యంత్రం పనిలేకుండా ఉన్నప్పుడు, మరియు మీ వద్ద ఎంత డేటా ఉన్నా, మీరు దాన్ని చుట్టూ విసిరేయవచ్చు మరియు ఇవన్నీ పని చేస్తాయి. అది పోయింది, మేము చాలా ఎక్కువ నిజ సమయ ప్రపంచంలో జీవిస్తున్నాము. అందువల్ల సమయం ఒక అంశం. మీరు డేటాను చుట్టూ తరలించాలనుకున్న వెంటనే, డేటాకు గురుత్వాకర్షణ ఉంటే, మీరు దాన్ని తరలించలేరు.

డేటా మేనేజ్మెంట్ అనేది మీరు నిజంగా ఈ డేటాను నిర్వహించవలసి వచ్చింది, మీరు దీన్ని ఉచితంగా పొందలేరు మరియు డేటాను చేయవలసిన పనిని చేయటానికి వాస్తవానికి ప్రతిరూపం అవసరం కావచ్చు, ఎందుకంటే ఇది మీరు ఎక్కడ ఉంచారో అక్కడ ఉండకూడదు. డేటా యొక్క సాధారణ ప్రాసెసింగ్ చేయడానికి దీనికి తగిన వనరులు ఉండకపోవచ్చు. కాబట్టి డేటా ప్రతిరూపం అవుతుంది మరియు మీరు .హించిన దానికంటే ఎక్కువ డేటా ప్రతిరూపం పొందుతుంది. డేటా యొక్క సగటు భాగం కనీసం రెండున్నర సార్లు ప్రతిరూపం అవుతుందని చాలా కాలం క్రితం ఎవరో నాకు చెప్పారు. ESB లు లేదా కాఫ్కా డేటా ప్రవాహానికి ఒక ఎంపికను అందిస్తున్నాయి, కానీ ఈ రోజుల్లో ఇది నిర్మాణాన్ని కోరుతుంది. ఈ రోజుల్లో మీరు నిజంగా ఒక విధంగా లేదా మరొక విధంగా ఆలోచించాలి, వాస్తవానికి డేటాను చుట్టూ విసిరేయడం అంటే ఏమిటి. అందువల్ల, డేటాను ఉన్న చోట యాక్సెస్ చేయడం సాధారణంగా మంచిది, వాస్తవానికి, మీరు నిజంగా డేటా కోసం వెళ్ళినప్పుడు మీకు అవసరమైన పనితీరును పొందవచ్చు మరియు అది కాన్ మీద ఆధారపడి ఉంటుంది. కనుక ఇది కష్టమైన పరిస్థితి. డేటా ప్రశ్నల పరంగా, మేము SQL పరంగా ఆలోచించగలిగాము, మేము ఇప్పుడు నిజంగానే వచ్చాము, మీకు తెలుసా, వివిధ రకాల ప్రశ్నలు, SQL అవును, కానీ ప్రక్కనే, గ్రాఫ్ ప్రశ్నలు, స్పార్క్ గ్రాఫ్ చేయడానికి ఒక ఉదాహరణ మాత్రమే , ఎందుకంటే మనం చేసినదానికన్నా ఎక్కువ శోధన చేయవలసి ఉంది, రీజెక్స్ రకం శోధనలు, ఇది నమూనాల కోసం నిజంగా సంక్లిష్టమైన శోధనలు మరియు నిజమైన నమూనా సరిపోలిక, ఈ విషయాలన్నీ వాస్తవానికి బబ్లింగ్ అవుతున్నాయి. మరియు అవన్నీ ఉపయోగకరంగా ఉంటాయి ఎందుకంటే మీరు వెతుకుతున్న వాటిని వారు మీకు పొందుతారు లేదా మీరు వెతుకుతున్న దాన్ని వారు పొందవచ్చు.

ప్రశ్నలు ఇప్పుడు రోజులు బహుళ డేటాను కలిగి ఉన్నాయి, కాబట్టి ఇది ఎల్లప్పుడూ అలా చేయలేదు మరియు మీరు అలా చేస్తే తరచుగా పనితీరు భయంకరంగా ఉంటుంది. కాబట్టి, ఇది పరిస్థితులపై ఆధారపడి ఉంటుంది, కాని ప్రజలు బహుళ డేటా వనరుల నుండి డేటాను ప్రశ్నించగలరని ప్రజలు భావిస్తున్నారు, కాబట్టి ఒక విధమైన డేటా సమాఖ్య లేదా మరొకటి మరింత ప్రస్తుతమవుతోంది. పనితీరును బట్టి డేటా వర్చువలైజేషన్ అనేది వేరే మార్గం. డేటా ప్రశ్నలు వాస్తవానికి ఒక ప్రక్రియలో ఒక భాగం, మొత్తం ప్రక్రియ కాదు. మీరు నిజంగా విశ్లేషణ పనితీరును చూస్తున్నట్లయితే, వాస్తవ విశ్లేషణలు డేటా సేకరణ కంటే చాలా ఎక్కువ సమయం పడుతుంది, ఎందుకంటే ఇది పరిస్థితులపై ఆధారపడి ఉంటుంది, కానీ మీరు ఏదైనా చేయాలనుకుంటే డేటా ప్రశ్నలు సంపూర్ణ అవసరం బహుళ డేటా వనరులపై రకమైన విశ్లేషణలు, మరియు ఇది నిజంగా, మీరు నిజంగా విస్తరించి ఉన్న సామర్థ్యాలను కలిగి ఉండాలి.

కాబట్టి కేటలాగ్ల గురించి.కేటలాగ్‌లు ఒక కారణం కోసం ఉన్నాయి, కనీసం మేము మీకు చెప్తున్నాము, మీకు తెలుసా, మనకు డైరెక్టరీలు ఉన్నాయి, మరియు మాకు డేటాబేస్‌లలో స్కీమా ఉంది, మరియు మాకు ప్రతి కేటలాగ్ ఉంది మరియు మీరు ఎక్కడికి వెళ్ళినా మీకు ఒక స్థలం దొరుకుతుంది మరియు మీరు నిజంగానే ఉంటారు ఏదో ఒక రకమైన కేటలాగ్ ఉందని కనుగొనండి, మరియు ఏకీకృత గ్లోబల్ కేటలాగ్ అటువంటి మంచి ఆలోచన. కానీ చాలా తక్కువ కంపెనీలకు అలాంటిది ఉంది. నాకు గుర్తుంది, తిరిగి సంవత్సరంలో రెండు వేలు - సంవత్సరం రెండు వేల భయాందోళనలు - కమ్యూనిస్టులు తమ వద్ద ఎన్ని ఎగ్జిక్యూటబుల్స్ ఉన్నారో కూడా పిన్ చేయలేరని నేను గుర్తుంచుకున్నాను, వారి వద్ద ఎన్ని వేర్వేరు డేటా స్టోర్లు ఉన్నాయో పర్వాలేదు, మరియు ఇప్పుడు బహుశా ఇదే, మీరు తెలుసు, చాలా కంపెనీలకు గ్లోబల్ కోణంలో చురుకుగా తెలియదు, వారికి ఏ డేటా వచ్చింది. వాస్తవానికి గ్లోబల్ కేటలాగ్‌ను కలిగి ఉండటం లేదా డేటా వనరుల పెరుగుదల మరియు అనువర్తనాల నిరంతర పెరుగుదల కారణంగా ఏమి జరుగుతుందో ప్రపంచ చిత్రాన్ని కలిగి ఉండటం స్పష్టంగా అవసరమవుతోంది మరియు ఇది విశ్లేషణలకు ముఖ్యంగా అవసరం, ఎందుకంటే మీరు కూడా ఒక విధంగా, మరియు ఇక్కడ వంశపారంపర్యత మరియు డేటాతో సమస్యలు వంటి ఇతర సమస్యలు ఉన్నాయి, మరియు ఇది భద్రతకు అవసరం, డేటా పాలన యొక్క అనేక అంశాలు, మీకు ఏ డేటా లభించిందో మీకు నిజంగా తెలియకపోతే, మీరు అనే ఆలోచన పరిపాలించబోతున్నారు అది అసంబద్ధం. కాబట్టి, అందులో, అన్ని డేటా ఏదో ఒక విధంగా జాబితా చేయబడుతుంది అనేది ఒక వాస్తవం. ప్రశ్న కేటలాగ్ పొందికగా ఉందా, వాస్తవానికి మీరు దానితో ఏమి చేయగలరు. కాబట్టి నేను రెబెక్కాకు తిరిగి వెళ్తాను.

రెబెకా జోజ్వియాక్: సరే, ధన్యవాదాలు రాబిన్. తరువాత మేము డేవిడ్ క్రాఫోర్డ్ ను అలేషన్ నుండి పొందాము, డేవిడ్ నేను ముందుకు వెళ్లి బంతిని మీకు పంపించబోతున్నాను మరియు మీరు దానిని తీసివేయవచ్చు.

డేవిడ్ క్రాఫోర్డ్: చాలా ధన్యవాదాలు. ఈ ప్రదర్శనలో మీరు నన్ను కలిగి ఉన్నందుకు నేను నిజంగా అభినందిస్తున్నాను. నేను దీన్ని ప్రారంభించబోతున్నానని అనుకుంటున్నాను, కాబట్టి ఇక్కడ నా పాత్ర ఏమిటంటే, ఆ సిద్ధాంతంలో కొన్నింటిని తీసుకొని అది ఎలా అన్వయించబడుతుందో చూడటం, మరియు మేము నిజమైన కస్టమర్ల వద్ద డ్రైవ్ చేయగలిగే ఫలితాలు మరియు మీరు చూడవచ్చు స్లైడ్‌లో కొన్ని, విశ్లేషణాత్మక మెరుగుదలలలో మనం చూడగలిగే ఫలితాల గురించి మాట్లాడాలనుకుంటున్నాను. కాబట్టి చర్చను ప్రేరేపించడానికి, వారు అక్కడికి ఎలా వచ్చారనే దాని గురించి మేము మాట్లాడబోతున్నాము. అందువల్ల చాలా మంది స్మార్ట్ వ్యక్తులతో, ఈ కస్టమర్లతో చాలా దగ్గరగా పనిచేయడం నా అదృష్టం, మరియు వాస్తవానికి కొలవగలిగిన కొద్దిమందిని నేను ఎత్తి చూపించాలనుకుంటున్నాను మరియు డేటా కేటలాగ్ కలిగి ఉండటం వారి విశ్లేషకుడిని ఎలా ప్రభావితం చేసిందనే దాని గురించి మాట్లాడండి వర్క్ఫ్లో. క్లుప్తంగా ముందు భాగంలో ఉండటానికి, డేటా కేటలాగ్ పద్యాలు మునుపటి మధ్యవర్తిత్వ పరిష్కారాలతో మరియు మనం కలిసి ఉంచిన పరిష్కారాల గురించి సంబంధాలు నిజంగా ఆలోచించే మార్గాలలో ఒకటి, మార్పును చూసే విషయాలలో ఒకటి, విశ్లేషకుల నుండి ప్రారంభించడం మరియు వెనుకకు పని చేయండి. చెప్పాలంటే, విశ్లేషకుల ఉత్పాదకతను ప్రారంభించడం గురించి దీన్ని తెలియజేయండి. కేవలం సమ్మతికి వ్యతిరేకంగా, లేదా కేవలం జాబితాను కలిగి ఉండటానికి విరుద్ధంగా, మేము విశ్లేషకులను మరింత ఉత్పాదకతను కలిగించే సాధనాన్ని తయారు చేస్తున్నాము.

కాబట్టి, నేను ఫైనాన్షియల్ సర్వీసెస్ కంపెనీ స్క్వేర్ వద్ద ఒక డేటా సైంటిస్ట్‌తో మాట్లాడినప్పుడు, నిక్ అనే వ్యక్తి ఉన్నాడు, అతను ఎలా ఉన్నాడో మాకు చెబుతున్నాడు, అతను ఒక నివేదికను ప్రారంభించడానికి సరైన డేటాను కనుగొనటానికి చాలా గంటలు పట్టింది, ఇప్పుడు అతను చేయగలడు మార్కెట్ వాటా వద్ద శోధనను ఉపయోగించి సెకన్లలో దీన్ని చేయండి, మేము వారి CTO తో మాట్లాడాము, వారు స్క్వేర్ ఉపయోగిస్తున్న తన విశ్లేషకులను లాగారు, నన్ను క్షమించండి, అలేషన్ ఉపయోగిస్తున్నారు, వారి ఏమిటో, వారు ఏ ప్రయోజనాలను చూశారో తెలుసుకోవడానికి మరియు వారు 50 మందిని నివేదించారు శాతం ఉత్పాదకత బూస్ట్, మరియు, ప్రపంచంలోని అగ్రశ్రేణి రిటైలర్లలో ఒకరైన ఈబే, వారు రోజూ SQL విశ్లేషణ చేస్తున్న వెయ్యి మందికి పైగా ఉన్నారు, మరియు నేను డెబ్‌తో చాలా దగ్గరగా పని చేస్తున్నాను, అక్కడ ఎవరు ప్రాజెక్ట్? వారి డేటా టూల్స్ బృందంలో మేనేజర్, మరియు ప్రశ్నలు అలేషన్‌ను స్వీకరించినప్పుడు, కేటలాగ్‌ను స్వీకరించినప్పుడు, డేటాబేస్‌కు వ్యతిరేకంగా కొత్త ప్రశ్నలను వ్రాసే వేగాన్ని వారు రెట్టింపుగా చూస్తున్నారని ఆమె కనుగొంది.

కాబట్టి ఇవి నిజమైన ఫలితాలు, ఇవి వాస్తవానికి వారి సంస్థలో కేటలాగ్‌ను వర్తింపజేసే వ్యక్తులు, మరియు సెటప్ చేయడానికి ఏమి అవసరమో నేను మిమ్మల్ని తీసుకెళ్లాలనుకుంటున్నాను. ఒక సంస్థలో కేటలాగ్ ఎలా స్థాపించబడుతుందో, మరియు చెప్పవలసిన అతి ముఖ్యమైన విషయం ఏమిటంటే, ఇది చాలా స్వయంచాలకంగా జరుగుతుంది, కాబట్టి డెజ్ వ్యవస్థల గురించి మాట్లాడాడు, వ్యవస్థల గురించి నేర్చుకున్నాడు మరియు ఆధునిక డేటా కేటలాగ్ అదే చేస్తుంది. కాబట్టి వారు తమ డేటా సెంటర్‌లో అలేషన్‌ను ఇన్‌స్టాల్ చేసి, ఆపై వారు తమ డేటా వాతావరణంలో మెటాడేటా యొక్క వివిధ వనరులకు కనెక్ట్ చేస్తారు. నేను డేటాబేస్‌లు మరియు BI సాధనాలపై కొంచెం దృష్టి పెడతాను - ఈ రెండింటి నుండి మేము సాంకేతిక మెటాడేటాను సేకరించబోతున్నాము, ప్రాథమికంగా ఉన్న దాని గురించి. కుడి, కాబట్టి ఏ పట్టికలు? ఏ నివేదికలు? నివేదిక నిర్వచనాలు ఏమిటి? అందువల్ల వారు ఆ సాంకేతిక మెటాడేటాను సంగ్రహిస్తారు, మరియు ఆ వ్యవస్థల లోపల ఉన్న ప్రతి వస్తువు కోసం ఒక కేటలాగ్ పేజీ స్వయంచాలకంగా సృష్టించబడుతుంది, ఆపై, అవి కూడా ఆ సాంకేతిక మెటాడేటా పైన వెలికితీసి పొరలుగా ఉంటాయి, అవి వినియోగ డేటా పైన పొరలుగా ఉంటాయి. ఇది ప్రాథమికంగా డేటాబేస్ నుండి ప్రశ్న లాగ్లను చదవడం ద్వారా జరుగుతుంది మరియు ఇది నిజంగా ఆసక్తికరమైన సమాచార వనరు. కాబట్టి, ఒక విశ్లేషకుడు ఒక ప్రశ్న వ్రాసినప్పుడల్లా, రిపోర్టింగ్ సాధనం, అది ఇంట్లో పెరిగినదా, లేదా షెల్ఫ్‌లో ఉన్నా, డాష్‌బోర్డ్‌ను నవీకరించడానికి ఒక రిపోర్టింగ్ సాధనం ప్రశ్నను నడుపుతుందా, ఒక అనువర్తనం డేటాను అమలు చేయడానికి ప్రశ్నను అమలు చేసినప్పుడు డేటా సెట్ - ఆ విషయాలన్నీ డేటాబేస్ ప్రశ్న లాగ్‌లలో సంగ్రహించబడతాయి. మీకు కేటలాగ్ ఉందా లేదా, అవి డేటాబేస్ తో ప్రశ్న లాగ్ లో బంధించబడతాయి. డేటా కేటలాగ్ ఏమి చేయగలదు మరియు ముఖ్యంగా అలేషన్స్ కేటలాగ్ ఏమి చేయగలదో, ఆ లాగ్‌లను చదవడం, వాటిలోని ప్రశ్నలను అడగడం మరియు ఆ లాగ్‌ల ఆధారంగా నిజంగా ఆసక్తికరమైన వినియోగ గ్రాఫ్‌ను సృష్టించడం మరియు భవిష్యత్ వినియోగదారులకు తెలియజేయడానికి మేము దానిని అమలులోకి తీసుకువస్తాము. డేటా యొక్క గత వినియోగదారులు దీన్ని ఎలా ఉపయోగించారు అనే దాని గురించి డేటా.

కాబట్టి, మేము ఆ జ్ఞానాన్ని అన్నింటినీ ఒక కేటలాగ్‌లోకి తీసుకువస్తాము మరియు దీనిని నిజం చేయడానికి, ఇవి ఇప్పటికే కస్టమర్ల వద్ద మోహరించబడిన అనుసంధానాలు, కాబట్టి, మేము ఒరాకిల్, టెరాడాటా, రెడ్‌షిఫ్ట్, వెర్టికా మరియు ఇతర సమూహాలను చూశాము రిలేషనల్ డేటాబేస్. హడూప్ ప్రపంచంలో, హడూప్‌లో SQL యొక్క శ్రేణి ఉంది, హడూప్ ఫైల్ సిస్టమ్ పైన ఉన్న రిలేషనల్, మెటా స్టోర్స్, ఇంపాలా, తేజ్, ప్రెస్టో మరియు హైవ్, మేము ఆల్టిస్కేల్ వంటి క్లౌడ్ హడూప్ ప్రైవేట్ ప్రొవైడర్లతో కూడా విజయం సాధించాము మరియు మేము టేబులో సర్వర్లు, మైక్రోస్ట్రాటజీ సర్వర్లు మరియు డాష్‌బోర్డులను ఇండెక్స్ చేయడానికి, అలాగే ప్లాట్లీ వంటి డేటా సైన్స్ చార్టింగ్ సాధనాలతో అనుసంధానం చేయగలిగారు.

కాబట్టి, మేము ఈ వ్యవస్థలన్నింటికీ కనెక్ట్ చేసాము, మేము ఈ వ్యవస్థలను కస్టమర్లకు కనెక్ట్ చేసాము, మేము సాంకేతిక మెటాడేటాలో లాగాము, మేము వినియోగ డేటాలో లాగాము, మరియు మేము డేటా కేటలాగ్‌ను స్వయంచాలకంగా ప్రాధమికం చేసాము, కాని ఆ విధంగా, మేము జ్ఞానాన్ని కేంద్రీకృతం చేయండి, కాని విషయాలను డేటా కేటలాగ్‌లోకి కేంద్రీకరించడం, ఇబే, స్క్వేర్ మరియు మార్కెట్ వాటాతో మనం మాట్లాడిన అద్భుతమైన ఉత్పాదకత ప్రోత్సాహకాలను అందించదు. అలా చేయడానికి, విశ్లేషకులకు జ్ఞానాన్ని అందించడం గురించి మనం ఆలోచించే విధానాన్ని మార్చాలి. దీని కోసం వారు సిద్ధం చేస్తున్న ప్రశ్నలలో ఒకటి, “కేటలాగ్ వాస్తవానికి విశ్లేషకుడి వర్క్‌ఫ్లోను ఎలా ప్రభావితం చేస్తుంది?”.

మేము రోజంతా దాని గురించి ఆలోచిస్తూనే ఉంటాము మరియు ఈ ఆలోచనలో మార్పు గురించి మాట్లాడటానికి, పుష్ పద్యాల పుల్ మోడల్ గురించి, కిండ్ల్‌లో చదివే ముందు మరియు తరువాత ప్రపంచం ఎలా ఉందో శీఘ్ర సారూప్యతను చేయాలనుకున్నాను. కనుక ఇది మీలో కొంతమందికి ఉన్న ఒక అనుభవం, మీరు భౌతిక పుస్తకాన్ని చదువుతున్నప్పుడు, మీరు ఒక పదాన్ని చూస్తారు, ఆ పదం యొక్క నిర్వచనం మీకు బాగా తెలుసు అని మీకు ఖచ్చితంగా తెలియదు, మీరు దానిని కాన్ నుండి can హించవచ్చు, బహుశా మీరు కాదు మంచం నుండి లేచి, మీ పుస్తకాల అరకు నడవండి, మీ నిఘంటువును కనుగొని, దాన్ని దుమ్ము దులిపి, పదాల అక్షర జాబితాలో సరైన స్థలానికి తిప్పండి, అవును, మీకు ఆ నిర్వచనం సరిగ్గా ఉందని, మీకు తెలుసా దాని యొక్క సూక్ష్మ నైపుణ్యాలు. కనుక ఇది నిజంగా జరగదు. కాబట్టి మీరు కిండ్ల్ అనువర్తనాన్ని కొనుగోలు చేస్తారు మరియు మీరు అక్కడ పుస్తకాలను చదవడం ప్రారంభిస్తారు మరియు మీకు పూర్తిగా తెలియని పదాన్ని మీరు చూస్తారు మరియు మీరు ఈ పదాన్ని తాకుతారు. అకస్మాత్తుగా, అదే స్క్రీన్‌లో, పదం యొక్క నిఘంటువు నిర్వచనం, దాని యొక్క అన్ని సూక్ష్మ నైపుణ్యాలు, విభిన్న ఉదాహరణ ఉపయోగాలు, మరియు మీరు కొద్దిగా స్వైప్ చేయండి మరియు మీరు ఆ అంశంపై వికీపీడియా కథనాన్ని పొందుతారు, మీరు మళ్ళీ స్వైప్ చేస్తారు, మీరు దానిని ఇతర భాషలలోకి లేదా ఇతర భాషల నుండి అనువదించగల అనువాద సాధనాన్ని పొందుతారు, మరియు అకస్మాత్తుగా మీ భాషపై మీ జ్ఞానం చాలా ధనవంతుడు, మరియు మీరు ఎప్పుడు వెళ్ళాలి మరియు పోల్చితే ఇది ఆశ్చర్యపరిచే అనేక సార్లు జరుగుతుంది. ఆ వనరును మీ కోసం లాగండి.

అందువల్ల నేను వాదించబోయేది ఏమిటంటే, ఒక విశ్లేషకుడి యొక్క వర్క్ఫ్లో మరియు డేటా డాక్యుమెంటేషన్తో ఒక విశ్లేషకుడు వ్యవహరించే విధానం, వాస్తవానికి పాఠకుడు నిఘంటువుతో ఎలా సంకర్షణ చెందుతాడో, భౌతికమైనా, లేదా అయినప్పటికీ కిండ్ల్, మరియు మనం, ఈ ఉత్పాదకత బూస్ట్‌ను నిజంగా చూసిన మార్గం, కేటలాగ్‌ను చిందించడం కాదు, కానీ దానిని విశ్లేషకుడి వర్క్‌ఫ్లోకు కనెక్ట్ చేయడం మరియు అందువల్ల, వారు నన్ను ఇక్కడ డెమో చేయమని అడిగారు, మరియు నేను కోరుకుంటున్నాను ఈ ప్రదర్శన యొక్క దృష్టి కేంద్రీకరించడానికి. కానీ నేను డెమో కోసం కాన్ ఏర్పాటు చేయాలనుకుంటున్నాను. వినియోగదారులకు అవసరమైనప్పుడు డేటా పరిజ్ఞానాన్ని నెట్టడం గురించి మేము ఆలోచించినప్పుడు, అది చేయటానికి సరైన స్థలం, వారు తమ సమయాన్ని వెచ్చించే ప్రదేశం మరియు వారు విశ్లేషణ చేస్తున్న చోట, SQL ప్రశ్న సాధనం. మీరు SQL ప్రశ్నలను వ్రాసి అమలు చేసే ప్రదేశం. కాబట్టి మేము ఒకదాన్ని నిర్మించాము మరియు మేము దానిని నిర్మించాము మరియు ఇతర ప్రశ్న సాధనాల నుండి దాని గురించి నిజంగా భిన్నమైన విషయం డేటా కేటలాగ్‌తో దాని లోతైన అనుసంధానం.

కాబట్టి మా ప్రశ్న సాధనాన్ని అలేషన్ కంపోజ్ అంటారు. దీని వెబ్ ఆధారిత ప్రశ్న సాధనం మరియు నేను మీకు సెకనులో చూపిస్తాను. మునుపటి స్లయిడ్‌లో మీరు చూసిన అన్ని డేటాబేస్ లోగోల్లో పనిచేసే వెబ్ ఆధారిత ప్రశ్న సాధనం. నేను ప్రత్యేకంగా డెమో చేయడానికి ప్రయత్నించబోయేది కేటలాగ్ సమాచారం వినియోగదారులకు వచ్చే మార్గం. మరియు ఇది ఈ రకమైన మూడు వేర్వేరు మార్గాల ద్వారా చేస్తుంది. ఇది జోక్యాల ద్వారా చేస్తుంది, మరియు ఎవరైనా డేటా గవర్నర్, లేదా డేటా స్టీవార్డ్, లేదా ఏదో ఒక విధమైన నిర్వాహకుడు లేదా మేనేజర్ ఇలా చెప్పగలరు, “నేను ఒక గమనికతో లేదా హెచ్చరికతో ఇంటర్‌జెక్ట్ చేయాలనుకుంటున్నాను వర్క్ఫ్లో మరియు అది సరైన సమయంలో వినియోగదారులకు పంపిణీ చేయబడిందని నిర్ధారించుకోండి. ”కాబట్టి ఇది ఒక జోక్యం మరియు దానిని బాగా చూపిస్తుంది.

స్మార్ట్ సూచనలు అనేది సాధనం కేటలాగ్ యొక్క సమగ్ర జ్ఞానాన్ని ఉపయోగించుకునే మార్గం, మీరు ప్రశ్న రాసేటప్పుడు వస్తువులు మరియు భాగాలను సూచించడానికి. అక్కడ తెలుసుకోవలసిన అతి ముఖ్యమైన విషయం ఏమిటంటే, ప్రశ్న లాగ్‌ను నిజంగా ఉపయోగించుకోవడం, ఉపయోగం ఆధారంగా విషయాలను సూచించడం మరియు ఇంతకు ముందు వ్రాసిన ప్రశ్నల భాగాలను కూడా కనుగొనడం. మరియు బాగా చూపించు.

ఆపై ప్రివ్యూలు. ప్రివ్యూలు అంటే, మీరు ఒక వస్తువు పేరిట టైప్ చేస్తున్నప్పుడు, కేటలాగ్‌కు తెలిసిన ప్రతిదాన్ని లేదా ఆ వస్తువు గురించి కేటలాగ్‌కు తెలిసిన కనీసం చాలా సందర్భోచితమైన విషయాలను మేము మీకు చూపిస్తాము. కాబట్టి డేటా యొక్క నమూనాలు, ఇంతకు ముందు ఎవరు ఉపయోగించారు, ఆ వస్తువు యొక్క తార్కిక పేరు మరియు వివరణ, అన్నీ మీరు అడగకుండానే వ్రాసేటప్పుడు మీ వద్దకు వస్తాయి.

కాబట్టి ఇంకేమీ మాట్లాడకుండా, నేను డెమోకి వెళ్తాను, మరియు అది కనిపించే వరకు నేను వేచి ఉండబోతున్నాను. నేను ఇక్కడ మీకు చూపించబోయేది ప్రశ్న సాధనం. ఇది అంకితమైన SQL రైటింగ్ ఇంటర్ఫేస్. ఇది ఒక నిర్దిష్ట అర్థంలో, కేటలాగ్ నుండి ప్రత్యేక ఇంటర్ఫేస్. డెజ్ మరియు రాబిన్ కేటలాగ్ గురించి మాట్లాడారు, మరియు నేను వర్క్ఫ్లో సేవ చేయడానికి నేరుగా ఎలా తీసుకువచ్చానో దానికి కేటలాగ్ ఇంటర్ఫేస్ మీద కొంచెం దూకుతున్నాను.

నేను ఇక్కడ SQL ను టైప్ చేయగల స్థలాన్ని ఇక్కడ చూపిస్తున్నాను, మరియు దిగువన మీరు ప్రస్తావించే వస్తువుల గురించి కొంత సమాచారం ఉన్నట్లు మీరు చూస్తారు. కాబట్టి నేను ఒక ప్రశ్నను టైప్ చేయడాన్ని ప్రారంభించబోతున్నాను మరియు నేను ఈ జోక్యాలలో ఒకదానికి వచ్చినప్పుడు ఆగిపోతాను. కాబట్టి నేను "ఎంచుకోండి" అని టైప్ చేయండి మరియు నాకు సంవత్సరం కావాలి. నాకు పేరు కావాలి. మరియు నేను కొన్ని జీతం డేటాను చూడబోతున్నాను. కాబట్టి ఇది ఎడ్యుకేషన్ డేటా సెట్. ఇది ఉన్నత విద్యా సంస్థల గురించి సమాచారాన్ని కలిగి ఉంది మరియు ఈ పట్టికలలో ఒకదానిలో సగటు ఫ్యాకల్టీ జీతం చూస్తున్నాను.

కాబట్టి నేను నిజంగా "జీతం" అనే పదాన్ని టైప్ చేసాను. ఇది ఖచ్చితంగా కాలమ్ పేరులో కాదు. సలహాలను చేయడానికి మేము తార్కిక మెటాడేటా మరియు భౌతిక మెటాడేటా రెండింటినీ ఉపయోగిస్తాము. నేను ఇక్కడ ఎత్తి చూపించదలిచినది ఈ పసుపు పెట్టె ఇక్కడ కనిపిస్తుంది. ఇది ఈ కాలమ్‌లో హెచ్చరిక అని చెప్పారు. నేను దాని కోసం వెతకలేదు, ఈ డేటాను ఎలా ఉపయోగించాలో నేను క్లాస్ తీసుకోలేదు. ఇది నాకు వచ్చింది, మరియు ఈ డేటాతో సంబంధం ఉన్న గోప్యత ఒప్పందం గురించి ఇది ఒక హెచ్చరిక అవుతుంది. కాబట్టి కొన్ని బహిర్గతం నియమాలు ఉన్నాయి. నేను ఈ డేటాను ప్రశ్నించబోతున్నట్లయితే, నేను ఈ పట్టిక నుండి డేటాను తీయబోతున్నాను, నేను దానిని ఎలా బహిర్గతం చేస్తానో జాగ్రత్తగా ఉండాలి. కాబట్టి మీకు ఇక్కడ పాలన విధానం ఉంది. నేను డేటాను చూస్తున్న సమయంలో దాని గురించి నాకు తెలిసినప్పుడు ఈ విధానాన్ని పాటించడం చాలా సులభం చేసే కొన్ని సమ్మతి సవాళ్లు ఉన్నాయి.

కాబట్టి నేను నా దగ్గరకు వచ్చాను, ఆపై నేను కూడా ట్యూషన్ చూడబోతున్నాను. మరియు ఇక్కడ ప్రివ్యూలు అమలులోకి వస్తాయి. ఈ ట్యూషన్ కాలమ్‌లో, నేను చూస్తున్నాను - సంస్థ పట్టికలో ట్యూషన్ కాలమ్ ఉంది, మరియు నేను దాని ప్రొఫైల్‌ను చూస్తున్నాను. అలేషన్ వెళ్లి పట్టికల నుండి నమూనా డేటాను లాగుతుంది మరియు ఈ సందర్భంలో, ఇది నాకు చాలా ఆసక్తికరంగా ఉంటుంది. ఇది విలువల పంపిణీని నాకు చూపిస్తుంది మరియు సున్నా విలువ నమూనాలో 45 రెట్లు చూపించిందని మరియు ఇతర విలువ కంటే ఎక్కువ అని నాకు చూపిస్తుంది. కాబట్టి మనం కొంత డేటాను కోల్పోతున్నామని కొంత అవగాహన వచ్చింది.

నేను అధునాతన విశ్లేషకుడైతే, ఇది ఇప్పటికే నా వర్క్‌ఫ్లో భాగం కావచ్చు. ప్రత్యేకించి నేను ప్రత్యేకంగా ఖచ్చితమైనది అయితే, నేను సమయానికి ముందే ప్రొఫైలింగ్ ప్రశ్నల సమూహాన్ని చేస్తాను. నేను క్రొత్త డేటాను చేరుకున్నప్పుడల్లా, మా డేటా కవరేజ్ ఏమిటో నేను ఎప్పుడూ ఆలోచిస్తాను. నేను డేటా విశ్లేషణకు క్రొత్తగా ఉంటే, ఈ డేటా సెట్‌కు నేను క్రొత్తగా ఉంటే, ఒక కాలమ్ ఉంటే, అది అన్ని సమయాలలో నిండి ఉంటుందని నేను అనుకోవచ్చు. లేదా అది నింపకపోతే, అది సున్నా కాదు, శూన్యమైనది లేదా అలాంటిదేనని నేను అనుకోవచ్చు. ఈ సందర్భంలో, మనకు చాలా సున్నాలు ఉన్నాయి, మరియు నేను సగటున చేస్తే, అవి బహుశా తప్పు కావచ్చు, ఆ సున్నాలు డేటా తప్పిపోయిన బదులు వాస్తవానికి సున్నా అని నేను అనుకుంటే.

అయితే, ఈ ప్రివ్యూను మీ వర్క్‌ఫ్లో తీసుకురావడం ద్వారా, ఈ సమాచారాన్ని పరిశీలించమని మిమ్మల్ని అడుగుతుంది మరియు ఆ డేటా గురించి ఇక్కడ గమనించదగ్గ ఏదో ఉందని అనుభవం లేని విశ్లేషకులకు కూడా అవకాశం ఇస్తుంది. కాబట్టి మాకు ఆ ప్రివ్యూ ఉంది.

నేను చేయబోయే తదుపరి విషయం ఏమిటంటే, ఈ సమాచారాన్ని ఏ టేబుల్స్ నుండి పొందాలో తెలుసుకోవడానికి నేను ప్రయత్నిస్తాను. ఇక్కడ స్మార్ట్ సలహాలను చూస్తాము. ఇది ఎప్పటికప్పుడు జరుగుతోంది, కానీ ప్రత్యేకంగా ఇక్కడ, నేను ఏదైనా టైప్ చేయలేదు, కాని ఈ ప్రశ్న కోసం నేను ఏ టేబుల్స్ ఉపయోగించాలనుకుంటున్నాను అని నాకు సూచించబోతున్నాను. మరియు దీని గురించి తెలుసుకోవలసిన అతి ముఖ్యమైన విషయం ఏమిటంటే ఇది వినియోగ గణాంకాలను సద్వినియోగం చేసుకుంటుంది. ఉదాహరణకు, ఒకే డేటాబేస్లో మీరు వందల వేల టేబుల్స్ కలిగి ఉన్న ఇబే వంటి వాతావరణంలో, గోధుమలను గడ్డి నుండి కొట్టగల సాధనాన్ని కలిగి ఉండటం మరియు ఆ వినియోగ గణాంకాలను ఉపయోగించడం నిజంగా వీటిని తయారు చేయడానికి చాలా ముఖ్యమైనది ఏదో విలువైన సూచనలు.

కనుక ఇది ఈ పట్టికను సూచించబోతోంది. నేను పరిదృశ్యాన్ని చూసినప్పుడు, నా ప్రశ్నలో నేను ఇప్పటికే పేర్కొన్న మూడు నిలువు వరుసలను హైలైట్ చేస్తాము. అందువల్ల దాని మూడు ఉందని నాకు తెలుసు, కానీ దీనికి పేరు లేదు. నేను పేరు పొందాలి, కాబట్టి నేను చేరబోతున్నాను. నేను చేరినప్పుడు, ఇప్పుడు మళ్ళీ నాకు ఈ ప్రివ్యూలు ఉన్నాయి, నాకు కనుగొనడంలో సహాయపడతాయి, పేరు ఉన్న పట్టిక ఎక్కడ ఉంది. కాబట్టి ఇది చక్కగా ఆకృతీకరించిన, సరిగ్గా పెద్ద క్యాపిటలైజ్డ్ పేరును కలిగి ఉందని నేను చూశాను. ఇది ప్రతి సంస్థకు ఒక పేరుతో ఒక వరుసను కలిగి ఉన్నట్లు అనిపిస్తుంది, కాబట్టి నేను దానిని పట్టుకోబోతున్నాను, ఇప్పుడు నాకు చేరడానికి పరిస్థితి అవసరం.

అందువల్ల, ఇక్కడ Alation ఏమి చేస్తుందో మళ్ళీ ప్రశ్న లాగ్‌లను తిరిగి చూడటం, ఈ రెండు పట్టికలు చేరిన మునుపటి సార్లు చూడటం మరియు వాటిలో చేరడానికి వివిధ మార్గాలను సూచించడం. మరోసారి, కొంత జోక్యం ఉంది. నేను వీటిలో ఒకదాన్ని పరిశీలిస్తే, ఇది మొత్తం విశ్లేషణకు మాత్రమే ఉపయోగించబడాలని నాకు చూపించే హెచ్చరిక వచ్చింది. మీరు సంస్థ ద్వారా సంస్థ ద్వారా ఏదైనా చేయటానికి ప్రయత్నిస్తుంటే అది తప్పుగా తయారవుతుంది. మీరు విశ్వవిద్యాలయ-స్థాయి డేటాను కోరుకుంటే, ఈ రెండు పట్టికలలో చేరడానికి సరైన మార్గంగా OPE ID తో ఇది ఆమోదించబడింది. కాబట్టి నేను అలా చేస్తాను మరియు దాని యొక్క చిన్న ప్రశ్న, కానీ డేటా అంటే ఏమిటనే దానిపై ఎటువంటి అవగాహన లేకుండా నిజంగా నా ప్రశ్న రాశాను. నేను ఈ డేటా సెట్ యొక్క ER రేఖాచిత్రాన్ని ఎప్పుడూ చూడలేదు, కాని ఈ డేటా గురించి నాకు ఇప్పటికే చాలా తెలుసు ఎందుకంటే సంబంధిత సమాచారం నాకు వస్తోంది.

కాబట్టి అవి ఒక సమగ్ర ప్రశ్న సాధనం ద్వారా కేటలాగ్ చేయగల మూడు మార్గాలు, మీరు ప్రశ్నలు వ్రాస్తున్నప్పుడు వర్క్‌ఫ్లోను నేరుగా ప్రభావితం చేస్తాయి. ప్రశ్న సాధనాన్ని కేటలాగ్‌తో అనుసంధానించడం వల్ల కలిగే ఇతర ప్రయోజనాల్లో ఒకటి ఏమిటంటే, నేను నా ప్రశ్నను పూర్తి చేసి, దాన్ని సేవ్ చేసినప్పుడు, “ఇన్స్టిట్యూషన్ ట్యూషన్ మరియు ఫ్యాకల్టీ జీతం” వంటి శీర్షికను ఉంచగలను, ఆపై నాకు ఇక్కడ ఒక బటన్ ఉంది దీన్ని కేటలాగ్‌లో ప్రచురించడానికి నన్ను అనుమతిస్తుంది. దీన్ని తిరిగి తినిపించడం నాకు చాలా సులభం అవుతుంది. నేను దానిని ప్రచురించకపోయినా, అది ప్రశ్న లాగ్‌లో భాగంగా సంగ్రహించబడుతుంది, కాని నేను దానిని ప్రచురించినప్పుడు, వాస్తవానికి ఇది అన్ని డేటా పరిజ్ఞానం నివసించే కేంద్రీకృత ప్రదేశం యొక్క భాగం అవుతుంది.

అందువల్ల నేను అలేషన్‌లోని అన్ని ప్రశ్నల కోసం శోధించు క్లిక్ చేస్తే, నేను తీసుకోబోతున్నాను - మరియు ఇక్కడ మీరు మరికొన్ని కేటలాగ్ ఇంటర్‌ఫేస్‌ను చూస్తారు - నేను మొత్తం సంస్థ అంతటా ప్రశ్నలను కనుగొనటానికి ఒక మార్గాన్ని చూపించే అంకితమైన ప్రశ్న శోధనకు తీసుకువెళ్ళాను. నా కొత్తగా ప్రచురించిన ప్రశ్న ఎగువన ఉందని మీరు చూస్తారు. మరికొందరు ఇక్కడ గమనించవచ్చు, మేము ప్రశ్నలను సంగ్రహించినప్పుడు, మేము రచయితలను కూడా పట్టుకుంటాము మరియు రచయితగా నాకు మరియు ఈ డేటా వస్తువుల మధ్య ఈ సంబంధాన్ని నేను ఇప్పుడు ఏదో తెలుసుకున్నాను. మరియు నేను ఈ ప్రశ్నపై మరియు ఈ డేటా వస్తువులపై నిపుణుడిగా స్థాపించబడ్డాను. ప్రజలు డేటా గురించి తెలుసుకోవడానికి అవసరమైనప్పుడు ఇది నిజంగా సహాయపడుతుంది, అప్పుడు వారు తెలుసుకోవడానికి సరైన వ్యక్తిని కనుగొనవచ్చు. నేను నిజంగా డేటాకు క్రొత్తగా ఉంటే, నేను అధునాతన విశ్లేషకుడిగా ఉన్నాను - ఒక అధునాతన విశ్లేషకుడిగా, నేను దీనిని చూడవచ్చు మరియు క్రొత్త డేటా సమితిలో నన్ను ప్రారంభించే ఉదాహరణల సమూహాన్ని చూడవచ్చు. SQL తో సూపర్ అవగాహన లేని వ్యక్తిగా, నేను ముందుగా తయారుచేసిన ప్రశ్నలను కనుగొనగలను, అవి నేను సద్వినియోగం చేసుకోగల నివేదికలు.

మధ్యస్థ SAT స్కోర్‌ల గురించి ఫిల్ మజానెట్ రాసినది ఇక్కడ ఉంది. దీనిపై క్లిక్ చేయండి మరియు ప్రశ్న కోసం నేను కేటలాగ్ పేజీని పొందుతాను. ఇది ఈ ప్రశ్నను ప్రస్తావించే ఒక వ్యాసం గురించి మాట్లాడుతుంది, కాబట్టి నేను దానిని ఎలా ఉపయోగించాలో నేర్చుకోవాలనుకుంటే చదవడానికి కొన్ని డాక్యుమెంటేషన్ ఉంది. కంపోజ్ బటన్‌ను క్లిక్ చేయడం ద్వారా నేను దానిని ప్రశ్న సాధనంలో తెరవగలను మరియు దాన్ని సవరించకుండానే నేను ఇక్కడే అమలు చేయగలను. వాస్తవానికి, మీరు మా తేలికపాటి రిపోర్టింగ్ సామర్థ్యాలను కొంచెం చూడవచ్చు, ఇక్కడ, మీరు ఒక ప్రశ్న వ్రాస్తున్నప్పుడు, మీరు ఇలాంటి టెంప్లేట్ వేరియబుల్‌లో పడవచ్చు మరియు ఇది ఒక ప్రశ్నను అమలు చేయడానికి ఒక ఫారమ్‌ను సృష్టించడానికి ఒక సరళమైన మార్గాన్ని సృష్టిస్తుంది. పారామితుల జంట.

కాబట్టి నేను డెమో కోసం కలిగి ఉన్నాను. నేను స్లైడ్‌లకు తిరిగి మారబోతున్నాను.ఒక రకమైన రీక్యాప్ కోసం, ప్రశ్న సాధనంలో కనిపించే వస్తువులపై హెచ్చరికలను ఉంచడం ద్వారా ఒక నిర్వాహకుడు, డేటా గవర్నర్ ఎలా జోక్యం చేసుకోగలరో మేము చూపించాము, స్మార్ట్ సూచనలు చేయడానికి డేటా వస్తువుల వాడకంపై అలేషన్ తన జ్ఞానాన్ని ఎలా ఉపయోగిస్తుంది, అది ఎలా తెస్తుంది నిర్దిష్ట వస్తువులను తాకినప్పుడు విశ్లేషకుల వర్క్‌ఫ్లోలను మెరుగుపరచడానికి ప్రొఫైలింగ్ మరియు ఇతర చిట్కాలలో మరియు కొత్త ప్రశ్నలు వ్రాసినప్పుడు ఆ రకమైన ఫీడ్‌లు కేటలాగ్‌లోకి ఎలా తిరిగి వస్తాయి.

స్పష్టంగా నేను సంస్థ తరపున ప్రతినిధి. నేను డేటా కేటలాగ్ల గురించి మంచి విషయాలు చెప్పబోతున్నాను. మీరు మా కస్టమర్లలో ఒకరి నుండి నేరుగా వినాలనుకుంటే, సేఫ్‌వే వద్ద ఉన్న క్రిస్టీ అలెన్ విశ్లేషకుల బృందాన్ని నడుపుతున్నారు మరియు మార్కెటింగ్ ప్రయోగాన్ని అందించడానికి గడియారాన్ని నిజంగా ఓడించాల్సిన అవసరం ఉన్న సమయం గురించి మరియు ఆమె మొత్తం బృందం ఆ ప్రాజెక్ట్‌లో సహకరించడానికి మరియు త్వరగా తిరగడానికి అలేషన్‌ను ఉపయోగించింది. కాబట్టి మీరు ఆ కథను తనిఖీ చేయడానికి ఈ బిట్.లై లింక్‌ను అనుసరించవచ్చు లేదా మీ సంస్థలో డేటా కేటలాగ్‌ను అలేషన్ ఎలా తీసుకువస్తుందనే దాని గురించి మీరు కొంచెం వినాలనుకుంటే, వ్యక్తిగతీకరించిన డెమోని ఏర్పాటు చేయడం మాకు సంతోషంగా ఉంది. చాలా ధన్యవాదాలు.

రెబెకా జోజ్వియాక్: చాలా ధన్యవాదాలు, డేవిడ్. నేను ప్రేక్షకుల ప్రశ్నోత్తరాల వైపు తిరిగే ముందు డెజ్ మరియు రాబిన్ లకు కొన్ని ప్రశ్నలు ఉన్నాయని నేను ఖచ్చితంగా అనుకుంటున్నాను. డెజ్, మీరు మొదట వెళ్లాలనుకుంటున్నారా?

డెజ్ బ్లాంచ్ఫీల్డ్: ఖచ్చితంగా. ప్రచురించిన ప్రశ్నల యొక్క ఈ భావన యొక్క ఆలోచనను నేను ఇష్టపడుతున్నాను మరియు దానిని తిరిగి రచయిత యొక్క మూలానికి అనుసంధానిస్తున్నాను. అంతర్గత అనువర్తన స్టోర్ యొక్క ఈ ఆలోచనకు నేను దీర్ఘకాల ఛాంపియన్‌గా ఉన్నాను మరియు దానిపై నిర్మించడానికి ఇది నిజంగా గొప్ప పునాది అని నేను అనుకుంటున్నాను.

మీరు దీన్ని చేస్తున్న కొన్ని సంస్థల గురించి కొంత అవగాహన పొందడానికి నేను వచ్చాను, మరియు డేటాను కనుగొనటానికి మీ సాధనం మరియు ప్లాట్‌ఫారమ్‌ను ప్రోత్సహించడమే కాకుండా, ఈ మొత్తం ప్రయాణంతో వారు కలిగి ఉన్న కొన్ని విజయ కథలు. వారి అంతర్గత సాంస్కృతిక మరియు ప్రవర్తనా లక్షణాలను మార్చండి. ఇప్పుడు మీరు ఈ విధమైన అంతర్గత అనువర్తన దుకాణాన్ని కలిగి ఉన్నారు, ఇక్కడ మీరు డౌన్‌లోడ్ చేసుకోవచ్చు, వారు దానిని కనుగొనలేకపోయే భావన, కానీ వారు నిజంగా ఆ జ్ఞానాన్ని ఉంచే వారితో చిన్న సంఘాలను అభివృద్ధి చేయడం ప్రారంభించవచ్చు.

డేవిడ్ క్రాఫోర్డ్: అవును, నేను ఆశ్చర్యపోయానని అనుకుంటున్నాను. అడ్టెక్‌లో ప్రొడక్ట్ మేనేజర్‌గా నా గతం నుండి మరియు మేము మాట్లాడిన అన్ని కస్టమర్ల నుండి ప్రశ్నలను పంచుకోవడం యొక్క విలువను మేము విశ్వసిస్తున్నాము, కాని కస్టమర్లు దాని గురించి మాట్లాడే మొట్టమొదటి విషయాలలో ఇది ఎంత తరచుగా జరిగిందో నేను ఇప్పటికీ ఆశ్చర్యపోతున్నాను వారు Alation నుండి బయటపడే విలువ.

ఇన్వాయిస్ 2 గో అని పిలువబడే మా కస్టమర్లలో ఒకరి వద్ద నేను ప్రశ్న సాధనం యొక్క కొంత యూజర్ టెస్టింగ్ చేస్తున్నాను, మరియు వారికి క్రొత్తగా ఒక ప్రొడక్ట్ మేనేజర్ ఉన్నారు, మరియు వారు చెప్పారు - యూజర్ టెస్ట్ సమయంలో అసంపూర్తిగా అతను నాకు చెప్పాడు, “నేను నిజంగా రాయడం లేదు SQL అది అలేషన్ ద్వారా సులభతరం చేసింది తప్ప. ”మరియు వాస్తవానికి, PM గా, నేను ఒక రకంగా వెళ్తాను,“ మీ ఉద్దేశ్యం ఏమిటి, మేము ఎలా చేసాము? ”మరియు అతను ఇలా అన్నాడు,“ సరే, నిజంగా ఇది నేను ఎందుకంటే లాగిన్ అవ్వగలను మరియు ఇప్పటికే ఉన్న ఈ ప్రశ్నలన్నింటినీ నేను చూడగలను. ”SQL తో ఖాళీ స్లేట్‌తో ప్రారంభించడం చాలా కష్టతరమైన విషయం, కానీ ఇప్పటికే ఉన్న ప్రశ్నను సవరించడం వలన మీరు ఫలితాన్ని చూడగలుగుతారు మరియు మీరు“ ఓహ్ , నాకు ఈ అదనపు కాలమ్ అవసరం, ”లేదా,“ నేను దానిని ఒక నిర్దిష్ట శ్రేణి తేదీలకు ఫిల్టర్ చేయాలి, ”ఇది చాలా సులభం.

ప్రొడక్ట్ మేనేజర్లు, సేల్స్ ఆప్స్‌లో ఉన్నవారు, తీయడం మొదలుపెట్టేవారు, మరియు ఎల్లప్పుడూ SQL నేర్చుకోవాలనుకునేవారు మరియు ఈ కేటలాగ్‌ను ఉపయోగించడం ద్వారా దాన్ని ఎంచుకోవడం మొదలుపెట్టేవారు వంటి సహాయక పాత్రలను మేము చూశాము. ఓపెన్ సోర్స్ విధమైన చేయడానికి చాలా కంపెనీలు ప్రయత్నించాయని మేము చూశాము. నేను ఈ రకమైన వస్తువులను అంతర్గతంగా నిర్మించడానికి ప్రయత్నించాను, అక్కడ వారు ప్రశ్నలను ట్రాక్ చేసి అందుబాటులో ఉంచుతారు మరియు వాటిని ఉపయోగకరంగా చేయడానికి కొన్ని రకాల గమ్మత్తైన డిజైన్ సవాళ్లు ఉన్నాయి. వారు హైపాల్ అని పిలిచే ఒక అంతర్గత సాధనాన్ని కలిగి ఉన్నారు, ఆ విధమైన అందులో నివశించే తేనెటీగలో వ్రాసిన అన్ని ప్రశ్నలను సంగ్రహించారు, కానీ మీరు కనుగొన్నది ఏమిటంటే, మీరు వినియోగదారులను సరైన మార్గంలో తిప్పికొట్టకపోతే, మీరు చాలా పొడవైన జాబితాతో ముగుస్తుంది ఎంచుకున్న ప్రకటనల. మరియు ఒక ప్రశ్న నాకు ఉపయోగకరంగా ఉందో లేదో గుర్తించడానికి ప్రయత్నిస్తున్న వినియోగదారుగా లేదా ఏదైనా మంచిదైతే, నేను ఎంచుకున్న స్టేట్‌మెంట్‌ల యొక్క సుదీర్ఘ జాబితాను చూస్తే, అక్కడ విలువ నుండి ఏదో పొందడానికి నాకు చాలా సమయం పడుతుంది. మొదటి నుండి ప్రారంభమవుతుంది. సరైన అంశాలను ముందుకి తీసుకువచ్చే మరియు ఉపయోగకరమైన మార్గంలో అందించే ప్రశ్న కేటలాగ్‌ను ఎలా తయారు చేయాలో మేము చాలా జాగ్రత్తగా ఆలోచించాము.

డెజ్ బ్లాంచ్ఫీల్డ్: మనమందరం చాలా చిన్న వయస్సు నుండి, యుక్తవయస్సు వరకు, అనేక విధాలుగా ఈ ప్రయాణంలో వెళ్తామని నేను అనుకుంటున్నాను. టెక్నాలజీల సమూహం. నేను, వ్యక్తిగతంగా నేనే, కోడ్ కత్తిరించడం నేర్చుకోవడం వంటి అదే నిజమైన విషయం ద్వారా వెళ్ళాను. నేను మ్యాగజైన్స్ మరియు తరువాత పుస్తకాల ద్వారా వెళ్తాను, మరియు నేను ఒక నిర్దిష్ట స్థాయికి చదువుతాను, ఆపై నేను వెళ్లి దానిపై మరికొంత శిక్షణ మరియు విద్యను పొందవలసి ఉంది.

కానీ అనుకోకుండా నేను నేర్పించడం మరియు పత్రికలు చదవడం మరియు పుస్తకాలు చదవడం మరియు ఇతర ప్రజల కార్యక్రమాలను కత్తిరించడం మరియు దానిపై కోర్సులకు వెళ్ళేటప్పుడు కూడా నేను కనుగొన్నాను, నేను ఇతరులతో మాట్లాడటం వలె కోర్సులు చేయకుండా చాలా నేర్చుకున్నాను. కొన్ని అనుభవాలు కలిగిన వ్యక్తులు. మరియు దాని ఆసక్తికరమైన ఆవిష్కరణ, ఇప్పుడు మీరు దానిని డేటా అనలిటిక్స్కు తీసుకువచ్చినప్పుడు, ప్రాథమికంగా అదే సమాంతరాన్ని చూస్తున్నారని, మానవులు స్థిరంగా చాలా స్మార్ట్ అని నేను భావిస్తున్నాను.

నేను అర్థం చేసుకోవడానికి నిజంగా ఆసక్తిగా ఉన్న మరొక విషయం ఏమిటంటే, చాలా ఎక్కువ స్థాయిలో, “ఆ స్థానానికి చేరుకోవడానికి ఎంత సమయం పడుతుంది?” అని అడగబోతున్నారు. ప్రజలు మీ ప్లాట్‌ఫారమ్‌ను పొందినప్పుడు టిప్పింగ్ పాయింట్ టైమ్-ఫ్రేమ్ వారీగా ఏమిటి? వ్యవస్థాపించబడింది మరియు వారు సాధనాల రకాలను కనుగొనడం ప్రారంభించారు? ప్రజలు ఈ విషయాన్ని నిజంగా ఎంత త్వరగా "ఎ-హ" గా మారుస్తారో వారు ఎంత త్వరగా చూస్తారు, అక్కడ వారు ROI గురించి చింతించటం లేదని వారు గ్రహించారు, ఎందుకంటే అక్కడ వారు ఉన్నారు, కానీ ఇప్పుడు వారు వ్యాపారం చేసే విధానాన్ని నిజంగా మారుస్తున్నారా? మరియు వారు కోల్పోయిన కళను కనుగొన్నారు మరియు వారు నిజంగా ఏదైనా చేయగలరని వారు భావిస్తున్నారు, దానితో నిజంగా సరదాగా ఉంటారు.

డేవిడ్ క్రాఫోర్డ్: అవును, నేను దానిపై కొద్దిగా తాకగలను. నేను వ్యవస్థాపించినప్పుడు, డేటా వ్యవస్థల్లోకి నేరుగా అనుసంధానించబడిన కేటలాగ్ గురించి ప్రజలు ఇష్టపడే ఒక మంచి విషయం ఏమిటంటే, మీరు ఖాళీగా ప్రారంభించవద్దు, అక్కడ మీరు దాన్ని పేజీలో నింపాలి. పేజీ. మునుపటి డేటా పరిష్కారాల విషయంలో ఇది ఒక రకమైన నిజం, ఇక్కడ మీరు ఖాళీ సాధనంతో ప్రారంభిస్తారు మరియు మీరు డాక్యుమెంట్ చేయదలిచిన ప్రతిదానికీ ఒక పేజీని సృష్టించడం ప్రారంభించాలి.

మెటాడేటాను సంగ్రహించడం ద్వారా మేము చాలా విషయాలను స్వయంచాలకంగా డాక్యుమెంట్ చేస్తున్నందున, సాఫ్ట్‌వేర్‌ను ఇన్‌స్టాల్ చేసిన కొద్ది రోజుల్లోనే, మీ డేటా ఎన్విరాన్మెంట్ యొక్క చిత్రాన్ని మీరు సాధనంలో కనీసం 80 శాతం కలిగి ఉండవచ్చు. ప్రజలు సాధనంతో ప్రశ్నలు రాయడం ప్రారంభించిన వెంటనే, అవి స్వయంచాలకంగా కేటలాగ్‌లోకి తిరిగి సేవ్ చేయబడతాయి మరియు అందువల్ల అవి కూడా చూపించడం ప్రారంభిస్తాయి.

నేను దానిని చెప్పడంలో అతిగా ఆసక్తి చూపడం ఇష్టం లేదు. నేను రెండు వారాలు ఒక నెల వరకు మంచి సంప్రదాయవాద అంచనా అని అనుకుంటున్నాను. రెండు వారాల నుండి ఒక నెల వరకు, సాంప్రదాయిక అంచనా నిజంగా తిరగడం మరియు మీరు దాని నుండి విలువను పొందుతున్నట్లు అనిపిస్తుంది, మీరు కొంత జ్ఞానాన్ని పంచుకోవడం మొదలుపెట్టారు మరియు అక్కడకు వెళ్లి మీ డేటా గురించి తెలుసుకోగలుగుతారు.

డెజ్ బ్లాంచ్ఫీల్డ్: ఇది చాలా ఆశ్చర్యకరమైనది, నిజంగా, మీరు దాని గురించి ఆలోచించినప్పుడు. మీరు సమర్థవంతంగా ఇండెక్సింగ్ మరియు కేటలాగ్ చేస్తున్న కొన్ని పెద్ద డేటా ప్లాట్‌ఫారమ్‌లు అమలు చేయడానికి మరియు అమలు చేయడానికి మరియు సరిగ్గా నిలబడటానికి కొన్నిసార్లు సంవత్సరానికి పడుతుంది.

నేను రాబిన్ బ్లూర్‌కు అప్పగించే ముందు మీ కోసం అడిగిన చివరి ప్రశ్న కనెక్టర్లు. వెంటనే నా వద్దకు దూకిన వాటిలో ఒకటి మీరు స్పష్టంగా ఆ మొత్తం సవాలును క్రమబద్ధీకరించారు. కాబట్టి ఒక జంట ప్రశ్నలు చాలా త్వరగా. ఒకటి, కనెక్టర్లు ఎంత వేగంగా అమలు అవుతాయి? సహజంగానే మీరు ఒరాకిల్స్ మరియు టెరాడాటాస్ వంటి అతిపెద్ద ప్లాట్‌ఫామ్‌తో ప్రారంభిస్తారు మరియు DB2 లు. కొత్త కనెక్టర్లు ఎంత క్రమం తప్పకుండా వస్తున్నాయో మీరు చూస్తున్నారు, మరియు వారు ఏ సమయం తీసుకుంటారు? మీరు వారికి ప్రామాణిక ఫ్రేమ్‌వర్క్ కలిగి ఉన్నారని నేను imagine హించాను. మరియు మీరు వాటిలో ఎంత లోతుగా వెళతారు? ఉదాహరణకు, ప్రపంచంలోని ఒరాకిల్స్ మరియు ఐబిఎంలు, మరియు టెరడేటా కూడా, ఆపై చివరి ఓపెన్ సోర్స్ ప్లాట్‌ఫామ్‌లలో కొన్ని జనాదరణ పొందాయి. వారు మీతో నేరుగా పనిచేస్తున్నారా? మీరు దానిని మీరే కనుగొంటున్నారా? ఆ ప్లాట్‌ఫామ్‌లపై మీకు లోపల జ్ఞానం ఉందా?

కనెక్టర్‌ను అభివృద్ధి చేయడం ఎలా ఉంటుంది, మరియు ఆ కనెక్టర్‌లు మీరు చేయగలిగిన ప్రతిదాన్ని కనుగొంటున్నారని నిర్ధారించుకోవడానికి మీరు ఆ భాగస్వామ్యాలకు ఎంత లోతుగా పాల్గొంటారు?

డేవిడ్ క్రాఫోర్డ్: అవును, ఖచ్చితంగా, ఇది గొప్ప ప్రశ్న. చాలా వరకు, మేము కనెక్టర్లను అభివృద్ధి చేయగలమని నేను అనుకుంటున్నాను. మేము చిన్న వయస్సులో ఉన్నప్పుడు మరియు కస్టమర్‌లు లేనప్పుడు మేము ఖచ్చితంగా చేసాము. అంతర్గత ప్రాప్యత అవసరం లేకుండా మేము ఖచ్చితంగా కనెక్షన్‌లను అభివృద్ధి చేయవచ్చు. బహిరంగంగా అందుబాటులో లేని డేటా సిస్టమ్‌లకు మరియు ప్రత్యేకమైన సమాచారం అవసరం లేకుండానే మాకు ప్రత్యేక ప్రాప్యత లభించదు. డేటా సిస్టమ్స్ ద్వారా లభించే మెటాడేటా సేవలను మేము సద్వినియోగం చేసుకుంటాము. తరచుగా అవి చాలా క్లిష్టంగా ఉంటాయి మరియు పని చేయడం కష్టం. నాకు ప్రత్యేకంగా SQL సర్వర్ తెలుసు, వారు ప్రశ్న లాగ్‌ను నిర్వహించే విధానం, అనేక విభిన్న కాన్ఫిగరేషన్‌లు మరియు మీరు నిజంగా పని చేయాల్సిన విషయం. దాన్ని సరిగ్గా సెటప్ చేయడానికి మీరు దానిపై ఉన్న సూక్ష్మ నైపుణ్యాలు మరియు గుబ్బలు మరియు డయల్‌లను అర్థం చేసుకోవాలి మరియు మేము కస్టమర్లతో కలిసి పని చేసే పనిని మేము ఇంతకుముందు చాలాసార్లు చేశాము.

కానీ కొంతవరకు, అందుబాటులో ఉన్న పబ్లిక్ API లు లేదా పబ్లిక్ ఇంటర్‌ఫేస్‌లు అందుబాటులో ఉన్నాయి. ఈ సంస్థలలో చాలా మందితో మాకు భాగస్వామ్యం ఉంది, ఇది ఎక్కువగా ధృవీకరణకు ఒక ఆధారం, తద్వారా మేము పని చేస్తున్నామని వారు సుఖంగా భావిస్తారు మరియు వారు పరీక్ష కోసం మాకు వనరులను కూడా అందించగలరు, కొన్నిసార్లు ప్రారంభ ప్లాట్‌ఫారమ్‌కు ప్రారంభ ప్రాప్యత ఉండవచ్చు. మేము క్రొత్త సంస్కరణల్లో పని చేస్తాము.

క్రొత్త కనెక్షన్ చుట్టూ తిరగడానికి, నేను మళ్ళీ చెబుతాను, సాంప్రదాయికంగా ఉండటానికి ప్రయత్నిస్తున్నాను, ఆరు వారాల నుండి రెండు నెలల వరకు చెప్పనివ్వండి. ఇది ఎంత సారూప్యతపై ఆధారపడి ఉంటుంది. కాబట్టి పోస్ట్‌గ్రేలో కొన్ని రెడ్‌షిఫ్ట్‌తో సమానంగా కనిపిస్తాయి. రెడ్‌షిఫ్ట్ మరియు వెర్టికా వారి వివరాలను చాలా పంచుకుంటాయి. కాబట్టి మనం ఆ విషయాలను సద్వినియోగం చేసుకోవచ్చు. కానీ అవును, ఆరు వారాల నుండి రెండు నెలల వరకు న్యాయంగా ఉంటుంది.

మాకు API లు కూడా ఉన్నాయి, అందువల్ల - మేము అలేషన్‌ను మెటాడేటా ప్లాట్‌ఫామ్‌గా భావిస్తాము, కాబట్టి మనకు చేరుకోవడానికి మరియు స్వయంచాలకంగా పట్టుకోవటానికి ఏదైనా అందుబాటులో లేకపోతే, మీరు కనెక్టర్‌ను మీరే వ్రాసి మా సిస్టమ్‌లోకి నెట్టడానికి మార్గాలు ఉన్నాయి ప్రతిదీ ఒకే సెర్చ్ ఇంజిన్‌లో కేంద్రీకృతమై ఉంటుంది.

డెజ్ బ్లాంచ్ఫీల్డ్: ఫన్టాస్టిక్. నేను దానిని అభినందిస్తున్నాను. కాబట్టి దానిని రాబిన్‌కు అప్పగించబోతున్నాను, ఎందుకంటే అతనికి చాలా ప్రశ్నలు ఉన్నాయని నేను ఖచ్చితంగా అనుకుంటున్నాను. రాబిన్?

రెబెకా జోజ్వియాక్: రాబిన్ మ్యూట్ కావచ్చు.

డెజ్ బ్లాంచ్ఫీల్డ్: మీరు మీరే మ్యూట్ చేసుకున్నారు.

రాబిన్ బ్లూర్: అవును నిజం. క్షమించండి, నేను మ్యూట్ చేసాను. మీరు దీన్ని అమలు చేసినప్పుడు, ప్రక్రియ ఏమిటి? నేను చాలా ఆసక్తిగా ఉన్నాను ఎందుకంటే చాలా చోట్ల చాలా డేటా ఉంటుంది. కాబట్టి అది ఎలా పని చేస్తుంది?

డేవిడ్ క్రాఫోర్డ్: అవును ఖచ్చితంగా. మేము లోపలికి వెళ్తాము, మొదట మా సర్వర్లు ప్రొవిజన్ చేయబడిందని, నెట్‌వర్క్ కనెక్షన్లు అందుబాటులో ఉన్నాయని, పోర్టులు తెరిచి ఉన్నాయని నిర్ధారించుకునే ఒక ఐటి ప్రక్రియ. వారు ఏ వ్యవస్థలతో ప్రారంభించాలనుకుంటున్నారో వారందరికీ తరచుగా తెలుసు. డేటా సిస్టమ్ లోపల తెలుసుకోవడం, ఇది - మరియు కొన్నిసార్లు మేము వారికి సహాయం చేస్తాము. సిస్టమ్‌లో వారు ఏమి మరియు ఎంత మంది వినియోగదారులను ఉపయోగిస్తున్నారో అర్థం చేసుకోవడానికి వారి ప్రశ్న లాగ్‌ను ప్రారంభంలో చూడటానికి వారికి సహాయపడండి. ఎక్కడ ఉన్నారో తెలుసుకోవడానికి బాగా సహాయపడండి - వారు తరచూ, డేటాబేస్లలోకి లాగిన్ అవుతున్న వందలాది లేదా వేల మందిని వారు పొందినట్లయితే, వారు ఎక్కడ లాగిన్ అవుతున్నారో వారికి తెలియదు, కాబట్టి ప్రశ్న లాగ్ల నుండి ఎన్ని ప్రత్యేకమైన వినియోగదారు ఖాతాలు ఉన్నాయో తెలుసుకోవచ్చు. మీరు నిజంగా ఇక్కడ లాగిన్ అయ్యారు మరియు ఒక నెలలో ప్రశ్నలను అమలు చేస్తారు.

కాబట్టి మేము దానిని సద్వినియోగం చేసుకోవచ్చు, కాని తరచుగా చాలా ముఖ్యమైన వాటిపై మాత్రమే. మేము వాటిని సెటప్ చేసి, ఆపై "ప్రాధాన్యత ఇద్దాం" అని చెప్పే ప్రక్రియ ఉంటుంది. సమాంతరంగా జరిగే అనేక కార్యకలాపాలు ఉన్నాయి. ప్రశ్న సాధనాన్ని ఉపయోగించడం కోసం నేను శిక్షణపై దృష్టి పెడతాను. ప్రజలు ప్రశ్న సాధనాన్ని ఉపయోగించడం ప్రారంభించిన తర్వాత, మొదట, చాలా మంది ప్రజలు తమ విభిన్న వ్యవస్థలన్నింటికీ ఒకే ఇంటర్‌ఫేస్ అనే వాస్తవాన్ని ఇష్టపడతారు. దాని వెబ్-ఆధారిత, వారు కోరుకోకపోతే ఏదైనా ఇన్‌స్టాల్‌లను కలిగి ఉండరు అనే వాస్తవాన్ని కూడా వారు ఇష్టపడతారు. భద్రతా దృక్కోణం నుండి, నెట్‌వర్క్ దృక్కోణం నుండి, ఒక కార్ప్ ఐటి నెట్‌వర్క్ మరియు ఉత్పత్తి డేటా వనరులు నివసించే డేటా సెంటర్ మధ్య ఒకే ఎంట్రీ పాయింట్‌ను కలిగి ఉండటానికి వారు ఇష్టపడతారు. అందువల్ల, వారు ప్రశ్న సాధనంగా అలేషన్‌ను ఏర్పాటు చేస్తారు మరియు ఈ వ్యవస్థలన్నింటికీ ప్రాప్యత బిందువుగా కంపోజ్‌ను ఉపయోగించడం ప్రారంభిస్తారు.

కాబట్టి అది జరిగిన తర్వాత, మేము అక్కడ శిక్షణపై దృష్టి కేంద్రీకరిస్తాము, మీ డెస్క్‌టాప్‌లో మీకు ఉన్న వెబ్-ఆధారిత లేదా సర్వర్-ఆధారిత ప్రశ్న సాధనం మధ్య ఉన్న కొన్ని తేడాలు ఏమిటో అర్థం చేసుకోవడం మరియు దానిని ఉపయోగించడం యొక్క కొన్ని సూక్ష్మ నైపుణ్యాలు. అదే సమయంలో చాలా విలువైన డేటాను గుర్తించడం, ప్రశ్న లాగ్ సమాచారాన్ని మళ్ళీ సద్వినియోగం చేసుకోవడం మరియు “హే, మీరు లోపలికి వెళ్లి వీటిని అర్థం చేసుకోవడానికి ప్రజలకు సహాయపడవచ్చు. ఈ పట్టికలలో ప్రతినిధి ప్రశ్నలను ప్రచురించడం ప్రారంభిద్దాం. ”ఇది చాలా త్వరగా ప్రజలను త్వరగా తిప్పికొట్టడానికి అత్యంత ప్రభావవంతమైన మార్గం. మీ స్వంత ప్రశ్న చరిత్రను చూద్దాం, ఈ విషయాలను ప్రచురించండి, తద్వారా అవి మొదటి ప్రశ్నలుగా కనిపిస్తాయి. ప్రజలు పట్టిక పేజీని చూసినప్పుడు, వారు ఆ పట్టికను తాకిన అన్ని ప్రశ్నలను చూడగలరు మరియు వారు అక్కడ నుండి ప్రారంభించవచ్చు. ఆపై ఈ వస్తువులకు శీర్షికలు మరియు వివరణలను జోడించడం ప్రారంభిద్దాం, తద్వారా అవి కనుగొనడం మరియు శోధించడం సులభం, తద్వారా దీన్ని ఎలా ఉపయోగించాలో కొన్ని సూక్ష్మ నైపుణ్యాలు మీకు తెలుస్తాయి.

మేము ప్రశ్న లాగ్‌ను క్షుణ్ణంగా పరిశీలించేలా చూస్తాము, తద్వారా మేము వంశాన్ని సృష్టించగలము. మనం చేసే పనులలో ఒకటి, డేటా ఒక పట్టిక నుండి మరొకదానికి కదిలే సమయాల్లో ప్రశ్న లాగ్ ద్వారా చూడటం, మరియు ఇది డేటా పట్టిక గురించి తరచుగా అడిగే ప్రశ్నలలో ఒకదాన్ని ఉంచడానికి అనుమతిస్తుంది, ఇది ఎక్కడ నుండి వచ్చింది? నేను ఎలా విశ్వసించగలను? కాబట్టి మనం చూపించగలిగేది అది ఏ ఇతర పట్టికల నుండి వచ్చింది అనేది మాత్రమే కాదు, కానీ అది మార్గం వెంట ఎలా మార్చబడింది. మళ్ళీ, ఇది ప్రశ్న లాగ్ ద్వారా ఆధారితం.

కాబట్టి మేము ఆ విషయాలు ఏర్పాటు చేయబడిందని మరియు అవి వ్యవస్థలోకి వంశపారంపర్యంగా ఉన్నాయని మేము నిర్ధారించుకుంటాము మరియు టేబుల్ పేజీలలో మేము స్థాపించగలిగే అత్యంత విలువైన మరియు అత్యంత పరపతి కలిగిన మెటాడేటా ముక్కలను లక్ష్యంగా చేసుకున్నాము, తద్వారా మీరు శోధించినప్పుడు, మీకు ఉపయోగకరమైనది కనిపిస్తుంది.

రాబిన్ బ్లూర్: సరే. మరొక ప్రశ్న - ప్రేక్షకుల నుండి చాలా ప్రశ్నలు ఉన్నాయి, కాబట్టి నేను ఇక్కడ ఎక్కువ సమయం తీసుకోకూడదనుకుంటున్నాను - ఆ రకమైన గుర్తుకు వచ్చే ఇతర ప్రశ్న ఏమిటంటే, కేవలం నొప్పి పాయింట్లు. ప్రజలు ఒక విధంగా లేదా మరొక విధంగా, ఏదో ఒకదానితో ఇబ్బందులు ఎదుర్కొంటున్నందున చాలా సాఫ్ట్‌వేర్‌లు కొనుగోలు చేయబడ్డాయి. కాబట్టి ప్రజలను అలేషన్‌కు నడిపించే సాధారణ నొప్పి పాయింట్ ఏమిటి?

డేవిడ్ క్రాఫోర్డ్: అవును. కొన్ని ఉన్నాయని నేను అనుకుంటున్నాను, కాని మనం చాలా తరచుగా వినే వాటిలో ఒకటి విశ్లేషకుడు ఆన్‌బోర్డింగ్. "నేను ఈ డేటా నుండి క్రొత్త అంతర్దృష్టులను ఉత్పత్తి చేయబోయే 10, 20, 30 మందిని నియమించాల్సిన అవసరం ఉంది, వారు ఎలా వేగవంతం అవుతారు?" కాబట్టి విశ్లేషకుడు ఆన్‌బోర్డింగ్ అనేది మేము ఖచ్చితంగా పరిష్కరించే విషయం. డేటా గురించి ఇతర వ్యక్తుల ప్రశ్నలకు సమాధానం ఇవ్వడానికి సీనియర్ విశ్లేషకులను తమ సమయాన్ని వెచ్చించకుండా థెరేస్ ఉపశమనం పొందుతారు. ఇది చాలా తరచుగా ఉంటుంది. మరియు ఆ రెండూ తప్పనిసరిగా విద్యా సమస్యలు.

ఎవరైనా పని చేయడానికి ఒక సరికొత్త డేటా వాతావరణాన్ని ఏర్పాటు చేయాలనుకున్నప్పుడు ప్రజలు అలేషన్‌ను స్వీకరించడాన్ని మనం చూసే మరొక స్థలాన్ని నేను చెబుతాను. ప్రజలు దీనిని సద్వినియోగం చేసుకోవడానికి అంతర్గతంగా ప్రకటనలు మరియు మార్కెట్ చేయాలనుకుంటున్నారు. ఆ కొత్త విశ్లేషణాత్మక వాతావరణానికి అలేషన్‌ను ఫ్రంట్ ఎండ్‌గా మార్చడం చాలా ఆకర్షణీయంగా ఉంది. దీనికి డాక్యుమెంటేషన్ వచ్చింది, దీనికి ఒక పరిచయ స్థానం వచ్చింది - వ్యవస్థలకు ఒకే పాయింట్ యాక్సెస్, మరియు ప్రజలు మన వద్దకు వచ్చే మరొక ప్రదేశం.

రాబిన్ బ్లూర్: సరే, ప్రేక్షకులు మిమ్మల్ని సంప్రదించడానికి ప్రయత్నిస్తున్నందున నేను మిమ్మల్ని రెబెక్కాకు పంపిస్తాను.

రెబెకా జోజ్వియాక్: అవును, మాకు ఇక్కడ మంచి ప్రేక్షకుల ప్రశ్నలు చాలా ఉన్నాయి. మరియు డేవిడ్, ఇది మీకు ప్రత్యేకంగా ఎదురైంది. ఇది వ్యక్తులతో దుర్వినియోగ ప్రశ్నలతో కొంత అనుభవం ఉన్న వ్యక్తి నుండి, మరియు అతను వినియోగదారులను ఎంతగా శక్తివంతం చేస్తాడో, కంప్యూట్ వనరుల బాధ్యతాయుతమైన వినియోగాన్ని నియంత్రించడం కష్టం అని ఆయన అన్నారు. కాబట్టి మీరు తప్పుదారి పట్టించిన కాని సాధారణ ప్రశ్న పదబంధాల ప్రచారం నుండి రక్షించగలరా?

డేవిడ్ క్రాఫోర్డ్: అవును, నేను ఈ ప్రశ్నను చూస్తున్నాను. ఇది గొప్ప ప్రశ్న - ఒకటి మనం చాలా తరచుగా పొందుతాము. మునుపటి కంపెనీలలో నేను నొప్పిని చూశాను, ఇక్కడ మీరు వినియోగదారులకు శిక్షణ ఇవ్వాలి. ఉదాహరణకు, “ఇది లాగ్ టేబుల్, దాని లాగ్‌లు సంవత్సరాల తరబడి వెళ్తాయి. మీరు ఈ పట్టికలో ఒక ప్రశ్న రాయబోతున్నట్లయితే, మీరు నిజంగా తేదీని పరిమితం చేయాలి. ”కాబట్టి, ఉదాహరణకు, డేటాబేస్కు ప్రాప్యత ఇవ్వడానికి ముందు నేను మునుపటి కంపెనీలో చేసిన శిక్షణ.

దీన్ని పరిష్కరించడానికి మేము ప్రయత్నించే కొన్ని మార్గాలు ఉన్నాయి. ప్రశ్న లాగ్ డేటా దాన్ని పరిష్కరించడానికి నిజంగా విలువైనదని నేను భావిస్తున్నాను. డేటాబేస్ దాని ప్రశ్న ప్లానర్‌తో అంతర్గతంగా ఏమి చేస్తుందో దానికి వ్యతిరేకంగా ఇది మరొక అంతర్దృష్టిని ఇస్తుంది. మరియు మనం చేసేది, ఆ జోక్యాలలో ఒకటి - నేను చూపించిన మాన్యువల్ జోక్యాలను కలిగి ఉన్నాము మరియు అది ఉపయోగకరంగా ఉంటుంది, సరియైనదా? కాబట్టి ఒక నిర్దిష్ట చేరికలో, ఉదాహరణకు, "దీనిని తీసివేద్దాం" అని మీరు చెప్పవచ్చు. స్మార్ట్ సూచించినప్పుడు ఇది పెద్ద ఎర్ర జెండాను కలిగి ఉంటుంది. కాబట్టి ప్రజలను పొందడానికి ప్రయత్నిస్తున్న ఒక మార్గం.

మేము చేసే మరో విషయం ఏమిటంటే, అమలు-సమయ జోక్యాలలో ఆటోమేటెడ్. మేము చూడటానికి అమలు చేయడానికి ముందు అది ప్రశ్న యొక్క పార్స్ చెట్టును ఉపయోగిస్తుంది, ఇందులో ఒక నిర్దిష్ట ఫిల్టర్ లేదా మనం అక్కడ చేసే కొన్ని ఇతర విషయాలు ఉన్నాయా? కానీ చాలా విలువైన వాటిలో ఒకటి మరియు వివరించడానికి సరళమైనది, ఇందులో ఫిల్టర్ ఉందా? కాబట్టి నేను ఇప్పుడే ఇచ్చిన ఉదాహరణ లాగా, ఈ లాగ్ టేబుల్, మీరు దానిని ప్రశ్నించబోతున్నట్లయితే, తేదీ పరిధిని కలిగి ఉండాలి, మీరు ఆ తేదీ శ్రేణి వడపోతను వర్తింపజేయాలని మీరు ఆదేశించినట్లు అక్కడ పట్టిక పేజీలో పేర్కొనవచ్చు. ఆ ఫిల్టర్‌ను చేర్చని ప్రశ్నను ఎవరైనా అమలు చేయడానికి ప్రయత్నిస్తే, అది నిజంగా వాటిని పెద్ద హెచ్చరికతో ఆపివేస్తుంది మరియు ఇది “మీ ప్రశ్నకు ఇలా కనిపించే కొన్ని SQL ని మీరు జోడించాలి” అని ఇది చెబుతుంది. వారు కోరుకుంటే వారు కొనసాగించవచ్చు . వాస్తవానికి వాటిని ఉపయోగించకుండా పూర్తిగా నిషేధించబోవడం లేదు - దాని ప్రశ్న కూడా, రోజు చివరిలో, ప్రశ్నలను అమలు చేయండి. కానీ మేము వారి ముందు చాలా పెద్ద అవరోధం ఉంచాము మరియు మేము వారి సూచనను ఇస్తాము, వారి పనితీరును మెరుగుపరచడానికి ప్రశ్నను సవరించడానికి ఒక కాంక్రీట్ వర్తించే సూచన.

ప్రశ్న లాగ్‌ను గమనించడం ద్వారా మేము కొన్ని సందర్భాల్లో స్వయంచాలకంగా కూడా చేస్తాము. ఈ పట్టికలోని కొన్ని పెద్ద శాతం ప్రశ్నలు ఒక నిర్దిష్ట ఫిల్టర్ లేదా ఒక నిర్దిష్ట జాయిన్ నిబంధన యొక్క ప్రయోజనాన్ని పొందుతాయని మేము చూస్తే, వాస్తవానికి దాన్ని పాపప్ చేయండి. దానిని జోక్యానికి ప్రోత్సహించండి. అసలైన, ఇది అంతర్గత డేటా సెట్‌లో నాకు జరిగింది. మాకు కస్టమర్ డేటా ఉంది మరియు మాకు యూజర్ ఐడిలు ఉన్నాయి, కానీ యూజర్ ఐడి సెట్, దాని రకమైనది - ప్రతి కస్టమర్ వద్ద మాకు యూజర్ ఐడిలు ఉన్నాయి. ఇది ప్రత్యేకమైనది కాదు, కాబట్టి మీరు ప్రత్యేకమైన జాయిన్ కీని పొందడానికి క్లయింట్ ID తో జత చేయాలి.మరియు నేను ఒక ప్రశ్న వ్రాస్తున్నాను మరియు నేను ఏదో విశ్లేషించడానికి ప్రయత్నించాను మరియు అది పాప్ అప్ అయ్యింది మరియు “హే, మిగతా అందరూ ఈ పట్టికలలో క్లయింట్ ID మరియు యూజర్ ఐడి రెండింటిలో చేరాలని అనిపిస్తుంది. మీరు ఖచ్చితంగా అలా చేయకూడదనుకుంటున్నారా? ”మరియు ఇది నిజంగా కొన్ని తప్పు విశ్లేషణ చేయకుండా నన్ను ఆపివేసింది. కనుక ఇది విశ్లేషణ యొక్క ఖచ్చితత్వంతో పాటు పనితీరు రెండింటికీ పనిచేస్తుంది. కాబట్టి మేము ఆ సమస్యను ఎలా తీసుకుంటాము.

రెబెకా జోజ్వియాక్: అది నాకు ప్రభావవంతంగా అనిపిస్తుంది. మీరు వనరులను హాగ్ చేయకుండా ప్రజలను నిరోధించరని మీరు చెప్పారు, కాని వారు చేస్తున్నది ఉత్తమమైనది కాదని వారికి నేర్పండి, సరియైనదా?

డేవిడ్ క్రాఫోర్డ్: వినియోగదారులు హానికరం కాదని మేము ఎల్లప్పుడూ అనుకుంటాము - వారికి ఉత్తమమైన ఉద్దేశాలను ఇవ్వండి - మరియు మేము ఆ విధంగా చాలా ఓపెన్‌గా ఉండటానికి ప్రయత్నిస్తాము.

రెబెకా జోజ్వియాక్: సరే. మరొక ప్రశ్న ఇక్కడ ఉంది: “మీ పరిష్కారంతో పాటు కేటలాగ్ మేనేజర్ మరియు MDM సాధనం మధ్య తేడా ఏమిటి? లేదా ప్రశ్న పట్టికల ఎంపికను విస్తృతం చేయడం ద్వారా ఇది వేరే ప్రిన్సిపాల్‌పై ఆధారపడుతుందా, అయితే MDM దీన్ని స్వయంచాలకంగా చేస్తుంది, కానీ మెటాడేటాను సేకరించే అంతర్లీన ప్రిన్సిపాల్‌తో. "

డేవిడ్ క్రాఫోర్డ్: అవును, నేను సాంప్రదాయ MDM పరిష్కారాలను చూసినప్పుడు, ప్రాధమిక వ్యత్యాసం ఒక తాత్వికమైనదని నేను భావిస్తున్నాను. వినియోగదారు ఎవరో దాని గురించి. నా ప్రెజెంటేషన్ ప్రారంభంలో నేను చెప్పినట్లుగా, అలేషన్, నేను స్థాపించినప్పుడు, విశ్లేషకులు మరింత అంతర్దృష్టులను ఉత్పత్తి చేయటానికి, వాటిని వేగంగా ఉత్పత్తి చేయడానికి, వారు అంతర్దృష్టులలో మరింత ఖచ్చితమైనదిగా ఉండటానికి ఉద్దేశించిన లక్ష్యంతో మేము స్థాపించబడ్డాము. ఉత్పత్తి. సాంప్రదాయ ఎండిఎమ్ పరిష్కారం యొక్క లక్ష్యం ఇదేనని నేను అనుకోను. ఆ పరిష్కారాలు ఏ రకమైన ఆడిటింగ్ ప్రయోజనం కోసం ఎస్.సి.సికి లేదా అంతర్గతంగా ఏ డేటాను సంగ్రహించాయో నివేదికలను ఉత్పత్తి చేయాల్సిన వ్యక్తులపై లక్ష్యంగా ఉంటాయి. ఇది కొన్నిసార్లు విశ్లేషకులను ప్రారంభించగలదు, కానీ ఇది చాలా తరచుగా, ఇది వారి అభ్యాసంలో ఒక అభ్యాసకుడిని ప్రారంభించబోతున్నట్లయితే, DBA వంటి డేటా ఆర్కిటెక్ట్‌ను ప్రారంభించే అవకాశం ఉంది.

మీరు విశ్లేషకుడి దృక్కోణం నుండి విషయాల గురించి ఆలోచించినప్పుడు, మీరు MDM సాధనం ఎప్పటికీ చేయని ప్రశ్న సాధనాన్ని రూపొందించడం ప్రారంభించినప్పుడు. మీరు పనితీరు గురించి మరియు ఖచ్చితత్వం గురించి ఆలోచించడం మొదలుపెట్టినప్పుడు, అలాగే నా వ్యాపార అవసరానికి సంబంధించిన డేటా ఏమిటో అర్థం చేసుకోవడం. ఆ విషయాలన్నీ మనం సాధనాన్ని రూపకల్పన చేసేటప్పుడు మన మనస్సులో పాప్ చేసే విషయాలు. ఇది మా శోధన అల్గారిథమ్‌లలోకి వెళుతుంది, ఇది కేటలాగ్ పేజీల లేఅవుట్‌లోకి వెళుతుంది మరియు సంస్థ చుట్టూ ఉన్న జ్ఞానాన్ని అందించే సామర్థ్యం. ఇది మేము ప్రశ్న సాధనాన్ని నిర్మించాము మరియు కేటలాగ్‌ను దానిలోకి నేరుగా నిర్మించాము, కాబట్టి ఇది నిజంగా దాని నుండి వచ్చినదని నేను భావిస్తున్నాను. మీ మనస్సులో మొదట ఏ యూజర్ ఉన్నారు?

రెబెకా జోజ్వియాక్: సరే, మంచిది. అది నిజంగా వివరించడానికి సహాయపడింది. అతను బయలుదేరవలసి ఉన్నందున ఆర్కైవ్లను పట్టుకోవటానికి ఎవరు చనిపోతున్నారు, కానీ అతను నిజంగా తన ప్రశ్నకు సమాధానం కోరుకున్నాడు. అతను బహుళ భాషలు ఉన్నాయని ప్రారంభంలో ప్రస్తావించబడ్డాడు, కాని కంపోజ్ కాంపోనెంట్‌లో పరపతి ఉన్న ఏకైక భాష SQL మాత్రమేనా?

డేవిడ్ క్రాఫోర్డ్: ఔను అది నిజం. వివిధ రకాలైన డేటాబేస్లు, డాక్యుమెంట్ డేటాబేస్లు, గ్రాఫ్ డేటాబేస్లు, కీ వాల్యూ స్టోర్స్ యొక్క పేలుడు గురించి నేను గమనించిన వాటిలో ఒకటి, అవి అప్లికేషన్ అభివృద్ధికి నిజంగా శక్తివంతమైనవి. రిలేషనల్ డేటాబేస్ల కంటే మెరుగైన మార్గాల్లో వారు అక్కడ ప్రత్యేక అవసరాలను తీర్చగలరు.

కానీ మీరు దానిని తిరిగి డేటా విశ్లేషణకు తీసుకువచ్చినప్పుడు, మీరు దానిని తిరిగి తీసుకువచ్చినప్పుడు - మీరు ఆ సమాచారాన్ని తాత్కాలిక రిపోర్టింగ్ లేదా తాత్కాలిక త్రవ్వకం చేయబోయే వ్యక్తులకు అందించాలనుకున్నప్పుడు, వారు ఎల్లప్పుడూ రిలేషనల్‌కు తిరిగి వస్తారు , కనీసం, మానవులకు ఇంటర్ఫేస్. దానిలో కొంత భాగం SQL అనేది డేటా విశ్లేషణ యొక్క భాష, కాబట్టి మానవులకు, ఇది ఏకీకృతం చేసే సాధనాల కోసం. హడూప్‌లోని SQL చాలా ప్రజాదరణ పొందటానికి ఇది కారణమని నేను భావిస్తున్నాను మరియు దాన్ని పరిష్కరించడానికి చాలా ప్రయత్నాలు ఉన్నాయి, ఎందుకంటే రోజు చివరిలో, ప్రజలకు తెలుసు. SQL ను ఎలా రాయాలో తెలిసిన మిలియన్ల మంది ప్రజలు బహుశా ఉన్నారు, మరియు మొంగో అగ్రిగేషన్ పైప్‌లైన్ ఫ్రేమ్‌వర్క్ ప్రశ్నను ఎలా రాయాలో తెలిసిన లక్షలాది మందిని నేను వెంచర్ చేయను. మరియు ఇది చాలా రకాలైన ప్లాట్‌ఫారమ్‌లలో ఏకీకరణ కోసం ఉపయోగించే ప్రామాణిక భాష. కాబట్టి చెప్పేవన్నీ చాలా అరుదుగా దాని వెలుపల వెళ్ళమని అడిగారు, ఎందుకంటే ఇది చాలా మంది విశ్లేషకులు ఉపయోగించే ఇంటర్ఫేస్, మరియు ఇది మేము SQL రాయడంపై దృష్టి కేంద్రీకరించిన ప్రదేశం, ముఖ్యంగా కంపోజ్‌లో.

డేటా సైన్స్ వారు చాలా వెలుపల వెంచర్ చేసే ప్రదేశం అని నేను చెప్తాను, కాబట్టి పిగ్ లేదా ఎస్ఎఎస్ ఉపయోగించడం గురించి మాకు అప్పుడప్పుడు ప్రశ్నలు వస్తాయి. ఇవి కంపోజ్‌లో మేము ఖచ్చితంగా నిర్వహించలేనివి మరియు కేటలాగ్‌లో పట్టుకోవాలనుకుంటున్నాము. నేను R మరియు పైథాన్ కూడా చూస్తున్నాను. R మరియు పైథాన్ స్క్రిప్ట్‌ల లోపల అలేషన్‌లో వ్రాసిన ప్రశ్నలను మీరు ఉపయోగించగల ఇంటర్‌ఫేస్‌లను మేము తయారుచేసిన రెండు మార్గాలు ఉన్నాయి, కాబట్టి, మీరు డేటా సైంటిస్ట్‌గా ఉన్నప్పుడు మరియు మీరు స్క్రిప్టింగ్ భాషలో పనిచేస్తున్నప్పుడు, మీ మూల డేటా రిలేషనల్‌లో ఉంటుంది డేటాబేస్. మీరు SQL ప్రశ్నతో ప్రారంభించండి, ఆపై మీరు దాన్ని మరింత ప్రాసెస్ చేసి R మరియు పైథాన్ లోపల గ్రాఫ్లను సృష్టించండి. అలేషన్ నుండి ప్రశ్నలను లేదా ప్రశ్న ఫలితాలను లాగే ఆ స్క్రిప్ట్లలోకి మీరు దిగుమతి చేసుకోగల ప్యాకేజీలను మేము తయారు చేసాము, అందువల్ల మీరు అక్కడ మిళితమైన వర్క్ఫ్లో ఉండవచ్చు.

రెబెకా జోజ్వియాక్: సరే, చాలా బాగుంది. నేను గంట పైభాగంలో కొంచెం నడుస్తున్నానని నాకు తెలుసు, నేను ఒకటి లేదా రెండు ప్రశ్నలు అడగబోతున్నాను. మీరు కనెక్ట్ చేయగల అన్ని విభిన్న వ్యవస్థల గురించి మీరు మాట్లాడినట్లు నాకు తెలుసు, కానీ బాహ్యంగా హోస్ట్ చేయబడిన డేటా మరియు అంతర్గతంగా హోస్ట్ చేయబడిన డేటా వరకు, మీ ఒకే వీక్షణలో, మీ ఒకే ప్లాట్‌ఫారమ్‌లో కలిసి శోధించవచ్చా?

డేవిడ్ క్రాఫోర్డ్: ఖచ్చితంగా. అలా చేయడానికి కొన్ని మార్గాలు ఉన్నాయి. నా ఉద్దేశ్యం, బాహ్యంగా హోస్ట్ చేయబడినది, నేను would హించుకుంటాను, దాని అర్థం గురించి ఖచ్చితంగా ఆలోచించటానికి ప్రయత్నిస్తున్నాను. మీ కోసం ఎవరో AWS లో హోస్ట్ చేస్తున్న డేటాబేస్ దీని అర్థం. ఇది data.gov నుండి పబ్లిక్ డేటా సోర్స్ అని అర్ధం. డేటాబేస్ ఖాతాతో మరొక అనువర్తనం వలె లాగిన్ అవ్వడం ద్వారా మేము నేరుగా డేటాబేస్‌లకు కనెక్ట్ అవుతాము మరియు మేము మెటాడేటాను ఎలా సంగ్రహిస్తాము. కాబట్టి మనకు ఖాతా ఉంటే మరియు మనకు నెట్‌వర్క్ పోర్ట్ తెరిచి ఉంటే, మేము దానిని పొందవచ్చు. ఆపై మనకు ఆ విషయాలు లేనప్పుడు, మనకు వర్చువల్ డేటా సోర్స్ అని పిలుస్తారు, ఇది స్వయంచాలకంగా, మీ స్వంత కనెక్టర్‌ను వ్రాయడం ద్వారా లేదా డాక్యుమెంటేషన్‌ను నెట్టడానికి మిమ్మల్ని అనుమతిస్తుంది, లేదా CSV అప్‌లోడ్ లాగా చేయడం ద్వారా డాక్యుమెంట్ చేయడానికి మీ అంతర్గత డేటాతో పాటు డేటా. అన్నీ సెర్చ్ ఇంజిన్‌లో ఉంచబడతాయి. ఇది వ్యవస్థలోని వ్యాసాలు మరియు ఇతర డాక్యుమెంటేషన్ మరియు సంభాషణల లోపల సూచించదగినదిగా మారుతుంది. కాబట్టి మనం సిస్టమ్‌కి నేరుగా కనెక్ట్ కానప్పుడు మేము ఎలా నిర్వహిస్తాము.

రెబెకా జోజ్వియాక్: సరే, అర్ధమే. నేను మీకు మరో ప్రశ్నను షూట్ చేస్తాను. ఒక హాజరైన "డేటా కేటలాగ్ యొక్క కంటెంట్ ఎలా ధృవీకరించబడాలి, ధృవీకరించబడాలి లేదా నిర్వహించాలి, సోర్స్ డేటా నవీకరించబడినప్పుడు, సోర్స్ డేటా సవరించబడినది మొదలైనవి."

డేవిడ్ క్రాఫోర్డ్: అవును, ఇది మనకు చాలా ప్రశ్న, మరియు మనం చెప్పిన వాటిలో ఒకటి - మన తత్వాలలో ఒకటి, నేను చెప్పినట్లుగా, వినియోగదారులు హానికరమని మేము నమ్మము. వారు ఉత్తమ జ్ఞానాన్ని అందించడానికి ప్రయత్నిస్తున్నారని మేము అనుకుంటాము. వారు లోపలికి వచ్చి డేటా గురించి ప్రజలను ఉద్దేశపూర్వకంగా తప్పుదారి పట్టించరు. ఇది మీ సంస్థలో సమస్య అయితే, మీ కోసం సరైన సాధనం అలేషన్స్ కాకపోవచ్చు. మీరు వినియోగదారులచే మంచి ఉద్దేశాలను If హిస్తే, మేము దాని గురించి ఎక్కడ, నవీకరణలు వస్తాయో అని ఆలోచిస్తాము, ఆపై సాధారణంగా మనం చేసేది ఏమిటంటే, మేము ప్రతి డేటా ఆబ్జెక్ట్ లేదా డేటా యొక్క ప్రతి విభాగానికి బాధ్యత వహిస్తాము. మెటాడేటాలో మార్పులు చేసినప్పుడు మేము ఆ స్టీవార్డులకు తెలియజేయవచ్చు మరియు వారు దానిని ఆ విధంగా నిర్వహించగలరు. నవీకరణలు వస్తాయని వారు చూస్తారు, వారు వాటిని ధృవీకరిస్తారు. అవి సరిగ్గా లేకపోతే, వారు తిరిగి వెళ్లి వాటిని సవరించవచ్చు మరియు తెలియజేయవచ్చు మరియు ఆశాజనక సమాచారం అందించిన వినియోగదారుని కూడా చేరుకోవచ్చు మరియు నేర్చుకోవటానికి సహాయపడుతుంది.

కాబట్టి దీన్ని చేయడం గురించి మనం ఆలోచించే ప్రాథమిక మార్గం. ప్రేక్షకులు మరియు నిర్వహణ ద్వారా ఈ విధమైన సూచన, మరియు మాకు దాని చుట్టూ కొన్ని సామర్థ్యాలు ఉన్నాయి.

రెబెకా జోజ్వియాక్: సరే మంచిది. మరియు మీరు అలేషన్‌తో ఎలా ఉత్తమంగా ప్రారంభించవచ్చో వారికి తెలియజేయగలిగితే, మరియు మరింత సమాచారం పొందడానికి వారు ప్రత్యేకంగా ఎక్కడికి వెళ్ళగలరు. మీరు దానిని పంచుకున్నారని నాకు తెలుసు. అది ఉత్తమమైన ప్రదేశమా?

డేవిడ్ క్రాఫోర్డ్: Alation.com/learnmore నేను వెళ్ళడానికి గొప్ప మార్గం అని అనుకుంటున్నాను. డెమో కోసం సైన్ అప్ అవ్వడానికి Alation.com సైట్ చాలా గొప్ప వనరులు, కస్టమర్ శ్వేతపత్రాలు మరియు మా పరిష్కారం గురించి వార్తలను కలిగి ఉంది. కాబట్టి ప్రారంభించడానికి గొప్ప ప్రదేశం అని నేను అనుకుంటున్నాను. నువ్వు కూడా .

రెబెకా జోజ్వియాక్: సరే, చాలా బాగుంది. నాకు తెలుసు, హాజరైనవారు, నేను ఈ రోజు అన్ని ప్రశ్నలకు రాలేదు అని క్షమించండి, కాకపోతే, వారు డేవిడ్ లేదా అతని అమ్మకాల బృందానికి లేదా అలేషన్‌లోని ఎవరికైనా పంపబడతారు, కాబట్టి వారు ఖచ్చితంగా మీ ప్రశ్నలకు సమాధానం ఇవ్వడానికి మరియు ఏలేషన్ అర్థం చేసుకోవడంలో సహాయపడగలరు చేస్తుంది లేదా వారు ఉత్తమంగా చేస్తారు.

మరియు దానితో, చేసారో, నేను ముందుకు వెళ్లి మమ్మల్ని సంతకం చేస్తాను. InsideAnalysis.com లో మీరు ఎల్లప్పుడూ ఆర్కైవ్‌లను కనుగొనవచ్చు. మీరు దీన్ని Techopedia.com లో కూడా కనుగొనవచ్చు. వారు కొంచెం వేగంగా అప్‌డేట్ అవుతారు, కాబట్టి ఖచ్చితంగా దాన్ని తనిఖీ చేయండి. ఈ రోజు డేవిడ్ క్రాఫోర్డ్, డెజ్ బ్లాంచ్ఫీల్డ్ మరియు రాబిన్ బూర్ లకు చాలా ధన్యవాదాలు. ఇది గొప్ప వెబ్‌కాస్ట్. మరియు దానితో, నేను మీకు వీడ్కోలు పలికాను. ధన్యవాదాలు, చేసారో. వీడ్కోలు.

డేవిడ్ క్రాఫోర్డ్: ధన్యవాదాలు.