కుడు: హడూప్ ఎకోసిస్టమ్‌లో గేమ్ ఛేంజర్?

రచయిత: Roger Morrison
సృష్టి తేదీ: 21 సెప్టెంబర్ 2021
నవీకరణ తేదీ: 1 జూలై 2024
Anonim
ఇంపాలా మరియు కుడుతో రియల్ టైమ్, డేటా సెంట్రిక్ అప్లికేషన్‌లను సృష్టిస్తోంది
వీడియో: ఇంపాలా మరియు కుడుతో రియల్ టైమ్, డేటా సెంట్రిక్ అప్లికేషన్‌లను సృష్టిస్తోంది

విషయము


మూలం: అగ్సాండ్రూ / డ్రీమ్‌స్టైమ్.కామ్

Takeaway:

కుడు అనేది ఓపెన్ సోర్స్ ప్రాజెక్ట్, ఇది నిల్వను మరింత సమర్థవంతంగా నిర్వహించడానికి సహాయపడుతుంది.

కుడు అనేది కొత్త ఓపెన్-సోర్స్ ప్రాజెక్ట్, ఇది నవీకరించదగిన నిల్వను అందిస్తుంది. ఇది HDFS / HBase కు పూరకంగా ఉంది, ఇది వరుస మరియు చదవడానికి మాత్రమే నిల్వను అందిస్తుంది. ఫాస్ట్ డేటాపై ఫాస్ట్ ఎనలిటిక్స్ కోసం కుడు మరింత అనుకూలంగా ఉంటుంది, ఇది ప్రస్తుతం వ్యాపారం యొక్క డిమాండ్. కాబట్టి కుడు మరొక హడూప్ పర్యావరణ వ్యవస్థ ప్రాజెక్ట్ మాత్రమే కాదు, మార్కెట్‌ను మార్చగల సామర్థ్యాన్ని కలిగి ఉంది. (హడూప్ గురించి మరింత తెలుసుకోవడానికి, మీరు తెలుసుకోవలసిన మరియు అర్థం చేసుకోవలసిన 10 ముఖ్యమైన హడూప్ నిబంధనలను చూడండి.)

కుడు అంటే ఏమిటి?

కుడు అనేది ఒక ప్రత్యేకమైన నిల్వ వ్యవస్థ, ఇది నిర్మాణాత్మక డేటాను పట్టికల రూపంలో నిల్వ చేస్తుంది. ప్రతి పట్టికలో ముందే నిర్వచించిన నిలువు వరుసల సంఖ్య ఉంటుంది. వాటిలో ప్రతిదానికి ఒక ప్రాధమిక కీ ఉంది, ఇది వాస్తవానికి ఆ పట్టిక యొక్క ఒకటి లేదా అంతకంటే ఎక్కువ నిలువు వరుసల సమూహం. ఈ ప్రాధమిక కీ పరిమితిని జోడించడానికి మరియు నిలువు వరుసలను భద్రపరచడానికి తయారు చేయబడింది మరియు సూచికగా కూడా పని చేస్తుంది, ఇది సులభంగా నవీకరించడానికి మరియు తొలగించడానికి అనుమతిస్తుంది. ఈ పట్టికలు టాబ్లెట్లు అని పిలువబడే డేటా ఉపసమితుల శ్రేణి.


కుడస్ ప్రస్తుత స్థితి ఏమిటి?

కుడు నిజంగా బాగా అభివృద్ధి చెందింది మరియు ఇప్పటికే చాలా లక్షణాలతో కలిసి ఉంది. అయినప్పటికీ, దీనికి ఇంకా కొన్ని పాలిషింగ్ అవసరం, వినియోగదారులు సూచించినట్లయితే మరియు కొన్ని మార్పులు చేస్తే మరింత సులభంగా చేయవచ్చు.

కుడు పూర్తిగా ఓపెన్ సోర్స్ మరియు అపాచీ సాఫ్ట్‌వేర్ లైసెన్స్ 2.0 కలిగి ఉంది. ఇది అపాచీకి సమర్పించడానికి కూడా ఉద్దేశించబడింది, తద్వారా దీనిని అపాచీ ఇంక్యుబేటర్ ప్రాజెక్టుగా అభివృద్ధి చేయవచ్చు. ఇది దాని అభివృద్ధి మరింత వేగంగా అభివృద్ధి చెందడానికి మరియు ప్రేక్షకులను మరింతగా పెంచడానికి అనుమతిస్తుంది. కొంత సమయం తరువాత, కుడు యొక్క అభివృద్ధి బహిరంగంగా మరియు పారదర్శకంగా చేయబడుతుంది. అట్ స్కేల్, షియోమి, ఇంటెల్ మరియు స్ప్లైస్ మెషిన్ వంటి అనేక సంస్థలు కలిసి కుడు అభివృద్ధికి తోడ్పడ్డాయి. కుడులో పెద్ద సమాజం కూడా ఉంది, ఇక్కడ పెద్ద సంఖ్యలో ప్రేక్షకులు తమ సలహాలను మరియు సహకారాన్ని అందిస్తున్నారు. కాబట్టి, కుడు అభివృద్ధిని ముందుకు నడిపించే వ్యక్తులు ఇది.

కుడు HDFS / HBase ని ఎలా పూరించవచ్చు?

కుడు HDFS / HBase కు ప్రత్యామ్నాయం కాదు. ఇది వాస్తవానికి HBase మరియు HFDS రెండింటికి మద్దతు ఇవ్వడానికి రూపొందించబడింది మరియు వాటి లక్షణాలను పెంచడానికి వాటితో పాటు నడుస్తుంది. ఎందుకంటే హెచ్‌బేస్ మరియు హెచ్‌డిఎఫ్‌ఎస్‌లలో ఇప్పటికీ చాలా ఫీచర్లు ఉన్నాయి, ఇవి కొన్ని యంత్రాలలో కుడు కంటే శక్తివంతమైనవి. మొత్తం మీద, ఇటువంటి యంత్రాలు ఈ వ్యవస్థల నుండి ఎక్కువ ప్రయోజనాలను పొందుతాయి.


కుడు ముసాయిదా యొక్క లక్షణాలు

కుడు ఫ్రేమ్‌వర్క్ యొక్క ప్రధాన లక్షణాలు క్రింది విధంగా ఉన్నాయి:

  • పట్టిక నిలువు వరుసల యొక్క అత్యంత వేగవంతమైన స్కాన్లు - పార్క్వేట్ మరియు ORC ఫైల్ వంటి ఉత్తమ డేటా ఫార్మాట్‌లకు ఉత్తమ స్కానింగ్ విధానాలు అవసరం, ఇది కుడు సంపూర్ణంగా పరిష్కరించబడుతుంది. ఇటువంటి ఫార్మాట్‌లకు శీఘ్ర స్కాన్లు అవసరం, ఇవి స్తంభాల డేటా సరిగ్గా ఎన్‌కోడ్ అయినప్పుడు మాత్రమే సంభవిస్తాయి.
  • పనితీరు యొక్క విశ్వసనీయత - కుడు ఫ్రేమ్‌వర్క్ హడూప్‌లోని అనేక లొసుగులను మరియు అంతరాలను మూసివేయడం ద్వారా హడూప్ యొక్క మొత్తం విశ్వసనీయతను పెంచుతుంది.
  • హడూప్ - కుడుతో సులువుగా అనుసంధానం మరింత సామర్థ్యం కోసం హడూప్ మరియు దాని విభిన్న భాగాలతో సులభంగా అనుసంధానించవచ్చు.
  • పూర్తిగా ఓపెన్ సోర్స్ - కుడు అనేది అపాచీ 2.0 లైసెన్స్‌తో కూడిన ఓపెన్ సోర్స్ వ్యవస్థ. ఇది వివిధ కంపెనీలు మరియు నేపథ్యాల నుండి డెవలపర్‌ల యొక్క పెద్ద సంఘాన్ని కలిగి ఉంది, వారు దీన్ని క్రమం తప్పకుండా అప్‌డేట్ చేస్తారు మరియు మార్పులకు సలహాలను అందిస్తారు.

కుడు హడూప్ పర్యావరణ వ్యవస్థను ఎలా మార్చగలడు?

కుడు హడూప్ యొక్క పర్యావరణ వ్యవస్థకు సరిపోయేలా మరియు దాని లక్షణాలను మెరుగుపరచడానికి నిర్మించబడింది. ఇది మ్యాప్ రిడ్యూస్, హెచ్‌బేస్ మరియు హెచ్‌డిఎఫ్‌ఎస్ వంటి హడూప్ యొక్క కొన్ని ముఖ్య భాగాలతో కూడా కలిసిపోతుంది. మ్యాప్‌రెడ్యూస్ ఉద్యోగాలు డేటాను అందించవచ్చు లేదా కుడు పట్టికల నుండి డేటాను తీసుకోవచ్చు. ఈ లక్షణాలను స్పార్క్‌లో కూడా ఉపయోగించవచ్చు. ఒక ప్రత్యేక పొర స్పార్క్ SQL మరియు డేటాఫ్రేమ్ వంటి కొన్ని స్పార్క్ భాగాలను కుడుకు ప్రాప్యత చేస్తుంది. ఈ లక్షణాలను భర్తీ చేయడానికి కుడు అంతగా అభివృద్ధి చేయనప్పటికీ, కొన్ని సంవత్సరాల తరువాత, అలా చేయటానికి ఇది అభివృద్ధి చెందుతుందని అంచనా. అప్పటి వరకు, హడూప్ మరియు కుడుల మధ్య ఏకీకరణ నిజంగా చాలా ఉపయోగకరంగా ఉంది మరియు హడూప్ యొక్క పర్యావరణ వ్యవస్థ యొక్క ప్రధాన అంతరాలను పూరించగలదు. (అపాచీ స్పార్క్ గురించి మరింత తెలుసుకోవడానికి, అపాచీ స్పార్క్ రాపిడ్ అప్లికేషన్ అభివృద్ధికి ఎలా సహాయపడుతుందో చూడండి.)

కుడును వివిధ ప్రదేశాలలో అమలు చేయవచ్చు. అటువంటి ప్రదేశాల యొక్క కొన్ని ఉదాహరణలు క్రింద ఇవ్వబడ్డాయి:

బగ్స్ లేవు, ఒత్తిడి లేదు - మీ జీవితాన్ని నాశనం చేయకుండా జీవితాన్ని మార్చే సాఫ్ట్‌వేర్‌ను రూపొందించడానికి స్టెప్ గైడ్ ద్వారా మీ దశ

సాఫ్ట్‌వేర్ నాణ్యత గురించి ఎవరూ పట్టించుకోనప్పుడు మీరు మీ ప్రోగ్రామింగ్ నైపుణ్యాలను మెరుగుపరచలేరు.

  • నిజ సమయంలో ఇన్పుట్లను ప్రసారం చేయడం - ఇన్పుట్లను ASAP అందుకోవలసిన ప్రదేశాలలో, కుడు గొప్ప పని చేయవచ్చు. అటువంటి ప్రదేశానికి ఉదాహరణ వ్యాపారాలలో ఉంది, ఇక్కడ వివిధ వనరుల నుండి పెద్ద మొత్తంలో డైనమిక్ డేటా వరదలు వస్తాయి మరియు నిజ సమయంలో త్వరగా అందుబాటులో ఉండాలి.
  • విభిన్న యాక్సెస్ నమూనాలతో టైమ్-సిరీస్ అనువర్తనాలు - కుడు టైమ్-సిరీస్-ఆధారిత అనువర్తనాలకు ఖచ్చితంగా సరిపోతుంది ఎందుకంటే పట్టికలను సెటప్ చేయడం మరియు వాటిని ఉపయోగించి వాటిని స్కాన్ చేయడం చాలా సులభం. అటువంటి వాడకానికి ఉదాహరణ డిపార్ట్‌మెంట్ స్టోర్స్‌లో ఉంది, ఇక్కడ ఉత్పత్తుల యొక్క భవిష్యత్తు ప్రజాదరణను అంచనా వేయడానికి పాత డేటాను త్వరగా కనుగొని ప్రాసెస్ చేయాలి.
  • లెగసీ సిస్టమ్స్ - వివిధ వనరుల నుండి డేటాను పొందిన మరియు వేర్వేరు వర్క్‌స్టేషన్లలో నిల్వ చేసే చాలా కంపెనీలు కుడుతో ఇంట్లో అనుభూతి చెందుతాయి. కుడు చాలా వేగంగా ఉంటుంది మరియు అన్ని యంత్రాలపై డేటాను ప్రాసెస్ చేయడానికి ఇంపాలాతో సమర్ధవంతంగా కలిసిపోతుంది.
  • ప్రిడిక్టివ్ మోడలింగ్ - మోడలింగ్ కోసం మంచి వేదిక కావాలనుకునే డేటా శాస్త్రవేత్తలు కుడును ఉపయోగించవచ్చు. కుడు దానిలోని ప్రతి డేటా నుండి నేర్చుకోవచ్చు. ఏమి జరుగుతుందో చూడటానికి శాస్త్రవేత్త మోడల్‌ను పదేపదే అమలు చేయవచ్చు మరియు తిరిగి అమలు చేయవచ్చు.

ముగింపు

కుడు ఇంకా అభివృద్ధి దశలో ఉన్నప్పటికీ, HDFS మరియు HBase వంటి ప్రామాణిక హడూప్ భాగాలకు ఇది మంచి యాడ్-ఇన్ అయ్యేంత సామర్థ్యాన్ని కలిగి ఉంది. అన్ని ఖాళీలను పూరించడం ద్వారా మరియు మరికొన్ని లక్షణాలను జోడించడం ద్వారా హడూప్ పర్యావరణ వ్యవస్థను పూర్తిగా మార్చడానికి ఇది తగినంత సామర్థ్యాన్ని కలిగి ఉంది. ఇది చాలా వేగంగా మరియు శక్తివంతమైనది మరియు డేటా యొక్క పెద్ద పట్టికలను త్వరగా విశ్లేషించడానికి మరియు నిల్వ చేయడానికి సహాయపడుతుంది. అయినప్పటికీ, దీన్ని మరింత సమర్థవంతంగా ఉపయోగించుకోవటానికి ఇంకా కొంత పని మిగిలి ఉంది.