వెబ్ క్రాలర్

రచయిత: John Stephens
సృష్టి తేదీ: 1 జనవరి 2021
నవీకరణ తేదీ: 1 జూలై 2024
Anonim
Introduction
వీడియో: Introduction

విషయము

నిర్వచనం - వెబ్ క్రాలర్ అంటే ఏమిటి?

వెబ్ క్రాలర్ అనేది వెబ్ ఇండెక్సింగ్‌లో సహాయపడే ఇంటర్నెట్ బాట్. అన్ని పేజీలు సూచిక అయ్యే వరకు వారు వెబ్‌సైట్ ద్వారా ఒకేసారి ఒక పేజీని క్రాల్ చేస్తారు. వెబ్ క్రాలర్లు వెబ్‌సైట్ మరియు వాటికి సంబంధించిన లింక్‌ల గురించి సమాచారాన్ని సేకరించడంలో సహాయపడతాయి మరియు HTML కోడ్ మరియు హైపర్‌లింక్‌లను ధృవీకరించడంలో కూడా సహాయపడతాయి.


వెబ్ క్రాలర్‌ను వెబ్ స్పైడర్, ఆటోమేటిక్ ఇండెక్సర్ లేదా క్రాలర్ అని కూడా అంటారు.

మైక్రోసాఫ్ట్ అజూర్ మరియు మైక్రోసాఫ్ట్ క్లౌడ్‌కు పరిచయం | ఈ గైడ్ మొత్తంలో, క్లౌడ్ కంప్యూటింగ్ అంటే ఏమిటి మరియు క్లౌడ్ నుండి మీ వ్యాపారాన్ని తరలించడానికి మరియు అమలు చేయడానికి మైక్రోసాఫ్ట్ అజూర్ మీకు ఎలా సహాయపడుతుందో మీరు నేర్చుకుంటారు.

టెకోపీడియా వెబ్ క్రాలర్ గురించి వివరిస్తుంది

వెబ్ క్రాలర్లు వెబ్‌సైట్ యొక్క URL, మెటా ట్యాగ్ సమాచారం, వెబ్ పేజీ కంటెంట్, వెబ్‌పేజీలోని లింక్‌లు మరియు ఆ లింక్‌ల నుండి దారితీసే గమ్యస్థానాలు, వెబ్ పేజీ శీర్షిక మరియు ఏదైనా ఇతర సంబంధిత సమాచారాన్ని సేకరిస్తాయి. అదే పేజీని మళ్లీ డౌన్‌లోడ్ చేయకుండా ఉండటానికి ఇప్పటికే డౌన్‌లోడ్ చేసిన URL లను వారు ట్రాక్ చేస్తారు. తిరిగి సందర్శించే విధానం, ఎంపిక విధానం, సమాంతరీకరణ విధానం మరియు మర్యాద విధానం వంటి విధానాల కలయిక వెబ్ క్రాలర్ యొక్క ప్రవర్తనను నిర్ణయిస్తుంది. వెబ్ క్రాలర్లకు చాలా సవాళ్లు ఉన్నాయి, అవి పెద్ద మరియు నిరంతరం అభివృద్ధి చెందుతున్న వరల్డ్ వైడ్ వెబ్, కంటెంట్ ఎంపిక ట్రేడ్ఆఫ్స్, సామాజిక బాధ్యతలు మరియు విరోధులతో వ్యవహరించడం.


వెబ్ పేజీలను పరిశీలించే వెబ్ సెర్చ్ ఇంజన్లు మరియు వ్యవస్థల యొక్క ముఖ్య భాగాలు వెబ్ క్రాలర్లు. అవి వెబ్ ఎంట్రీలను ఇండెక్స్ చేయడంలో సహాయపడతాయి మరియు వినియోగదారులను ఇండెక్స్‌కు వ్యతిరేకంగా ప్రశ్నించడానికి అనుమతిస్తాయి మరియు ప్రశ్నలకు సరిపోయే వెబ్‌పేజీలను కూడా అందిస్తాయి. వెబ్ క్రాలర్ల యొక్క మరొక ఉపయోగం వెబ్ ఆర్కైవింగ్‌లో ఉంది, ఇందులో పెద్ద వెబ్‌పేజీలు క్రమానుగతంగా సేకరించి ఆర్కైవ్ చేయబడతాయి. డేటా మైనింగ్‌లో కూడా వెబ్ క్రాలర్లు ఉపయోగించబడతాయి, దీనిలో గణాంకాలు వంటి విభిన్న లక్షణాల కోసం పేజీలు విశ్లేషించబడతాయి మరియు వాటిపై డేటా అనలిటిక్స్ నిర్వహించబడతాయి.