उपयोगकर्ताओं के साथ काम करने और संवाद करने के लिए हम किन उपकरणों का उपयोग करते हैं। रूसी में खोज इंजन का विकास


इस विषय का अध्ययन करने के बाद, आप सीखेंगे और दोहराएंगे:

खोज सर्वर किसके लिए हैं?
- खोज सर्वर के मुख्य भागों की नियुक्ति;
- इंटरनेट पर किस प्रकार की सूचना खोज मौजूद है;
- यांडेक्स सर्च इंजन में अनुरोध उत्पन्न करने के लिए बुनियादी नियम।

यूआरएल के आधार पर खोजें

इंटरनेट पर जानकारी खोजने का सबसे तेज़ और सबसे विश्वसनीय तरीका URL खोजना है। उनमें से कई मुद्रित प्रकाशनों में दिए गए हैं, विशेष संदर्भ पुस्तकें, लोकप्रिय रेडियो स्टेशनों की हवा में और टीवी स्क्रीन से सुनी जाती हैं।

जेनिट फुटबॉल क्लब के प्रशंसक www.fc-zenit.ru के पते को दिल से जानते हैं।
♦ समूह "कोरोल आई शट" के प्रशंसक इस समूह की आधिकारिक साइट www.korol.spb.ru से अच्छी तरह वाकिफ हैं।
एनटीवी चैनल के प्रशंसक इसकी वेबसाइट www.ntv.ru पर आसानी से खोज सकते हैं। उपरोक्त संसाधनों तक त्वरित पहुँच के लिए, बस एक ब्राउज़र प्रोग्राम लॉन्च करें, जैसे कि इंटरनेट एक्सप्लोरर, और पता बार में एक परिचित URL टाइप करें।

खोज यन्त्र

इंटरनेट केंद्रित है बड़ी राशिदस्तावेज। आवश्यक जानकारी की खोज को सुविधाजनक बनाने के लिए, विशेष खोज इंजन बनाए जाते हैं।

खोज यन्त्र- ये स्वचालित सिस्टम हैं जो वैश्विक नेटवर्क से जुड़े सर्वरों को पोल करते हैं और अपने डेटाबेस में सर्वर पर उपलब्ध डेटा के बारे में जानकारी संग्रहीत करते हैं। विशेष रूप से तैयार किए गए अनुरोध के अनुसार, खोज इंजन आपको आवश्यक डेटा कहां से प्राप्त कर सकते हैं, इस बारे में जानकारी प्रदान करते हैं।

एक नियम के रूप में, खोज इंजन में तीन भाग होते हैं: रोबोट, इंडेक्स और अनुरोध प्रसंस्करण कार्यक्रम.

रोबोट (मकड़ी, रोबोट या बॉट)एक प्रोग्राम है जो वेब पेजों पर जाता है और उनकी सामग्री (संपूर्ण या आंशिक रूप से) पढ़ता है। वेब पेज की सामग्री का विश्लेषण करने के लिए खोज इंजन रोबोट अपनी व्यक्तिगत योजना में भिन्न होते हैं।
सर्च इंजन इंडेक्स- यह रोबोट पृष्ठों द्वारा देखी गई खोज छवियों का भंडार है। किसी दस्तावेज़ की खोज छवि (वेब ​​पेज सहित) एक विशेष सूचना पुनर्प्राप्ति भाषा में दस्तावेज़ की सामग्री का विवरण है। इस विवरण में दस्तावेज़ के कीवर्ड के लिए कोड हैं, जो इसके अर्थ और सामग्री को दर्शाते हैं। प्रत्येक खोज इंजन में अनुक्रमणिका उस मात्रा और तरीके में भिन्न होती है जिसमें जानकारी संग्रहीत की जाती है। प्रमुख खोज इंजनों के डेटाबेस लाखों दस्तावेज़ों के बारे में जानकारी संग्रहीत करते हैं, और उनकी अनुक्रमणिका मात्रा सैकड़ों गीगाबाइट है। अनुक्रमित समय-समय पर अद्यतन और पूरक होते हैं, इसलिए एक ही क्वेरी के साथ एक खोज इंजन के काम के परिणाम भिन्न हो सकते हैं यदि खोज अलग-अलग समय पर की गई हो।

अनुरोध हैंडलरएक प्रोग्राम है, जो उपयोगकर्ता के अनुरोध के अनुसार, आवश्यक जानकारी की उपस्थिति के लिए सूचकांक को "दिखता है" और पाए गए दस्तावेजों के लिंक लौटाता है। सिस्टम के आउटपुट पर लिंक का सेट प्रोग्राम द्वारा प्रासंगिकता y के अवरोही क्रम में वितरित किया जाता है, यानी लिंक के मिलान के उच्चतम स्तर से अनुरोध तक।

वर्तमान में, रूसी इंटरनेट उपयोगकर्ताओं के लिए सबसे लोकप्रिय तीन प्रमुख इंडेक्स-टाइप सर्च इंजन हैं:

ये प्रणालियाँ रूसी भाषा की व्याकरणिक विशेषताओं को ध्यान में रखती हैं, इसलिए रूसी भाषा के संसाधनों में उनकी खोज के परिणाम पश्चिमी प्रणालियों की तुलना में उच्च गुणवत्ता वाले हैं।

सूचना संसाधनों के कवरेज में खोज इंजन भिन्न होते हैं:

सामान्य खोज इंजनों के पास ज्ञान के सभी क्षेत्रों में एक डेटाबेस होता है और एक व्यापक सूचकांक और बड़ी मात्रा में संचित जानकारी द्वारा प्रतिष्ठित होते हैं;
♦ खोज इंजन विशेष उद्देश्यकेवल कुछ विषयों पर साइटें देखें, जैसे संगीत या संग्रहालय।

सर्च इंजन की मुख्य विशेषताएं हैं:

सूचकांक में दस्तावेजों की मात्रा;
♦ सूचना अद्यतन करने की आवृत्ति;
सूचना स्थान जिसे खोज इंजन रोबोट कवर करता है और विभिन्न प्रकार के दस्तावेज़ जिसके बारे में जानकारी एकत्र की जाती है;
अनुरोध प्रसंस्करण गति;
प्रासंगिकता निर्धारित करने के लिए मानदंड (खोज क्वेरी के लिए पाए गए दस्तावेज़ का पत्राचार);
अनुरोध का ब्योरा देने और स्पष्ट करने की संभावना।

खोज इंजन के रूब्रिकेटर द्वारा खोजें

खोज निर्देशिका अन्य इंटरनेट संसाधनों के लिंक का एक व्यवस्थित संग्रह (चयन) है। लिंक एक विषयगत रूब्रिकेटर के रूप में व्यवस्थित होते हैं, जो एक पदानुक्रमित संरचना है, जिसके साथ आगे बढ़ते हुए आप अपनी जरूरत की जानकारी पा सकते हैं।

आइए हम एक उदाहरण के रूप में यांडेक्स खोज इंटरनेट कैटलॉग की संरचना दें। यह एक कैटलॉग है सामान्य उद्देश्य, क्योंकि इसमें लगभग सभी संभावित दिशाओं में इंटरनेट संसाधनों के लिंक शामिल हैं। इस कैटलॉग में निम्नलिखित विषय शामिल हैं:

♦ व्यापार और अर्थशास्त्र;
संदर्भ और लिंक;
♦ समाज और राजनीति;
♦ घर और परिवार;
♦ विज्ञान और शिक्षा;
मनोरंजन और मनोरंजन;
कंप्यूटर और संचार;
♦ संस्कृति और कला।

प्रत्येक विषय में कई उपखंड शामिल होते हैं, और बदले में इनमें रूब्रिक होते हैं, और इसी तरह।

मान लीजिए कि आप विजय दिवस के लिए एक कार्यक्रम की तैयारी कर रहे हैं और इंटरनेट पर बुलट ओकुदज़ाहवा के प्रसिद्ध सैन्य गीत "यू हियर द बूट्स रंबल" के शब्दों को खोजना चाहते हैं। खोज को निम्नानुसार व्यवस्थित किया जा सकता है: यांडेक्स कैटलॉग संस्कृति और कला संगीत लेखक का गीत।

यह खोज विधि काफी तेज और कुशल है। अंत में, आपको केवल 5 लिंक की पेशकश की जाती है, जिनमें से प्रसिद्ध बार्ड के गीतों वाली साइटों के लिंक हैं। यह केवल साइट पर बी ओकुदज़ाहवा के गीतों के साथ एक संग्रह खोजने और उसमें वांछित पाठ का चयन करने के लिए बनी हुई है।

एक और उदाहरण। मान लीजिए आप खरीदने जा रहे हैं चल दूरभाषऔर विभिन्न कंपनियों के उपकरणों की विशेषताओं की तुलना करना चाहते हैं। खोज निम्नलिखित कैटलॉग शीर्षकों के तहत की जा सकती है: यांडेक्स कैटलॉग कंप्यूटर और संचार मोबाइल कनेक्शनसेल फोन।

सीमित संख्या में संदर्भ प्राप्त करने के बाद, आप उन्हें जल्दी से देख सकते हैं और फर्मों की विशेषताओं और उपकरणों के संशोधनों की जांच करके एक फोन चुन सकते हैं।

संकेत शब्द की खोज

अधिकांश खोज इंजनों में खोजशब्दों द्वारा खोज करने की क्षमता होती है। यह सबसे आम खोज प्रकारों में से एक है। कीवर्ड द्वारा खोजने के लिए, आपको एक विशेष विंडो में खोजने के लिए एक शब्द या कई शब्द दर्ज करने होंगे और खोज बटन पर क्लिक करना होगा। खोज इंजन अपने डेटाबेस में खोजेगा और इन शब्दों वाले दस्तावेज़ दिखाएगा। ऐसे कई दस्तावेज हो सकते हैं, लेकिन इस मामले में बहुत कुछ का मतलब अच्छा नहीं है।

आइए किसी भी खोज इंजन के साथ कुछ प्रयोग करें। मान लीजिए हम एक एक्वेरियम शुरू करने का निर्णय लेते हैं और हम इस विषय पर किसी भी जानकारी में रुचि रखते हैं।

पहली नज़र में, सबसे आसान काम "एक्वेरियम" शब्द की खोज करना है। आइए इसे जांचें, उदाहरण के लिए, यांडेक्स सर्च इंजन में। खोज परिणाम 3,500 साइटों पर 460,000 से अधिक पृष्ठों का होगा - बड़ी संख्या में लिंक। इसके अलावा, यदि आप अधिक बारीकी से देखते हैं, तो उनमें से ऐसी साइटें होंगी जो बी। ग्रीबेन्शिकोव "एक्वेरियम" के समूह का उल्लेख करती हैं, खरीदारी केन्द्रऔर एक ही नाम के साथ अनौपचारिक संबंध, और भी बहुत कुछ, जो एक्वैरियम मछली से संबंधित नहीं हैं।

यह अनुमान लगाना आसान है कि ऐसी खोज सरल उपयोगकर्ता को भी संतुष्ट नहीं कर सकती है। उन सभी प्रस्तावित दस्तावेजों में से चयन करने में बहुत अधिक समय खर्च करना होगा जो हमारे लिए आवश्यक विषय से संबंधित हैं, और इससे भी अधिक उनकी सामग्री को जानने के लिए।

हम तुरंत यह निष्कर्ष निकाल सकते हैं कि आमतौर पर एक शब्द से खोजना उचित नहीं है, क्योंकि किसी दस्तावेज़, वेब पेज या साइट के विषय को एक शब्द से निर्धारित करना बहुत मुश्किल है। अपवाद दुर्लभ शब्द और शब्द हैं जिनका उपयोग उनके विषय क्षेत्र के बाहर लगभग कभी नहीं किया जाता है।

आइए खोज स्थितियों को स्पष्ट करने का प्रयास करें और "मछलीघर मछली" वाक्यांश दर्ज करें। खोज परिणाम 20,000 से कुछ अधिक पृष्ठों और लगभग 650 साइटों का होगा। जैसा कि आप देख सकते हैं, लिंक की संख्या में 20 गुना से अधिक की कमी आई है। यह परिणाम हमें अधिक सूट करता है, लेकिन सभी समान, प्रस्तावित लिंक में से आप मिल सकते हैं, उदाहरण के लिए, मछली की छवियों के साथ मैच लेबल के रूसी स्मारिका सेट, और कंप्यूटर डेस्कटॉप स्क्रीनसेवर के संग्रह, और तस्वीरों के साथ एक्वैरियम मछली के कैटलॉग, और एक्वैरियम सहायक उपकरण भंडार।

जाहिर सी बात है कि हमें खोज स्थितियों को परिष्कृत करने की दिशा में आगे बढ़ते रहना चाहिए।

खोज को अधिक उत्पादक बनाने के लिए, सभी खोज इंजनों के पास अपने स्वयं के सिंटैक्स के साथ एक विशेष क्वेरी भाषा होती है। ये भाषाएं कई मायनों में एक जैसी हैं। उन सभी को सीखना काफी कठिन है, लेकिन किसी भी खोज इंजन में एक सहायता प्रणाली होती है जो आपको वांछित भाषा में महारत हासिल करने की अनुमति देती है।

यांडेक्स सर्च इंजन में अनुरोध उत्पन्न करने के लिए यहां दस सरल नियम दिए गए हैं।

1. क्वेरी में कीवर्ड लोअरकेस (छोटे) अक्षरों में लिखे जाने चाहिए। यह सुनिश्चित करेगा कि सभी खोजशब्द खोजे गए हैं, न कि केवल वे जो बड़े अक्षर से शुरू होते हैं।

2. क्वेरी में शब्द के रूप की परवाह किए बिना, खोज रूसी भाषा के नियमों के अनुसार शब्द के सभी रूपों को ध्यान में रखती है। उदाहरण के लिए, यदि क्वेरी में "पता" शब्द निर्दिष्ट किया गया था, तो शब्द "पता", "पता", आदि भी खोज शर्त को पूरा करेंगे।

3. एक स्थिर वाक्यांश की खोज करने के लिए, आपको शब्दों को उद्धरण चिह्नों में संलग्न करना चाहिए, उदाहरण के लिए, "चीनी मिट्टी के बरतन व्यंजन"।

4. सटीक शब्द रूप से खोजने के लिए, आपको शब्द से पहले विस्मयादिबोधक चिह्न लगाना होगा। उदाहरण के लिए, "सितंबर" शब्द को आनुवंशिक मामले में खोजने के लिए, आप "!सितंबर" लिखेंगे।

5. एक वाक्य के भीतर खोजने के लिए, क्वेरी में शब्दों को एक स्थान या चिह्न &: "एडवेंचर नॉवेल" या "एडवेंचर एंड नॉवेल" से अलग किया जाता है। क्वेरी में टाइप किए गए कई शब्द, रिक्त स्थान द्वारा अलग किए गए, का अर्थ है कि उन सभी को खोजे जा रहे दस्तावेज़ के एक वाक्य में शामिल किया जाना चाहिए।

6. यदि आप केवल उन्हीं दस्तावेज़ों का चयन करना चाहते हैं जिनमें क्वेरी में निर्दिष्ट प्रत्येक शब्द आता है, तो उनमें से प्रत्येक के सामने प्लस चिह्न "+" रखें। यदि आप, इसके विपरीत, किसी भी शब्द को खोज परिणाम से बाहर करना चाहते हैं, तो इस शब्द के सामने एक माइनस "-" डालें। संकेत "+" और "-" को पिछले एक से एक स्थान के साथ लिखा जाना चाहिए और अगले शब्द के साथ विलय करना चाहिए। उदाहरण के लिए, क्वेरी "वोल्गा-कार" में ऐसे दस्तावेज़ मिलेंगे जिनमें "वोल्गा" शब्द होगा न कि "कार" शब्द।

7. समानार्थक शब्द या अर्थ के करीब शब्दों की खोज करते समय, आप शब्दों के बीच एक लंबवत बार "|" लगा सकते हैं। उदाहरण के लिए, क्वेरी के लिए "बच्चा | बच्चा | baby" को इनमें से किसी भी शब्द के साथ दस्तावेज़ मिलेंगे।

8. एक प्रश्न में एक शब्द के बजाय, आप एक संपूर्ण अभिव्यक्ति को प्रतिस्थापित कर सकते हैं। ऐसा करने के लिए, इसे कोष्ठक में लिया जाना चाहिए, उदाहरण के लिए "(बच्चा | बच्चा | बच्चे | बच्चा) + (देखभाल | पालन-पोषण)"।

9. *~" (टिल्डे) वर्ण आपको ऐसे दस्तावेज़ ढूँढ़ने की अनुमति देता है जिसमें पहला शब्द हो, लेकिन दूसरा शब्द न हो। उदाहरण के लिए, खोज "किताबें ~ दुकान" में "किताबें" शब्द वाले सभी दस्तावेज़ मिलेंगे जिनके आगे "दुकान" शब्द नहीं है (वाक्य के भीतर)।

10. यदि ऑपरेटर को एक बार दोहराया जाता है (उदाहरण के लिए, & या ~), तो वाक्य के भीतर खोज की जाती है। डबल ऑपरेटर (&&, -) दस्तावेज़ के भीतर खोज करता है। उदाहरण के लिए, क्वेरी "कैंसर - ज्योतिष" में "कैंसर" शब्द वाले दस्तावेज़ मिलेंगे जो ज्योतिष से संबंधित नहीं हैं।

वांछित क्षेत्र में सबसे सामान्य शब्दों का एक निश्चित सेट होने पर, आप उन्नत खोज का उपयोग कर सकते हैं। अंजीर पर। 3.3 यांडेक्स सर्च इंजन में उन्नत खोज विंडो दिखाता है। इस मोड में, क्वेरी भाषा की क्षमताओं को प्रपत्र के रूप में कार्यान्वित किया जाता है। शब्दकोश फ़िल्टर सहित एक समान सेवा, लगभग सभी खोज इंजनों द्वारा प्रदान की जाती है।

चावल। 3.3. यांडेक्स प्रणाली में उन्नत खोज का एक उदाहरण

इस शर्त पर सही पसंदवांछनीय और आवश्यक शब्द और अवांछनीय शब्दों को छोड़कर ऐसी खोज अच्छे परिणाम दे सकती है।

आइए एक्वैरियम मछली के उदाहरण पर वापस जाएं। सर्च इंजन द्वारा पेश किए गए कई दस्तावेजों को पढ़ने के बाद, यह स्पष्ट हो जाता है कि इंटरनेट पर जानकारी की खोज एक्वैरियम मछली की पसंद से शुरू नहीं होनी चाहिए। एक्वेरियम - कॉम्प्लेक्स जैविक प्रणाली, जिसके निर्माण और रखरखाव के लिए विशेष ज्ञान, समय और गंभीर निवेश की आवश्यकता होती है।

प्राप्त जानकारी के आधार पर, इंटरनेट पर खोज करने वाला व्यक्ति अध्ययन के तहत मुद्दे से संबंधित विशेष साहित्य का अध्ययन करने का निर्णय लेते हुए, आगे की खोज की रणनीति को मौलिक रूप से बदल सकता है।

साहित्य या पूर्ण-पाठ दस्तावेजों की खोज के लिए, निम्नलिखित प्रश्न संभव है:

"+ (एक्वेरियम | एक्वारिस्ट | एक्वारिस्ट) + शुरुआती लोगों के लिए + (सलाह | साहित्य) + (लेख | थीसिस | पूर्ण-पाठ) - (कीमत | दुकान | डिलीवरी | कैटलॉग)"।

खोज इंजन द्वारा अनुरोध को संसाधित करने के बाद, निम्नलिखित परिणाम प्राप्त हुए: पृष्ठ - 195, साइट - कम से कम 43।

जैसा कि खोज के आंकड़ों से देखा जा सकता है, परिणाम बहुत सफल रहा। पहले से ही पहले लिंक आवश्यक दस्तावेजों की ओर ले जाते हैं:

एक्वेरियम सेटअप > शुरुआती एक्वाइरिस्ट के लिए टिप्स >
लेख> एक्यू यूस्कोप। एन
http://aquascope.ru/modules/wfsection/article.php?page=l&articleid=49 (32KB) - सख्त अनुपालन।
शुरुआती एक्वेरियमिस्ट को सलाह। एक्वेरियम कैसे चुनें और कैसे लगाएं, कैसे...
http://www.aquariums.ru/sovna.htm (2KB) 07/23/2002 - गैर-सख्त पत्राचार।

अब आप खोज के परिणामों को सारांशित कर सकते हैं, कुछ निष्कर्ष निकाल सकते हैं और संभावित कार्यों पर निर्णय ले सकते हैं:

आगे की खोज बंद करो, क्योंकि विभिन्न कारणों से, एक्वेरियम का रखरखाव आपकी शक्ति से परे है।
सुझाए गए लेख पढ़ें और एक्वेरियम स्थापित करना शुरू करें।
हम्सटर या कलीगों के बारे में सामग्री खोजें।

व्यावसायिक खोज

शोधकर्ताओं और विशेषज्ञों को खोज के संगठन के लिए अधिक विचारशील दृष्टिकोण अपनाना होगा। पेशेवर रूप से इंटरनेट पर जानकारी की खोज करते समय, निम्नलिखित आवश्यकताओं को पूरा किया जाना चाहिए:

♦ उच्च खोज गति;
प्राप्त जानकारी की विश्वसनीयता;
♦ खोज के दौरान संसाधनों के कवरेज की पूर्णता।

रफ़्तार। खोज की गति मुख्य रूप से दो कारकों पर निर्भर करती है: सक्षम खोज योजना (खोज सेवाओं और उपकरणों का चयन) और पहले से चयनित संसाधन (इसकी संरचना और नेविगेशन विधियों को जल्दी से समझने की क्षमता) के साथ काम करने में कौशल। खोज की गति सुनिश्चित करने के लिए खोज अनुक्रमणिका पर्याप्त नहीं हैं। उनके अलावा, इंटरनेट पर कई खोज संसाधन हैं, जिनका उपयोग पेशेवर खोज के प्रदर्शन को सुनिश्चित करता है।

विश्वसनीयता। इंटरनेट से प्राप्त जानकारी की विश्वसनीयता का प्रश्न बहुत प्रासंगिक है, क्योंकि कोई भी व्यक्ति किसी भी जानकारी को वास्तविकता के अनुपालन पर बिना किसी नियंत्रण के वहां रख सकता है। यह, बदले में, बड़ी संख्या में अविश्वसनीय स्रोतों की ओर जाता है, जैसे कि सार और टर्म पेपर्सइंटरनेट बाढ़.

ऐसी विशेष खोज सेवाएं हैं जो आपको इंटरनेट पर सूचना के स्रोत की विश्वसनीयता का मूल्यांकन करने की अनुमति देती हैं।

पूर्णता। सूचना के पूर्ण पैमाने पर सफल संग्रह के लिए एक आवश्यक शर्त मुख्य प्रकार के संसाधनों का ज्ञान है जो आज मौजूद हैं और विभिन्न खोज सेवाओं का उपयोग। कोई भी सर्च इंजन इंटरनेट के सभी संसाधनों को कवर नहीं कर सकता है।

एक नियम के रूप में, सकारात्मक परिणाम प्राप्त करने के लिए, उपयोगकर्ता को कई खोज इंजनों की सेवाओं का सहारा लेना चाहिए। आप इसे स्वयं कर सकते हैं, सिस्टम से सिस्टम की ओर बढ़ते हुए, या आप इस काम को किसी एक मेटासर्च इंजन को सौंप सकते हैं (मेटा पहला है अवयव यौगिक शब्द, अन्य प्रणालियों के विवरण और अध्ययन के लिए प्रणालियों को निरूपित करना)।

चावल। 3.4. मेटासर्च विंडो

मेटासर्च इंजन के पास अपने स्वयं के खोज डेटाबेस नहीं होते हैं और खोज करते समय कई अन्य खोज इंजनों के संसाधनों का उपयोग करते हैं। इससे आवश्यक जानकारी मिलने की संभावना बहुत अधिक होती है। मेटासर्च सिस्टम में काम उन्हीं नियमों के अनुसार किया जाता है जैसे सर्च इंजन में काम करते हैं। यह इस तथ्य के कारण है कि मेटासर्च इंजन खोज इंजन के लिए एक प्रकार का ऐड-ऑन हैं और अपने काम में अपने इंडेक्स डेटाबेस का उपयोग करते हैं। मेटासर्च इंजन की उपस्थिति जैसा दिखता है दिखावटप्रसिद्ध खोज इंजन। अंजीर पर। 3.4 मेटासर्च इंजन myweb.ru और metabot.ru की विंडो दिखाता है।

अनुभव से पता चलता है कि ज्यादातर मामलों में सर्वोत्तम परिणामएकल मेटासर्च इंजन का उपयोग करने की तुलना में कई स्वतंत्र खोज अनुक्रमणिका का उपयोग करके प्राप्त किया गया।

प्रश्नों और कार्यों को नियंत्रित करें

1. ब्राउज़र प्रोग्राम का उद्देश्य क्या है?

2. आप कौन से ब्राउज़र प्रोग्राम जानते हैं?

3. इंटरनेट खोज की योजना बनाने वाला उपयोगकर्ता यूआरएल कहां ढूंढ सकता है?

4. सर्च इंजन के रूब्रिकेटर के लिए सर्च टेक्नोलॉजी क्या है?

5. कीवर्ड सर्च टेक्नोलॉजी क्या है?

6. इंटरनेट पर जानकारी के लिए पेशेवर खोज में किन आवश्यकताओं का पालन करना चाहिए?

7. आपको खोज मानदंड में "+" या "-" चिह्न निर्दिष्ट करने की आवश्यकता कब होती है?

8. निम्नलिखित वाक्यांश द्वारा यांडेक्स में कौन से खोज मानदंड निर्धारित किए गए हैं:

(नानी | शिक्षक | शासन) ++ (देखभाल | पालन-पोषण | पर्यवेक्षण)।

9. जटिल क्वेरी बनाते समय चिह्न (∼∼ या ++) को दोगुना करने का क्या अर्थ है?

10. खोज प्रासंगिकता क्या है?

11. मेटासर्च इंजन का उद्देश्य क्या है?

खोज प्रौद्योगिकियां

एक अशांत सीमा परत में घर्षण और गर्मी और द्रव्यमान हस्तांतरण के नियम

'घर्षण के नियम' (संदर्भ मामले के लिए) के प्रतिनिधित्व के कई संस्करण हैं, जिससे लगभग समान परिणाम प्राप्त होते हैं। एक 'लघुगणक' सीमा परत की अवधारणा के अनुसार (पहली अशांति स्थिरांक के मूल्य के साथ) = 0.4) "लुप्त हो रही चिपचिपाहट" के साथ एक अत्यंत विकसित अशांति के लिए घर्षण कानून एक साधारण कर्मन सूत्र द्वारा अच्छी तरह से अनुमानित है:

वेग प्रोफ़ाइल के शक्ति-कानून के प्रतिनिधित्व के साथ, सूत्र प्रस्तावित किया जाना चाहिए:

कहाँ पे: ; एनवेग प्रोफ़ाइल का घातांक है;

- अर्ध-अनुभवजन्य गुणांक;

लेकिन- अनुभवजन्य गुणांक;

δ सीमा परत की मोटाई है।

विभिन्न रैखिक मात्राओं पर निर्मित रेनॉल्ड्स संख्याओं के संबंधों का उपयोग करना:

यह ध्यान रखना महत्वपूर्ण है कि अग्रणी किनारे से एक अशांत सीमा परत के विकास के मामले में ( एक्स करोड़ = 0) घर्षण के नियम को भी इस प्रकार दर्शाया जाना चाहिए:

विभिन्न वेग प्रोफाइल के लिए प्रस्तुत सूत्रों के पैरामीट्रिक मूल्यों के मूल्यों को तालिका में संक्षेपित किया गया है

पैरामीटर एन
1/7 1/8 1/9 1/10
लेकिन 8,74 9,71 10,6 11,5
0,0975 0,089 0,0818 0,0757
1,28 1,25 1,22 1,20
एम 0,250 0,222 0,200 0,182
बी 0,0252 0,0206 0,0190 0,0148
एम 1 0,200 0,182 0,167 0,154
बी 1 0,0576 0,0450 0,0362 0,0308

घर्षण के नियम के प्रतिनिधित्व के अन्य रूप भी ज्ञात और उपयोग किए जाते हैं, जिससे व्यावहारिक रूप से समान परिणाम प्राप्त होते हैं। तो वी.एम. इवलेव ने एक अनुमान का प्रस्ताव रखा:

रेनॉल्ड्स के ट्रिपल सादृश्य के प्रसिद्ध सिद्धांत के माध्यम से मानक स्थितियों (संदर्भ मामले) के लिए गर्मी और द्रव्यमान हस्तांतरण के नियमों के सूत्र 'घर्षण के नियमों' से प्राप्त किए जाते हैं।

कहाँ पे: एस- सुधार कारक - मानक (ओं) की शर्तों के अनुपालन के लिए रेनॉल्ड्स सादृश्य कारक, कारक एसपहले सन्निकटन में संबंध द्वारा संतोषजनक रूप से अनुमानित है:

यह ध्यान रखना महत्वपूर्ण है कि अभिन्न मापदंडों का उपयोग करने के मामले में, गर्मी और बड़े पैमाने पर स्थानांतरण के 'नियमों' को निर्भरता द्वारा अच्छी तरह से वर्णित किया गया है:

वेब-प्रौद्योगिकी वर्ल्ड वाइड वेब (WWW) को इंटरनेट पर दस्तावेज़ तैयार करने और रखने के लिए एक विशेष तकनीक माना जाता है। WWW में वेब पेज, इलेक्ट्रॉनिक लाइब्रेरी, कैटलॉग और यहां तक ​​कि वर्चुअल म्यूजियम भी शामिल हैं! जानकारी की इतनी प्रचुरता के साथ, सवाल तेजी से उठता है: "इतने बड़े और बड़े पैमाने पर सूचना स्थान में कैसे नेविगेट किया जाए -" इस समस्या को हल करने में खोज उपकरण बचाव के लिए आते हैं।

सर्च टूल हैं खास सॉफ़्टवेयर, जिसका मुख्य उद्देश्य इंटरनेट उपयोगकर्ताओं के लिए सबसे इष्टतम और उच्च गुणवत्ता वाली जानकारी खोज प्रदान करना है। खोज उपकरण विशेष वेब सर्वर पर होस्ट किए जाते हैं, जिनमें से प्रत्येक एक विशिष्ट कार्य करता है:

1. वेब पेजों का विश्लेषण और खोज सर्वर के डेटाबेस के एक या दूसरे स्तर पर विश्लेषण के परिणाम दर्ज करना।

2. उपयोगकर्ता के अनुरोध पर जानकारी खोजें।

3. उपयोगकर्ता द्वारा जानकारी खोजने और खोज परिणाम देखने के लिए एक उपयोगकर्ता के अनुकूल इंटरफेस प्रदान करना।

इन या अन्य खोज उपकरणों के साथ काम करते समय उपयोग किए जाने वाले कार्य के तरीके लगभग समान होते हैं। उन पर चर्चा करने के लिए आगे बढ़ने से पहले, निम्नलिखित अवधारणाओं पर विचार करें:

1. खोज टूल इंटरफ़ेस को हाइपरलिंक, एक क्वेरी स्ट्रिंग (खोज स्ट्रिंग) और क्वेरी सक्रियण टूल वाले पृष्ठ के रूप में प्रस्तुत किया जाता है।

2. सर्च इंजन इंडेक्स - कुछ नियमों के अनुसार संकलित वेब पेजों के विश्लेषण के परिणाम युक्त सूचना आधार।

3. क्वेरी - कीवर्ड या वाक्यांश जो उपयोगकर्ता खोज बार में दर्ज करता है। विभिन्न प्रश्नों को बनाने के लिए विशेष वर्ण ("", ~), गणितीय प्रतीकों (*, +, -) का उपयोग किया जाता है।

सूचना खोज योजना सरल है। उपयोगकर्ता एक प्रमुख वाक्यांश टाइप करता है और खोज को सक्रिय करता है, जिससे तैयार (दिए गए) अनुरोध के अनुसार दस्तावेजों का चयन प्राप्त होता है। दस्तावेज़ों की इस सूची को कुछ मानदंडों के अनुसार रैंक किया गया है ताकि सूची के शीर्ष पर वे दस्तावेज़ हों जो उपयोगकर्ता की क्वेरी से सबसे अधिक निकटता से मेल खाते हों। प्रत्येक खोज उपकरण खोज परिणामों के विश्लेषण और सूचकांक के निर्माण (वेब ​​पृष्ठों के सूचकांक डेटाबेस को भरने) दोनों में दस्तावेजों की रैंकिंग के लिए विभिन्न मानदंडों का उपयोग करता है।

, यदि आप प्रत्येक खोज उपकरण के लिए खोज स्ट्रिंग में एक ही क्वेरी निर्दिष्ट करते हैं, तो आप भिन्न खोज परिणाम प्राप्त कर सकते हैं। उपयोगकर्ता के लिए, यह बहुत महत्वपूर्ण है कि खोज परिणामों के अनुसार पहले दो या तीन दर्जन दस्तावेज़ों में कौन से दस्तावेज़ दिखाई देंगे और ये दस्तावेज़ किस हद तक उपयोगकर्ता की अपेक्षाओं के अनुरूप हैं।

अधिकांश खोज उपकरण खोज करने के दो तरीके प्रदान करते हैं - सरल खोज(सरल खोज) और उन्नत खोज(उन्नत खोज) एक विशेष अनुरोध फ़ॉर्म के साथ और बिना। आइए अंग्रेजी भाषा के खोज इंजन के उदाहरण पर दोनों प्रकार की खोज पर विचार करें।

उदाहरण के लिए, अल्टाविस्टा मनमाने प्रश्नों के लिए उपयोगी है, "सूचना प्रौद्योगिकी में ऑनलाइन डिग्री के बारे में कुछ", जबकि याहू का खोज उपकरण आपको विश्व समाचार, विनिमय दर की जानकारी, या मौसम पूर्वानुमान प्राप्त करने की अनुमति देता है।

क्वेरी और उन्नत खोज तकनीकों को परिशोधित करने के मानदंडों में महारत हासिल करने से आप खोज की दक्षता में वृद्धि कर सकते हैं और आवश्यक जानकारी जल्दी से प्राप्त कर सकते हैं। सबसे पहले, आप प्रश्नों में तार्किक ऑपरेटरों (संचालन) या, और, निकट, नहीं, गणितीय और विशेष प्रतीकों का उपयोग करके खोज दक्षता बढ़ा सकते हैं। प्रचालकों और/या प्रतीकों की सहायता से, उपयोगकर्ता क्वेरी के लिए सबसे उपयुक्त खोज परिणाम प्राप्त करने के लिए खोजशब्दों को वांछित क्रम में जोड़ता है। एक साधारण क्वेरी दस्तावेज़ों के संदर्भों की एक छोटी संख्या लौटाती है, क्योंकि सूची में दस्तावेज़ शामिल हैं जिनमें क्वेरी के दौरान दर्ज किए गए शब्दों में से एक, या एक साधारण वाक्यांश (तालिका 1 देखें)। और ऑपरेटर आपको यह निर्दिष्ट करने की अनुमति देता है कि सभी खोजशब्दों को दस्तावेज़ सामग्री में शामिल किया जाना चाहिए। हालांकि, दस्तावेजों की संख्या अभी भी बड़ी होनी चाहिए और उनकी समीक्षा करने में उचित समय लगेगा। इस कारण से, कुछ मामलों में निकट संदर्भ ऑपरेटर का उपयोग करना अधिक सुविधाजनक होता है, जो इंगित करता है कि शब्दों को दस्तावेज़ में पर्याप्त निकटता में स्थित होना चाहिए। नियर का उपयोग करने से पाए गए दस्तावेज़ों की संख्या बहुत कम हो जाती है। क्वेरी स्ट्रिंग में प्रतीक "*" की उपस्थिति का अर्थ है कि शब्द को उसके मास्क द्वारा खोजा जाएगा। उदाहरण के लिए, आइए "gov" से शुरू होने वाले शब्दों वाले दस्तावेज़ों की एक सूची प्राप्त करें, यदि हम क्वेरी स्ट्रिंग में "gov*" लिखते हैं। ये शब्द सरकार, राज्यपाल आदि हैं।

रूसी भाषा की जानकारी के लिए सबसे विकसित खोज सेवा यांडेक्स खोज सर्वर द्वारा प्रदान की जाती है। यांडेक्स में, आप बस रूसी में एक वाक्यांश लिख सकते हैं जो यह बताता है कि आप क्या खोजना चाहते हैं, और सिस्टम आपके अनुरोध का विश्लेषण और प्रक्रिया करेगा, और फिर किसी दिए गए विषय से संबंधित हर चीज को खोजने का प्रयास करेगा। आप विशेष ऑपरेटरों का उपयोग करके, एक स्ट्रिंग बना सकते हैं जो खोज इंजन को बताती है कि आपकी रुचि के लिए आपकी आवश्यकताएं क्या होनी चाहिए। कुछ यांडेक्स क्वेरी भाषा ऑपरेटरों को यहां पाया जा सकता है: http://help.yandex.ru/search/ -id=481939

समान रूप से लोकप्रिय रैम्बलर सर्च इंजन अपने स्वयं के डेटाबेस से लिंक ट्रैफ़िक पर आँकड़े रखता है, समान तार्किक ऑपरेटरों का समर्थन करता है और, या, नहीं, मेटाएक्टेक्टर * (वर्ण के समान * अल्टाविस्टा में जो क्वेरी रेंज का विस्तार करता है), गुणांक प्रतीक + और - , क्वेरी में दर्ज किए गए शब्दों के महत्व को बढ़ाने या घटाने के लिए।

आइए इंटरनेट पर सबसे लोकप्रिय सूचना खोज तकनीकों को देखें।

विषय 3 इंटरनेट सर्च इंजन के साथ कार्य करना

खोज के औज़ार

खोज उपकरण विशेष सॉफ्टवेयर हैं, जिसका मुख्य उद्देश्य इंटरनेट उपयोगकर्ताओं के लिए सबसे इष्टतम और उच्च गुणवत्ता वाली जानकारी खोज प्रदान करना है। खोज उपकरण विशेष वेब सर्वर पर होस्ट किए जाते हैं, जिनमें से प्रत्येक एक विशिष्ट कार्य करता है:

1. वेब पेजों का विश्लेषण और खोज सर्वर के डेटाबेस के एक या दूसरे स्तर पर विश्लेषण के परिणाम दर्ज करना।

2. उपयोगकर्ता के अनुरोध पर जानकारी खोजें।

3. उपयोगकर्ता द्वारा जानकारी खोजने और खोज परिणाम देखने के लिए एक उपयोगकर्ता के अनुकूल इंटरफेस प्रदान करना।

इन या अन्य खोज उपकरणों के साथ काम करते समय उपयोग किए जाने वाले कार्य के तरीके लगभग समान होते हैं। उन पर चर्चा करने के लिए आगे बढ़ने से पहले, निम्नलिखित अवधारणाओं पर विचार करें:

1. खोज टूल इंटरफ़ेस को हाइपरलिंक, एक क्वेरी स्ट्रिंग (खोज स्ट्रिंग) और क्वेरी सक्रियण टूल वाले पृष्ठ के रूप में प्रस्तुत किया जाता है।

2. सर्च इंजन इंडेक्स एक सूचना आधार है जिसमें कुछ नियमों के अनुसार संकलित वेब पेजों के विश्लेषण का परिणाम होता है।

3. क्वेरी एक कीवर्ड या वाक्यांश है जिसे उपयोगकर्ता खोज बार में दर्ज करता है। विभिन्न प्रश्नों को बनाने के लिए विशेष वर्ण ("", ~), गणितीय प्रतीकों (*, +,?) का उपयोग किया जाता है।

सूचना खोज योजना सरल है। उपयोगकर्ता एक प्रमुख वाक्यांश टाइप करता है और खोज को सक्रिय करता है, जिससे तैयार (दिए गए) अनुरोध के अनुसार दस्तावेजों का चयन प्राप्त होता है। दस्तावेज़ों की इस सूची को कुछ मानदंडों के अनुसार रैंक किया गया है ताकि सूची के शीर्ष पर वे दस्तावेज़ हों जो उपयोगकर्ता की क्वेरी से सबसे अधिक निकटता से मेल खाते हों। प्रत्येक खोज उपकरण खोज परिणामों के विश्लेषण और सूचकांक के निर्माण (वेब ​​पृष्ठों के सूचकांक डेटाबेस को भरने) दोनों में दस्तावेजों की रैंकिंग के लिए विभिन्न मानदंडों का उपयोग करता है।

इस प्रकार, यदि आप प्रत्येक खोज उपकरण के लिए खोज स्ट्रिंग में समान डिज़ाइन की कोई क्वेरी निर्दिष्ट करते हैं, तो आप भिन्न खोज परिणाम प्राप्त कर सकते हैं। उपयोगकर्ता के लिए, यह बहुत महत्वपूर्ण है कि खोज परिणामों के अनुसार पहले दो या तीन दर्जन दस्तावेज़ों में कौन से दस्तावेज़ दिखाई देंगे और ये दस्तावेज़ किस हद तक उपयोगकर्ता की अपेक्षाओं के अनुरूप हैं।

अधिकांश खोज उपकरण खोज करने के दो तरीके प्रदान करते हैं - सरल खोज(सरल खोज) और उन्नत खोज(उन्नत खोज) एक विशेष अनुरोध फ़ॉर्म के साथ और बिना। आइए अंग्रेजी भाषा के खोज इंजन के उदाहरण पर दोनों प्रकार की खोज पर विचार करें।

उदाहरण के लिए, अल्टाविस्टा मनमाने प्रश्नों के लिए उपयोगी है, "सूचना प्रौद्योगिकी में ऑनलाइन डिग्री के बारे में कुछ," जबकि याहू का खोज उपकरण आपको विश्व समाचार, विनिमय दर या मौसम पूर्वानुमान प्राप्त करने की अनुमति देता है।

क्वेरी और उन्नत खोज तकनीकों को परिशोधित करने के मानदंडों में महारत हासिल करने से आप खोज की दक्षता में वृद्धि कर सकते हैं और आवश्यक जानकारी जल्दी से प्राप्त कर सकते हैं। सबसे पहले, आप प्रश्नों में तार्किक ऑपरेटरों (संचालन) या, और, निकट, नहीं, गणितीय और विशेष प्रतीकों का उपयोग करके खोज दक्षता बढ़ा सकते हैं। प्रचालकों और/या प्रतीकों की सहायता से, उपयोगकर्ता क्वेरी के लिए सबसे उपयुक्त खोज परिणाम प्राप्त करने के लिए खोजशब्दों को वांछित क्रम में जोड़ता है। अनुरोध प्रपत्र तालिका 1 में दिखाए गए हैं।

तालिका एक

एक साधारण क्वेरी दस्तावेज़ों के कई लिंक देती है, क्योंकि सूची में अनुरोध पर दर्ज किए गए शब्दों में से एक या एक साधारण वाक्यांश (तालिका 1 देखें) वाले दस्तावेज़ शामिल हैं। और ऑपरेटर आपको यह निर्दिष्ट करने की अनुमति देता है कि सभी खोजशब्दों को दस्तावेज़ सामग्री में शामिल किया जाना चाहिए। हालाँकि, दस्तावेज़ों की संख्या अभी भी बड़ी हो सकती है और उनकी समीक्षा करने में लंबा समय लग सकता है। इसलिए, कुछ मामलों में निकट संदर्भ ऑपरेटर का उपयोग करना अधिक सुविधाजनक होता है, जो इंगित करता है कि शब्दों को दस्तावेज़ में पर्याप्त निकटता में स्थित होना चाहिए। नियर का उपयोग करने से पाए गए दस्तावेज़ों की संख्या बहुत कम हो जाती है। क्वेरी स्ट्रिंग में प्रतीक "*" की उपस्थिति का अर्थ है कि शब्द को उसके मास्क द्वारा खोजा जाएगा। उदाहरण के लिए, यदि हम क्वेरी स्ट्रिंग में "gov*" लिखते हैं, तो "gov" से शुरू होने वाले शब्दों वाले दस्तावेज़ों की एक सूची प्राप्त करें। ये शब्द सरकार, राज्यपाल आदि हो सकते हैं।

रूसी भाषा की जानकारी के लिए सबसे विकसित खोज सेवा यांडेक्स खोज सर्वर द्वारा प्रदान की जाती है। यांडेक्स में, आप बस रूसी में एक वाक्यांश लिख सकते हैं जो यह बताता है कि आप क्या खोजना चाहते हैं, और सिस्टम आपके अनुरोध का विश्लेषण और प्रक्रिया करेगा, और फिर किसी दिए गए विषय से संबंधित हर चीज को खोजने का प्रयास करेगा। आप विशेष ऑपरेटरों का उपयोग करके, एक स्ट्रिंग बना सकते हैं जो खोज इंजन को बताती है कि आपकी रुचि के लिए आपकी आवश्यकताएं क्या होनी चाहिए।

समान रूप से लोकप्रिय खोज इंजन Rambler अपने स्वयं के डेटाबेस से लिंक उपस्थिति पर आंकड़े रखता है, वही तार्किक ऑपरेटर और, या, नहीं, मेटाएक्टेक्टर * (अल्टाविस्टा में वर्ण के समान * जो क्वेरी रेंज का विस्तार करता है), गुणांक प्रतीक + और - हैं क्वेरी में दर्ज किए गए महत्व वाले शब्दों को बढ़ाने या घटाने के लिए समर्थित है।

आइए इंटरनेट पर सबसे लोकप्रिय सूचना खोज तकनीकों को देखें।

सूचना संसाधनों की नियुक्ति।

सूचना संसाधनों के लिए खोज उपकरण।

वर्तमान में, इंटरनेट सूचना संसाधनों का विकास उच्च दर से हो रहा है। वर्ल्ड वाइड वेब एक पुस्तकालय के वाचनालय जैसा दिखता है, जहां पाठ, ग्राफिक्स, मल्टीमीडिया, अभिलेखागार और अन्य फाइलों की विशाल मात्रा संग्रहीत की जाती है। इस हॉल को पूरी तरह से बायपास नहीं किया जा सकता है। यहां सब कुछ प्रति घंटा बदलता है, विभिन्न दस्तावेजों का शरीर हर सेकेंड बढ़ता है। आपके लिए आवश्यक जानकारी ढूँढना कठिन होता जा रहा है। विभिन्न मुद्रित संदर्भ पुस्तकें प्रकाशित होने से पहले ही अप्रचलित हो जाती हैं। जानकारी खोजने का एकमात्र विश्वसनीय तरीका विशेष खोज इंजन का उपयोग करना है जो लगातार नेटवर्क पर जानकारी में परिवर्तन को ट्रैक करता है।

इंटरनेट पर उपयोग किए जाने वाले संसाधन अक्सर WWW सर्वर (या वेब सर्वर), फ़ाइल अभिलेखागार (FTP अभिलेखागार), और गोफर सूचना और संदर्भ प्रणाली में स्थित होते हैं।

WWW (वर्ल्ड वाइड वेब - वर्ल्ड वाइड वेब) एक वैश्विक हाइपरटेक्स्ट सिस्टम है जो इंटरनेट पर सूचना के परिवहन के लिए HTTP प्रोटोकॉल (हाइपरटेक्स्ट ट्रांसफर प्रोटोकॉल - हाइपरटेक्स्ट ट्रांसफर प्रोटोकॉल) का उपयोग करता है। हाइपरटेक्स्ट एक सहयोगी (क्रमिक के बजाय) लिंक द्वारा एक दूसरे से जुड़े नोड्स के अनुक्रम के रूप में सभी प्रकार की जानकारी प्रस्तुत करने का एक तरीका है और हाइपरलिंक के रूप में कार्यान्वित किया जाता है। हाइपरलिंक - हाइपरटेक्स्ट में हाइलाइट किए गए वर्णों का एक क्रम जो माउस क्लिक का जवाब देता है और उपयोगकर्ता को हाइपरटेक्स्ट के दूसरे टुकड़े पर भेजता है। वेब सर्वर पर संग्रहीत अधिकांश दस्तावेज़ HTML (हाइपरटेक्स्ट मार्कअप लैंग्वेज) में लिखे जाते हैं।

गोफर सर्वर एक सर्वर होता है जिसमें प्रोग्राम होते हैं जो आपको उपयोगकर्ता द्वारा निर्दिष्ट विषय पर फ़ाइलें, प्रोग्राम या अन्य संसाधन खोजने की अनुमति देते हैं। ऐसे सर्वर का URL इस तरह दिखता है (उदाहरण के लिए, यदि सर्वर Microsoft के स्वामित्व में है): gopher://gopher.microsoft.com।

खोज टूल के दो समूह हैं: 1) खोज इंजन और 2) खोज सेवाएँ।

आईपीएस (सूचना पुनर्प्राप्ति प्रणाली) -यह एक प्रणाली है जो सूचना स्रोतों के विवरण के साथ एक विशेष डेटाबेस में आवश्यक डेटा की खोज और चयन प्रदान करती है ( अनुक्रमणिका ) सूचना पुनर्प्राप्ति भाषा और संबंधित खोज नियमों के आधार पर।

इंटरनेट पर, WWW के लिए निम्नलिखित खोज उपकरण प्रतिष्ठित किए जा सकते हैं: खोज इंजन, मेटासर्च इंजन (खोज इंजन) और त्वरित खोज कार्यक्रम (खोज एजेंट)।


चित्र.13. WWW खोज उपकरण

इस पर निर्भर करता है कि डेटाबेस कौन बनाता है जिसमें उपयोगकर्ता के लिए आवश्यक जानकारी की खोज की जाती है, वहाँ हैं खोज यन्त्रपहली और दूसरी तरह। पहली तरह के सर्च इंजन में लोगों द्वारा डेटाबेस बनाया जाता है, दूसरी तरह के सर्च इंजन में यह प्रक्रिया कंप्यूटर द्वारा की जाती है।


पहली तरह के सर्च इंजन, एक नियम के रूप में, कहलाते हैं कैटलाग (विषय या विषयगत - विषय कैटलॉग)।आमतौर पर ऐसी निर्देशिका लोगों द्वारा पदानुक्रमित पेड़ों के रूप में बनाई जाती है, जिनमें से शीर्ष स्तर पर सबसे अधिक सामान्य अवधारणाएं: व्यापार, राजनीति, शिक्षा, खेल, संस्कृति, आदि। ऐसे पेड़ों के निचले स्तर के तत्व विशिष्ट वेब पेजों और सर्वरों के लिंक होते हैं। आमतौर पर विषय कैटलॉग में खोज कीवर्ड द्वारा की जाती है। . इस मामले में, यह वेब सर्वर की सामग्री में नहीं, बल्कि उनके में आयोजित किया जाता है संक्षिप्त विवरणनिर्देशिका में संग्रहीत। खोज अनुरोध या तो कीवर्ड ("सूचना प्रौद्योगिकी", "कंप्यूटर भाषाविज्ञान", आदि) की सूची के रूप में या खोजे जाने वाले दस्तावेज़ों के URL निर्दिष्ट करके बनाया जाता है। खोज परिणाम हाइपरटेक्स्ट के रूप में प्रस्तुत किए जाते हैं जिनमें पाए गए दस्तावेज़ों के नाम या यूआरएल हाइपरटेक्स्ट लिंक के रूप में होते हैं।

आप कीवर्ड द्वारा निम्नलिखित जानकारी खोज सकते हैं:

1) कुछ पाठ या उसका हिस्सा;

2) तथ्यात्मक डेटा (उदाहरण के लिए, सूर्य का द्रव्यमान या देश के राष्ट्रपति का नाम);

3) पेंटिंग, चित्र, फिल्म, आदि। उनके नाम से;

4) तकनीकी जानकारी (उदाहरण के लिए, एक निश्चित कार की गति के बारे में जानकारी);

5) लोगों की जीवनी (लेखक, कलाकार, आदि)।

विषयगत निर्देशिकाओं के उदाहरण याहू, गैलेक्सी, डब्ल्यूडब्ल्यूडब्ल्यू वर्चुअल लाइब्रेरी, वेबक्रॉलर, हॉटबॉट आदि हैं। इसी तरह की रूसी-भाषा प्रणाली को पाथफाइंडर कहा जाता है।

दूसरी तरह के सर्च इंजन को कभी-कभी कहा जाता है स्वचालित अनुक्रमणिका, "मकड़ियों" या "कीड़े" मकड़ियों, क्रॉलर)।वे लगातार इंटरनेट को स्कैन करते हैं, वेब पर नए दस्तावेज़ ढूंढते हैं, और प्रत्येक दस्तावेज़ से उसमें निहित सभी हाइपरलिंक निकालते हैं, जिसके साथ वे अपने डेटाबेस (यूआरएल के आधार) को फिर से भरते हैं। इन कार्यों को करने के लिए, स्वचालित अनुक्रमणिका में निम्नलिखित तीन भाग शामिल हैं: एक बॉट जो लगातार इंटरनेट ब्राउज़ करता है; एक डेटाबेस (यूआरएल का एक सेट) जो रोबोट द्वारा एकत्र किया जाता है, और इस डेटाबेस में आवश्यक जानकारी खोजने के लिए एक यूजर इंटरफेस। बड़ी संख्या में स्वचालित अनुक्रमणिकाएँ हैं। सबसे लोकप्रिय हैं:

विदेशी खोज इंजन:

- अल्ताविस्टा (http://www.altavista.com);

- गो (इन्फोसेक) (http://www.go.com);

- गूगल (http://www.google.com);

- एक्साइट (http://www.excite.com);

- हॉटबॉट (http://www.hotbot.com);

- नॉर्दर्न लाइट (http://www.northernlight.com)।

रूसी खोज इंजन:

- यांडेक्स (http://www.yandex.ru);

- रामब्लर (http://www.rambler.ru);

- एपोर्ट (http://www.aport.ru)।
लोकप्रिय बेलारूसी खोज इंजन:

- ALL.BY सिस्टम (http://all.by);

- *.बीवाई सिस्टम (http://search.promedia.minsk.by);

- बेलारूसी WWW-संसाधनों का रजिस्टर Zubr (http://www.zubr.com);

- बेलारूसी इंटरनेट कैटलॉग अकविता (http://akavita.kryvia.net);

- बेलारूसी संसाधन सूची (http://www.belresource.com.by),

अधिकांश खोज इंजन बहुक्रियाशील इंटरनेट वेब साइटों के घटकों में से एक हैं - तथाकथित पोर्टल।

द्वार- विभिन्न प्रकार की सेवाओं की पेशकश करने वाली एक बहुक्रियाशील इंटरनेट वेब साइट: सूचना खोज, मुफ्त ई-मेल, आदि।

हाल ही में, वर्ल्ड वाइड वेब पर सिस्टम दिखाई देने लगे हैं जो स्वचालित रूप से एक साथ दो इंडेक्स (एक कैटलॉग इंडेक्स और एक सर्च इंजन इंडेक्स) में खोज करते हैं। ऐसी प्रणालियाँ आपको दोनों प्रकार के खोज सर्वरों का लाभ उठाने की अनुमति देती हैं और इन्हें कहा जाता है मशीन निर्देशिका।

विभिन्न खोज उपकरणों का उपयोग करके जानकारी की खोज सरल और जटिल प्रश्नों को बनाकर की जा सकती है। एक साधारण क्वेरी एक शब्द या वाक्यांश है जिसे कभी-कभी उद्धरण चिह्नों में संलग्न किया जाता है। AND, OR, NOT, NEAR या गणितीय प्रतीकों जैसे "*", "+", "-", "~" जैसे ऑपरेटरों द्वारा जुड़े शब्दों या वाक्यांशों से एक जटिल क्वेरी बनाई जाती है। कभी-कभी एक ही उद्देश्य के लिए विशेष शब्दों का प्रयोग किया जाता है। डोमेन, होस्ट, लिंक टाइडऔर आदि।

वीडियो ट्यूटोरियल: में अनुरोध कैसे बनाएं माइक्रोसॉफ्ट पहुंचदस मिनट मे

भाषण: सर्च इंजन टूल्स (क्वेरी जेनरेशन) का उपयोग करना

डेटाबेस के साथ काम करते समय सबसे महत्वपूर्ण कार्य सूचना फ़िल्टर, खोज और क्वेरी हैं।


छंटाईकिसी विशेषता के अनुसार सूचना को क्रमित करने की प्रक्रिया है। आरोही और अवरोही प्रकार हैं। यदि डेटाबेस में संख्यात्मक जानकारी है, तो रैंकिंग का उपयोग छँटाई के रूप में किया जाता है, और यदि हम बात कर रहे हेपाठ्य जानकारी के बारे में, वे वर्णानुक्रमिक छँटाई का उपयोग करते हैं।


MS Access में डेटाबेस प्रबंधन प्रणालियों द्वारा छँटाई पर विचार करते समय, छँटाई एक ही क्षेत्र में की जाती है। यदि एक नए प्रकार का उपयोग किया जाता है, तो इसके पिछले परिणाम खो जाते हैं। यदि सॉर्ट नेस्टेड है, तो यह एक क्वेरी का उपयोग करके किया जा सकता है।


फ़िल्टरउपयोगकर्ता द्वारा आवश्यक जानकारी का चयन है। आप जटिल चयन शर्तें निर्धारित कर सकते हैं।

कुछ डेटा खोजने के लिए, आप विशेष वर्णों का उपयोग कर सकते हैं जिन्हें कहा जाता है मुखौटा:


* - इसका मतलब है कि किसी भी संख्या में वर्णों का चयन किया जा सकता है।

? - इस वर्ण के स्थान पर कोई भी वर्ण हो सकता है जिसका उपयोग करने की अनुमति हो।

# - इस चिन्ह के स्थान पर किसी भी संख्या का प्रयोग किया जा सकता है।

- कोष्ठक में कोई वर्ण।

- - चयनित श्रेणी के अनुरूप कोई भी वर्ण।

! - वर्ग कोष्ठक में संलग्न वर्णों को छोड़कर कोई भी वर्ण।

संकेतों द्वारा इस फ़िल्टर का उपयोग संपूर्ण तालिका के लिए, या कुछ मानदंडों के अनुसार पहले से चयनित डेटा के एक भाग के लिए किया जा सकता है।

प्रार्थना- यह फ़ंक्शन बड़े पैमाने पर है और इसमें सॉर्टिंग और फ़िल्टरिंग दोनों शामिल हो सकते हैं। यह सुविधा आपको कई क्षेत्रों और तालिकाओं में डेटा का चयन करने की अनुमति देती है। आप एक क्वेरी लाइब्रेरी बना सकते हैं जिसे भविष्य में उपयोग के लिए सहेजा गया है। एक विशेष SQL क्वेरी भाषा है - संरचित।

शेयर करना: