Back to Question Center
0

Semalt: Google क्रोम एक्सटेंशन का प्रयोग करके एक वेब पेज को कैसे स्क्रैप करना

1 answers:

एक स्क्रीन स्क्रैपर एक स्क्रिप्ट है जो साइट को पढ़ती है और वेब से उपयोगी जानकारी निकालती है. स्क्रीन स्क्रैपिंग वेबसाइटों और वेब पेजों से वास्तविक डेटा प्राप्त करने का अंतिम समाधान माइक्रोसॉफ्ट एक्सेल के लिए है. Google क्रोम एक्सटेंशन स्क्रैपर एक शक्तिशाली स्क्रीन स्क्रैपिंग टूल है जो विंडोज और मैक ओएस दोनों पर काम करता है.

गूगल क्रोम एक्सटेंशन खुरचनी क्यों?

Google क्रोम एक्सटेंशन खुरचनी क्रोम वेब स्टोर पर एक सशक्त स्क्रीन स्क्रैपिंग टूल मुफ्त में जा रहा है. यह स्क्रैपिंग टूल क्रोम ब्राउज़र में एक प्लगइन के रूप में स्थापित है. प्लगइन ब्लॉगर्स और विपणक को एक तत्व पर राइट क्लिक करके वेब पृष्ठों से डेटा प्राप्त करने की अनुमति देता है - mail garanti. यदि आप एक तत्व पर राइट-क्लिक करते हैं तो '' स्क्रैपे समान '' को आपकी स्क्रीन पर पॉप अप करना चाहिए.

XPaths का परिचय

XPath एक प्रोग्रामिंग भाषा है जो XML संरचनाओं में महत्वपूर्ण जानकारी प्राप्त करती है. HTML फ़ाइल एक XML संरचना का एक उत्कृष्ट उदाहरण है. XPath आमतौर पर लक्षित नोड्स को चुनने के लिए उपयोग किया जाता है. इस संदर्भ में, एक्सपाथ का इस्तेमाल वेब पेज पर निकाले जाने वाले टेक्स्ट को निर्धारित करने के लिए किया जाएगा. XPaths स्वीडिश सांसदों के पक्ष के नाम और फोन नंबरों की पहचान करने में भी मदद करेगा.

क्रोम के स्क्रेपर के साथ 34 9 स्वीडिश सांसदों

के पते के विवरण तक पहुंचने के लिए Google क्रोम के खरोंच का उपयोग करना वेब पृष्ठ से जानकारी निकालने से केवल सरल लेकिन शानदार भी नहीं है. आप प्रक्रिया और तकनीक का आनंद लेंगे.

वेबसाइट में सभी स्वीडिश सदस्यों और उनके पते सूचीबद्ध हैं. आरंभ करने के लिए, किसी भी एमपी पर राइट क्लिक करें और "Scrape Similar. "आपको अपनी स्क्रीन पर निम्न डिस्प्ले देखना चाहिए.

स्क्रैप वेब पेज स्क्रीन पर कैसे कदम गाइड द्वारा चरण

यदि आप एक एमपी पर राइट-क्लिक करते हैं और "तत्व का निरीक्षण करें" चुनें, एक वर्णमाला सूची "grid_6 alpha omega" के तहत बनाई जाएगी खोज परिणाम कंटेनर clist "वर्ग. इस वेब पेज को स्क्रैप करने के लिए दो चरणों का इस्तेमाल किया जाएगा. चरण में एक XPath के साथ सांसद डेटा के साथ टैग का चयन करना शामिल होगा. चरण दो में पार्टी के नाम, नाम और फोन नंबर जैसे डेटा के विशिष्ट भागों को चुनना शामिल है और कॉलम में डेटा व्यवस्थित करना है.

चरण 1

एचटीएमएल संरचना में गहरी ख्याल रखें और तत्वों को बरकरार रखें. आपके संरचना पर तत्वों के साथ टैग की संख्या की पहचान करने के लिए टैग इंगित करें. लक्षित डेटा के शामिल अंतिम टैग की पहचान करें. "परिमार्जन" पर क्लिक करके संरचना पर एक XPath परीक्षण चलाएं. "

34 9 पंक्तियों की एक सूची आपकी स्क्रीन पर प्रदर्शित की जाएगी. 34 9 स्वीडिश सांसदों की कुल संख्या का प्रतिनिधित्व करते हैं.

चरण 2

प्रस्तुत डेटा को स्तंभों में विभाजित करें. जिस वेबपेज का आप उपयोग कर रहे हैं उस पर HTML कोड का निरीक्षण करें. इस मामले में, निकाले जाने वाले टुकड़े इस समय पीले रंग में उजागर किए जाते हैं. कॉलम फ़ील्ड में XPaths डालें और प्लगइन को चलाने के लिए "Scrape" पर क्लिक करें.

यदि आपके पास XPaths का बुनियादी ज्ञान है, प्रोग्रामिंग समझने के लिए आपके लिए एक व्यस्त काम नहीं होगा. उपरोक्त हाइलाइट चरण आपको स्क्रैप वेब पेज को स्क्रीन पर कैसे दिखाएंगे. यदि आप एकाधिक वेब पृष्ठों को स्क्रैप करने पर काम कर रहे हैं, तो आपको प्रोग्रामिंग कौशल की आवश्यकता है.

December 22, 2017