यह मार्गदर्शिका बताती है कि क्रॉलिंग, इंडेक्सेशन, सुरक्षा, साइट संरचना और Core Web Vitals को प्रभावित करने वाले फिक्स को प्राथमिकता देकर एक व्यावहारिक तकनीकी SEO ऑडिट कैसे चलाया जाए। यह छोटी साइटों के मालिकों को कम-प्राथमिकता वाली ऑडिट-टूल चेतावनियों पर समय बर्बाद करने के बजाय पहले उच्च-प्रभाव वाले मुद्दों पर ध्यान केंद्रित करने में मदद करता है।
तकनीकी SEO ऑडिट क्या है?
एक तकनीकी SEO ऑडिट आपकी वेबसाइट के सभी तकनीकी पहलुओं का विश्लेषण करने की प्रक्रिया है ताकि यह सुनिश्चित किया जा सके कि सर्च इंजन (जैसे Google) इसे और इसके सभी पृष्ठों को रैंक कर सकें।
जब आप तकनीकी SEO ऑडिट करते हैं, तो आप जांचते हैं कि आपकी वेबसाइट सर्च इंजन के लिए ऑप्टिमाइज़ है या नहीं।
अधिकांश तकनीकी SEO ऑडिट 200 समस्याओं की एक सूची और कोई स्पष्ट दिशा नहीं देते हैं। आप सबसे आसान चीजों को ठीक करते हैं, बाकी को अनदेखा करते हैं, और सोचते हैं कि रैंकिंग क्यों नहीं बदली।
समस्या ऑडिट की नहीं है, बल्कि ऑर्डर की है।
यह गाइड एक ही सिद्धांत पर आधारित है: गंभीरता अनुक्रम निर्धारित करती है. आप सीखेंगे कि क्या जांचना है, पहले क्या ठीक करना है, और (उतना ही महत्वपूर्ण) क्या सुरक्षित रूप से अनदेखा करना है।
स्कोप नोट: यह गाइड 500 पेजों से कम वाली साइटों के लिए तैयार की गई है, जिसे एक या दो लोग प्रबंधित करते हैं, और मुफ्त या फ्रीमियम टूल का उपयोग करते हैं। यदि आप बड़े पैमाने पर या जावास्क्रिप्ट-भारी साइट चलाते हैं, तो कुछ सिफारिशों को अनुकूलित करने की आवश्यकता होगी।
गंभीरता फ़िल्टर: आपका ट्राइएज मॉडल
कोई भी टूल चलाने से पहले, समझें कि वह आपको क्या बता रहा है। सभी ऑडिट फ़्लैग समान नहीं होते, और उन्हें समान मानना किसी ऐसी चीज़ पर समय बर्बाद करने का सबसे तेज़ तरीका है जिसकी Google को परवाह नहीं है।
नीचे दिए गए प्रत्येक अनुभाग में इस तीन-स्तरीय मॉडल का उपयोग करें:
| स्तर | श्रेणी | कार्रवाई |
| स्तर 1 | रैंकिंग में बाधाएं | तुरंत ठीक करें: ये सक्रिय रूप से दृश्यता को दबाते हैं |
| स्तर 2 | क्रॉल अक्षमताएं | इस स्प्रिंट को ठीक करें: ये बिना कठोर अवरोध के पहुंच को सीमित करते हैं |
| स्तर 3 | कम प्राथमिकता वाले फ़्लैग | शेड्यूल करें या अनदेखा करें: ये शायद ही कभी छोटी साइटों की रैंकिंग को प्रभावित करते हैं |
अगर कोई टूल कुछ फ़्लैग करता है और आप उसे Tier 1 या Tier 2 में नहीं रख सकते, तो वह Tier 3 में तब तक रहेगा जब तक कि उल्टा साबित न हो।
प्री-ऑडिट सेटअप: टूल्स और बेसलाइन
चलिए बात करते हैं SEO अनुकूलन उपकरण जो आपको तकनीकी SEO ऑडिट के लिए चाहिए।
इस ऑडिट के लिए मुफ्त स्टैक:
- Google Search Console — आपको किसी और चीज़ से पहले प्रॉपर्टी के स्वामित्व की पुष्टि करनी चाहिए; यह इंडेक्सेशन और परफ़ॉर्मेंस डेटा के लिए आपकी ग्राउंड ट्रुथ है।
- Google Page Speed Insights — कोर वेब वाइटल्स के लिए फील्ड डेटा; खाते की आवश्यकता नहीं
- स्क्रीमिंग फ्रॉग एसईओ स्पाइडर (फ्री टियर) — 500 URL तक क्रॉल करता है; अधिकांश छोटी साइटों के लिए पर्याप्त
- Chrome Dev Tools — शून्य इंस्टॉल, ब्राउज़र में निर्मित; रेंडरिंग और नेटवर्क डायग्नोस्टिक्स के लिए उपयोग करें
- Ahrefs वेबमास्टर टूल्स (फ्री टियर) — बैकलिंक डेटा और बेसिक साइट ऑडिट बिना पेड सब्सक्रिप्शन के
अगर आपकी साइट 500 पेज से ज़्यादा है, तो Screaming Frog क्रॉल के लिए अपने सबसे ज़्यादा ट्रैफ़िक और कन्वर्ज़न वाले URL को प्राथमिकता दें। एक साथ सब कुछ ऑडिट करने की कोशिश न करें।
अनुशंसित लेख: Google Search Console: 2026 के लिए अंतिम गाइड
डोमेन, DNS और सुरक्षा स्वास्थ्य
यह ऑडिट श्रेणी है जिसे हर प्रतियोगी छोड़ देता है। यह इसमें आता है स्तर 1 — इसलिए नहीं कि ये समस्याएँ सामान्य हैं, बल्कि इसलिए कि जब ये मौजूद होती हैं, तो ये सब कुछ नीचे की ओर अवरुद्ध कर देती हैं। एक टूटा हुआ SSL प्रमाणपत्र या डोमेन स्तर पर गलत तरीके से कॉन्फ़िगर किया गया रीडायरेक्ट, एक भी सामग्री का मूल्यांकन होने से पहले ही आपकी पूरी साइट को चुपचाप दबा सकता है।
अधिकांश साइट मालिक सीधे कीवर्ड और कंटेंट पर कूदते हैं। यह सेक्शन उस नींव के बारे में है जिस पर ये चीज़ें टिकी हैं।
इन्हें क्रम से जांचें:
1. क्या आपकी साइट HTTPS पर चल रही है?
जब आप किसी वेबसाइट पर जाते हैं, तो आपका ब्राउज़र और सर्वर लगातार जानकारी का आदान-प्रदान कर रहे होते हैं। HTTPS उस कनेक्शन का सुरक्षित संस्करण है, यह डेटा को एन्क्रिप्ट करता है ताकि इसे इंटरसेप्ट न किया जा सके। HTTP (S के बिना) पुराना, अनएन्क्रिप्टेड संस्करण है।
आप अपने ब्राउज़र के एड्रेस बार को देखकर बता सकते हैं कि आपकी साइट किसका उपयोग कर रही है। एक पैडलॉक आइकन का मतलब है कि HTTPS सक्रिय है। "Not secure" चेतावनी का मतलब है कि यह सक्रिय नहीं है, और Google और आपके विज़िटर दोनों इसे नोटिस करेंगे।
SEO के लिए यह क्यों मायने रखता है: Google ने HTTPS को रैंकिंग सिग्नल के रूप में पुष्टि की है। व्यावहारिक रूप से, Chrome जैसे ब्राउज़र आगंतुकों को गैर-सुरक्षित साइटों से सक्रिय रूप से चेतावनी देते हैं। यदि आपकी साइट का कोई भी पेज अभी भी HTTP पर लोड होता है, तो पहले इसे ठीक करें।
आपके होमपेज का सुरक्षित होना पर्याप्त नहीं है। हर पेज और उन पेजों पर हर संसाधन (चित्र, फ़ॉन्ट, स्क्रिप्ट, स्टाइलशीट) को HTTPS पर लोड होना चाहिए। जब कोई सुरक्षित पेज एक असुरक्षित संसाधन लोड करता है, तो इसे मिश्रित सामग्री त्रुटि कहा जाता है। पेज में तकनीकी रूप से HTTPS है, लेकिन ब्राउज़र इसे आंशिक रूप से असुरक्षित के रूप में चिह्नित करता है।
उपयोग पैडलॉक क्यों नहीं, कोई भी URL पेस्ट करें और यह आपको बताएगा कि कौन सी एसेट असुरक्षित रूप से लोड हो रही हैं और वे कहाँ से आ रही हैं।
2. क्या आपके डोमेन का एक स्थिर पता है?
आपकी वेबसाइट तकनीकी रूप से दो अलग-अलग पतों पर पहुंचा जा सकता है: www.yourdomain.com और yourdomain.com (www के बिना)। ब्राउज़र के लिए, ये दो अलग-अलग स्थान हैं। Google के लिए, ये दो अलग-अलग वेबसाइटों की तरह दिख सकते हैं जो समान सामग्री प्रकाशित कर रही हैं।
इसे कहते हैं www बनाम non-www विरोध, और यह छोटी साइटों पर सबसे आम डोमेन-स्तरीय समस्याओं में से एक है।
एक संस्करण (www या non-www) को अपने कैननिकल (आधिकारिक) पते के रूप में चुनें। फिर दूसरे संस्करण से 301 रीडायरेक्ट सेट करें। 301 रीडायरेक्ट एक स्थायी निर्देश है जो ब्राउज़र और सर्च इंजन को बताता है: "यह पता हमेशा के लिए यहां स्थानांतरित हो गया है। इस लिंक का अनुसरण करें और वापस न आएं।"
एक बार सेट हो जाने पर, कोई भी व्यक्ति किसी भी वर्ज़न को टाइप करके एक ही जगह पर पहुँचेगा, और Google आपकी साइट को दो डुप्लिकेट के बजाय एक एकीकृत इकाई के रूप में मानेगा।
कैसे जांचें: अपने डोमेन के दोनों संस्करण ब्राउज़र में टाइप करें और देखें कि एड्रेस बार में क्या होता है। यदि एक दूसरे पर साफ़ तरीके से रीडायरेक्ट होता है, तो ठीक है। यदि दोनों स्वतंत्र रूप से लोड होते हैं (समान सामग्री दिखाते हैं), तो आपके पास डुप्लिकेट कंटेंट की समस्या है जिसे ठीक करना है। आप इसका उपयोग भी कर सकते हैं redirect-checker.org यह पुष्टि करने के लिए कि रीडायरेक्ट एक वास्तविक 301 है, न कि कोई नरम, अस्थायी रीडायरेक्ट।
3. क्या आपकी स्टेजिंग या परीक्षण साइटें Google को दिखाई देती हैं?
जब डेवलपर्स कोई वेबसाइट बनाते या अपडेट करते हैं, तो वे आमतौर पर पहले साइट के एक अलग संस्करण पर काम करते हैं, अक्सर staging.yourdomain.com या dev.yourdomain.com जैसे पते पर। इसे कहा जाता है स्टेजिंग वातावरण या टेस्ट सबडोमेन. यह जनता से छिपा रहने के लिए है।
समस्या: यदि कोई Google को स्पष्ट रूप से बाहर रहने के लिए नहीं कहता, तो Googlebot इसे ढूँढ़ लेगा और क्रॉल करेगा। अब Google के पास आपकी साइट के दो संस्करण (लाइव और स्टेजिंग) हैं जिनमें समान सामग्री है। यह इंडेक्सेशन को भ्रमित करता है और उन पेजों पर क्रॉल बजट बर्बाद करता है जिन्हें कभी खोज परिणामों में नहीं दिखना चाहिए।
स्टेजिंग और टेस्ट सबडोमेन को robots.txt निर्देश का उपयोग करके क्रॉलर से ब्लॉक किया जाना चाहिए, या बेहतर होगा कि पूरी तरह से पासवर्ड-प्रोटेक्टेड हों ताकि केवल आपकी टीम ही उन तक पहुँच सके। यदि आप सुनिश्चित नहीं हैं कि आपका स्टेजिंग एनवायरनमेंट एक्सपोज़्ड है या नहीं, तो सीधे ब्राउज़र में staging.yourdomain.com (और सामान्य वेरिएंट जैसे dev., test., beta.) टाइप करें। यदि यह पासवर्ड प्रॉम्प्ट के बिना लोड होता है, तो यह सार्वजनिक रूप से सुलभ है।
4. क्या आपका SSL प्रमाणपत्र वैध और वर्तमान है?
SSL सर्टिफिकेट वह है जो HTTPS को काम करने योग्य बनाता है। यह आपके सर्वर पर स्थापित एक छोटी डिजिटल फ़ाइल है जो सत्यापित करती है कि आपकी साइट वही है जो वह होने का दावा करती है और एन्क्रिप्टेड कनेक्शन को सक्षम करती है। SSL सर्टिफिकेट समाप्त हो जाते हैं, और यदि आपका समाप्त हो जाता है, तो परिणाम तत्काल होते हैं।
जब SSL प्रमाणपत्र समाप्त हो जाता है, तो ब्राउज़र आगंतुकों को एक पूर्ण-स्क्रीन चेतावनी दिखाते हैं: "आपका कनेक्शन निजी नहीं है।" अधिकांश लोग तुरंत चले जाते हैं। एक अमान्य SSL प्रमाणपत्र उपयोगकर्ताओं को ब्लॉक कर सकता है, विश्वास को नुकसान पहुंचा सकता है, ब्राउज़र चेतावनियां बना सकता है, और क्रॉलिंग/पेज अनुभव को नुकसान पहुंचा सकता है और ताला गायब हो जाता है।
5. क्या आपके डोमेन के रीडायरेक्ट पथ में अनावश्यक चक्कर हैं?
रीडायरेक्ट एक निर्देश है जो किसी आगंतुक (या सर्च इंजन बॉट) को एक URL से दूसरे URL पर भेजता है। एक रीडायरेक्ट सामान्य है, उदाहरण के लिए, http:// को https:// पर रीडायरेक्ट करना, या www को non-www पर। समस्या तब शुरू होती है जब रीडायरेक्ट एक दूसरे के ऊपर स्टैक हो जाते हैं।
रीडायरेक्ट चेन्स जब एक रीडायरेक्ट दूसरे रीडायरेक्ट की ओर ले जाता है और अंत में गंतव्य तक पहुंचता है, तब ऐसा होता है। उदाहरण के लिए: एक विज़िटर पेज A पर जाता है, जो पेज B पर रीडायरेक्ट करता है, जो पेज C पर रीडायरेक्ट करता है, जो वास्तविक पेज है। हर अतिरिक्त हॉप लोडिंग समय बढ़ाता है और Google के क्रॉलर के अंतिम गंतव्य तक पहुंचने से पहले हार मानने की संभावना बढ़ाता है। इस तरह की चेन अक्सर साइट माइग्रेशन, डोमेन बदलाव, या HTTPS अपग्रेड के बाद चुपचाप बन जाती है जिसे पूरी तरह से साफ नहीं किया गया था।
रीडायरेक्ट लूप्स अधिक गंभीर हैं। यह तब होता है जब एक रीडायरेक्ट एक ऐसे पेज पर वापस इंगित करता है जो स्वयं पर रीडायरेक्ट करता है: पेज A पेज B पर रीडायरेक्ट करता है, जो वापस पेज A पर रीडायरेक्ट करता है। न तो उपयोगकर्ता और न ही क्रॉलर कभी कहीं पहुंच सकते हैं। ब्राउज़र एक त्रुटि प्रदर्शित करेगा और Google किसी भी पेज को इंडेक्स नहीं कर पाएगा। यह एक Tier 1 फिक्स है।
उपयोग redirect-checker.orgअपना डोमेन दर्ज करें और यह रीडायरेक्ट पथ में हर हॉप को मैप करेगा। आप एक साफ, एकल-चरणीय रीडायरेक्ट की तलाश में हैं। दो या अधिक हॉप वाली किसी भी चीज़ को संक्षिप्त किया जाना चाहिए ताकि पहला पता सीधे अंतिम गंतव्य पर रीडायरेक्ट हो।
क्रॉलबिलिटी ऑडिट
यदि Googlebot किसी पेज तक नहीं पहुँच सकता, तो वह पेज रैंक नहीं करता। Google आपकी सामग्री को खोज परिणामों में शामिल करने पर विचार करने से पहले, उसे इसे ढूँढ़ने और पढ़ने में सक्षम होना चाहिए। क्रॉलबिलिटी उन बाधाओं को दूर करने के बारे में है जो इसमें बाधा डालती हैं, जिनमें से अधिकांश तब तक अदृश्य रहती हैं जब तक आप उन्हें खोज नहीं लेते।
1. आपकी robots.txt फ़ाइल — गेटकीपर
हर वेबसाइट के पास yourdomain.com/robots.txt पर एक फ़ाइल होती है (या होनी चाहिए)। यह एक सादा टेक्स्ट फ़ाइल है जो सर्च इंजन बॉट्स को बताती है कि उन्हें किन पेजों को क्रॉल करने की अनुमति है और किन्हें छोड़ना है। अपना देखने के लिए उस URL को सीधे अपने ब्राउज़र में टाइप करें।
यहां सबसे हानिकारक गलतियां विदेशी नहीं हैं, वे आकस्मिक हैं। तीन सबसे आम:
- पूरी साइट को ब्लॉक करना — एक एकल पंक्ति (Disallow: /) सभी क्रॉलर्स को पूरी तरह से बाहर रहने का निर्देश देती है। ऐसा तब हो सकता है जब कोई डेवलपर इसे बिल्ड के दौरान सेट करता है और लॉन्च से पहले इसे हटाना भूल जाता है।
- CSS या Java Script फ़ाइलों को ब्लॉक करना — Google को आपकी साइट की स्टाइलिंग और स्क्रिप्ट लोड करने की आवश्यकता है ताकि यह समझ सके कि आपके पृष्ठ कैसे दिखते और व्यवहार करते हैं। इन्हें ब्लॉक करें और Google आपके पृष्ठों को गलत तरीके से या बिल्कुल भी रेंडर नहीं कर सकता है।
- पुराने नियमों को रखना — स्टेजिंग-युग के निर्देश जो विकास के दौरान समझ में आते थे, अक्सर गलती से प्रोडक्शन में ले जाए जाते हैं, चुपचाप उन पृष्ठों तक पहुंच को प्रतिबंधित करते हैं जिन्हें इंडेक्स किया जाना चाहिए।
यदि आप इनमें से कोई भी देखते हैं, तो उन्हें Tier 1 के रूप में चिह्नित करें और आगे बढ़ने से पहले उन्हें ठीक करवाएं।
robot.txt के बारे में अधिक जानने के लिए, Google Search Central का यह वीडियो देखें:
2. आपका XML साइटमैप — रोडमैप
साइटमैप एक फ़ाइल है जो आपकी साइट के उन सभी पेजों को सूचीबद्ध करती है जिन्हें आप Google को इंडेक्स करने देना चाहते हैं। इसे Google को अपनी साइट का एक संरचित नक्शा सौंपने के रूप में सोचें, बजाय इसके कि वह लिंक का अनुसरण करके सब कुछ खोजे।
अपनी जांच करने के लिए, Google Search Console → Sitemaps पर जाएं। GSC आपको दिखाएगा कि कितने URL सबमिट किए गए और कितने वास्तव में इंडेक्स हुए। इन दोनों संख्याओं के बीच एक महत्वपूर्ण अंतर एक संकेत है जिसकी जांच करना उचित है।
जब आप वहाँ हों, तीन विशिष्ट समस्याओं की तलाश करें:
- 4xx त्रुटियाँ लौटाने वाले पेज — ये आपके साइटमैप में सूचीबद्ध टूटे हुए URL हैं, जो Google को मृत सिरों की ओर इशारा कर रहे हैं।
- साइटमैप में शामिल नोइंडेक्स यूआरएल — एक पृष्ठ एक ही समय में "कृपया इसे इंडेक्स करें" (साइटमैप) और "इसे इंडेक्स न करें" (नोइंडेक्स टैग) नहीं हो सकता; एक निर्देश जीतेगा, और विरोध क्रॉल बजट बर्बाद करता है।
- महत्वपूर्ण पेज पूरी तरह से गायब — यदि कोई महत्वपूर्ण पेज आपके साइटमैप में नहीं है, तो Google उसे फिर भी ढूंढ सकता है, लेकिन आप खोज को संयोग पर छोड़ रहे हैं।
3. क्रॉल बजट — केवल बड़े पैमाने पर प्रासंगिक
क्रॉल बजट उन पेजों की संख्या को संदर्भित करता है जो Google एक निश्चित अवधि में आपकी साइट पर क्रॉल करेगा। अधिकांश छोटी साइटों (500 पेजों से कम) के लिए, यह प्राथमिकता की चिंता नहीं है, Google वह सब क्रॉल करेगा जो वह एक्सेस कर सकता है।
यह तब प्रासंगिक हो जाता है जब आपकी साइट स्वचालित रूप से बड़ी संख्या में कम-मूल्य या लगभग-डुप्लिकेट URL उत्पन्न करती है। सामान्य कारण: उत्पाद पेजों पर फ़िल्टर और सॉर्टिंग संयोजन, URL में जोड़े गए सत्र ID, या सैकड़ों लगभग-समान पेजों में चलने वाला पेजिनेशन।
यदि आपका Screaming Frog क्रॉल आपकी वास्तविक सामग्री गणना से काफी अधिक पृष्ठ संख्या लौटाता है, तो यह मानने से पहले URL पैटर्न की जांच करें कि वे सभी जानबूझकर हैं। हो सकता है कि आपके पास एक क्रॉल ट्रैप हो जो हजारों URL उत्पन्न कर रहा हो जो रैंकिंग में कुछ भी योगदान दिए बिना क्रॉल बजट खा जाते हैं।
इंडेक्सेशन ऑडिट
क्रॉलबिलिटी और इंडेक्सेशन अलग-अलग समस्याएँ हैं। एक पेज क्रॉल करने योग्य हो सकता है लेकिन इंडेक्स से बाहर रखा जा सकता है (अक्सर गलती से)।
साइट: ऑपरेटर जांच
Google में site:yourdomain.com खोजें। परिणामों की संख्या आपको एक मोटा इंडेक्स काउंट देती है। इस संख्या और आपके वास्तविक पृष्ठों की संख्या के बीच बड़ा अंतर इंडेक्सेशन समस्या का संकेत देता है।
नोइंडेक्स ऑडिट
आकस्मिक noindex टैग सबसे आम स्व-निर्मित रैंकिंग अवरोधक हैं। Screaming Frog चलाएँ और noindex निर्देश देने वाले पेजों के लिए फ़िल्टर करें। उन पेजों से क्रॉस-रेफरेंस करें जिनसे आप रैंक करने की उम्मीद करते हैं। आपके होमपेज या मुख्य लैंडिंग पेजों पर noindex होना टियर 1 आपातकाल है।
कैनोनिकल टैग तर्क
कैननिकल टैग एक पेज के हेडर में कोड का एक छोटा सा टुकड़ा है जो Google को बताता है: "यह इस पेज का आधिकारिक संस्करण है।" यह इसलिए मौजूद है क्योंकि एक ही सामग्री अक्सर कई अलग-अलग URL पर पहुँची जा सकती है, जिसमें ट्रेलिंग स्लैश के साथ या बिना, ट्रैकिंग पैरामीटर जोड़े गए, या HTTP और HTTPS दोनों संस्करणों के माध्यम से। कैननिकल टैग के बिना, Google को अनुमान लगाना होता है कि कौन सा URL "असली" है। कभी-कभी यह गलत अनुमान लगाता है।
पेज के HTML में यह टैग इस तरह दिखता है:
<link rel="canonical" href="https://www.yourdomain.com/your-page/" />
दो सही उपयोग हैं:
- स्व-संदर्भित कैनोनिकल — पृष्ठ स्वयं की ओर इशारा करता है, यह पुष्टि करता है कि यह प्राथमिक संस्करण है। यह अधिकांश पृष्ठों के लिए मानक सेटअप है और बस Google को बताता है "यह URL सही है, इसे इंडेक्स करें।"
- विहित को समेकित करना — एक डुप्लिकेट या लगभग-डुप्लिकेट पेज पसंदीदा संस्करण की ओर इशारा करता है। उदाहरण के लिए, यदि yourdomain.com/page?ref=email और yourdomain.com/page समान सामग्री दिखाते हैं, तो पैरामीटर URL में क्लीन संस्करण की ओर इशारा करने वाला एक कैननिकल होना चाहिए।
जहां यह खराब होता है वह है जब कैननिकल टैग गलत जगह पर इंगित करते हैं। तीन सबसे हानिकारक गलतियाँ:
- 404 पेज पर इंगित करने वाला कैननिकल — आप Google को बता रहे हैं कि इस पेज का पसंदीदा संस्करण वह है जो मौजूद नहीं है
- रीडायरेक्ट पर इंगित करने वाला कैननिकल — Google रीडायरेक्ट का अनुसरण करता है, गंतव्य देखता है, और यह तय करना होता है कि आपका वास्तविक इरादा किस URL का था
- Canonical गलत पेज पर पूरी तरह से इशारा कर रहा है — यह माइग्रेशन या CMS टेम्पलेट एरर के बाद हो सकता है, और यह Google को उसी पेज को दबाने का निर्देश देता है जिसे आप रैंक कराना चाहते हैं
अपनी जाँच करने के लिए: Screaming Frog चलाएँ और Canonicals रिपोर्ट देखें। यह आपको प्रत्येक पेज का कैननिकल URL दिखाएगा और बेमेल, गुम टैग, और गैर-200 पेजों पर इंगित करने वाले कैननिकल को फ़्लैग करेगा। कोई भी पेज जहाँ कैननिकल गंतव्य 4xx या 3xx लौटाता है, वह टियर 1 है।
पैरामीटर और ट्रेलिंग स्लैश डुप्लिकेट
/page, /page/, और /page?ref=email को Googlebot अलग-अलग URL के रूप में मान सकता है। पुष्टि करें कि आपका सर्वर या CMS इन्हें लगातार संभालता है, या इन्हें समेकित करने के लिए कैननिकल टैग का उपयोग करें।
पेज पर तकनीकी संकेत
ये संरचनात्मक तत्व हैं (कॉपीराइटिंग से अलग) जो प्रभावित करते हैं कि Google आपके पेजों को कैसे पार्स और प्रस्तुत करता है।
शीर्षक टैग और मेटा विवरण
शीर्षक टैग 60 वर्णों से कम रहने चाहिए ताकि SERPs में कटौती से बचा जा सके। मेटा विवरण 155 वर्णों से कम। Screaming Frog में, Page Titles रिपोर्ट को "too long" या "missing." के रूप में चिह्नित प्रविष्टियों के लिए फ़िल्टर करें। ये रैंकिंग में गिरावट का कारण नहीं बनेंगे, लेकिन काटे गए शीर्षक क्लिक-थ्रू दरों को कम करते हैं।\
शीर्षक पदानुक्रम
प्रत्येक पेज पर बिल्कुल एक H1 होना चाहिए। एक से अधिक H1 सीधे रैंकिंग को नुकसान नहीं पहुँचाते, लेकिन वे अस्पष्ट पेज संरचना का संकेत देते हैं। अधिक हानिकारक: बिना H1 वाले पेज, या H1 टेक्स्ट जो पेज के मुख्य विषय से मेल नहीं खाता।
टूटे हुए आंतरिक लिंक
हर आंतरिक 404 क्रॉल बजट बर्बाद करता है और लिंक इक्विटी के लिए एक मृत अंत बनाता है। Screaming Frog इसे रिस्पांस कोड → 4xx के तहत दिखाता है। लिंक डेस्टिनेशन अपडेट करके या टूटे हुए URL को रीडायरेक्ट करके इसे ठीक करें।
इमेज ऑल्ट टेक्स्ट
Alt टेक्स्ट एक क्रॉल सिग्नल है, न कि केवल एक एक्सेसिबिलिटी फीचर। Alt टेक्स्ट के बिना इमेज Googlebot के टेक्स्ट-आधारित पार्सिंग के लिए अदृश्य होती हैं। Screaming Frog में, Images रिपोर्ट में उन इमेज के लिए गुम alt एट्रिब्यूट देखें जो सामग्री मूल्य रखती हैं।
कोर वेब वाइटल्स (2025 मानक)
Core Web Vitals तीन मीट्रिक हैं जिनका उपयोग Google यह मापने के लिए करता है कि कोई पेज वास्तव में उपयोग करने में कैसा लगता है। केवल यह नहीं कि वह लोड होता है, बल्कि यह भी कि वह तेज़ी से लोड होता है, जल्दी प्रतिक्रिया करता है, और ऐसा करते समय दृश्य रूप से स्थिर रहता है। वे Google के पेज गुणवत्ता मूल्यांकन का हिस्सा हैं, और वे सीधे Page Speed Insights और Google Search Console में दिखाई देते हैं।
वर्तमान में तीन मीट्रिक हैं। यदि आपका ऑडिट कहीं First Input Delay (FID) का संदर्भ देता है, तो उसे हटा दें — FID को आधिकारिक रूप से 12 मार्च 2024 को INP से बदल दिया गया.
INP: क्या आपका पेज लोगों के क्लिक करने पर प्रतिक्रियाशील है?
INP का मतलब Interaction to Next Paint है। यह मापता है कि उपयोगकर्ता द्वारा कुछ करने (बटन क्लिक करना, मेनू खोलना, फ़ील्ड में टाइप करना) के बाद आपका पेज कितनी जल्दी दृश्य रूप से प्रतिक्रिया करता है। यदि कार्रवाई और पेज की प्रतिक्रिया के बीच ध्यान देने योग्य देरी होती है, तो यह खराब INP स्कोर है।
थ्रेशोल्ड:
- अच्छा = 200ms से कम
- सुधार की आवश्यकता = 200–500ms
- खराब = 500ms से अधिक
स्रोत: स्क्रीनशॉट: Interaction to Next Paint (INP)
छोटी साइटों पर सबसे आम कारण: बहुत अधिक जावास्क्रिप्ट बैकग्राउंड में चल रही है, तीसरे पक्ष की स्क्रिप्ट (चैट विजेट, एनालिटिक्स, विज्ञापन टैग) ब्राउज़र का ध्यान आकर्षित करने के लिए प्रतिस्पर्धा कर रही हैं, और धीमी सर्वर प्रतिक्रियाएँ।
LCP: क्या आपकी मुख्य सामग्री जल्दी लोड होती है?
LCP का मतलब Largest Contentful Paint है। यह मापता है कि पेज पर सबसे बड़ा दृश्य तत्व पूरी तरह से लोड होने में कितना समय लगता है: आमतौर पर एक हीरो इमेज, एक बड़ा हेडिंग, या एक फीचर्ड फोटो। यह Google का यह पूछने का तरीका है: "पेज कितनी जल्दी उपयोग योग्य लगता है?"
थ्रेशोल्ड: अच्छा = 2.5 सेकंड से कम
स्रोत: स्क्रीनशॉट: Largest Contentful Paint (LCP)
धीमी LCP के सबसे सामान्य कारण: हीरो इमेज जो संपीड़ित नहीं की गई हैं, CSS या Java Script जो पृष्ठ को रेंडर होने से रोकता है, और धीमी होस्टिंग या सर्वर प्रतिक्रिया समय।
CLS: क्या पेज लोड होने के दौरान स्थिर रहता है?
CLS का मतलब Cumulative Layout Shift है। यह मापता है कि पेज लोड होने पर कितना हिलता-डुलता है। आपने पहले खराब CLS स्कोर का अनुभव किया होगा, जब आप कुछ क्लिक करने जाते हैं और आखिरी समय पर उसके ऊपर एक इमेज लोड हो जाती है, जो सब कुछ नीचे धकेल देती है और आपको गलत चीज़ पर क्लिक करवा देती है।
थ्रेशोल्ड: अच्छा = 0.1 से कम
स्रोत: स्क्रीनशॉट: Cumulative Layout Shift (CLS)
सबसे सामान्य कारण: बिना परिभाषित आयामों वाली छवियां (ब्राउज़र को पता नहीं होता कि कितनी जगह आरक्षित करनी है), विज्ञापन या एम्बेड जो देर से लोड होते हैं और सामग्री को नीचे धकेलते हैं, और वेब फ़ॉन्ट जो पेज रेंडर होने के बाद स्वैप होते हैं।
तीनों की जांच कैसे करें
पर जाएं Page Speed Insights और अपने सबसे महत्वपूर्ण पेज एक-एक करके दर्ज करें:
- आपका होमपेज
- आपका मुख्य उत्पाद या सेवा पेज
- आपका सबसे अधिक ट्रैफिक वाला लैंडिंग पेज
जब परिणाम लोड होते हैं, तो लैब डेटा (अनुकरणित स्कोर) से आगे स्क्रॉल करें फ़ील्ड डेटा शीर्ष पर अनुभाग। फ़ील्ड डेटा वास्तविक उपकरणों पर वास्तविक आगंतुकों को दर्शाता है, और Google आपके पेजों का मूल्यांकन करते समय वास्तव में इसका उपयोग करता है। यदि आपकी साइट पर फ़ील्ड डेटा उत्पन्न करने के लिए अभी तक पर्याप्त ट्रैफ़िक नहीं है, तो लैब स्कोर आपका सबसे अच्छा उपलब्ध प्रॉक्सी है। उन्हें निर्णायक नहीं, बल्कि दिशात्मक मानें।
GSC में एक समर्पित Core Web Vitals रिपोर्ट (Experience के तहत) भी है जो आपके URL को स्थिति के अनुसार समूहित करती है:
- अच्छा
- सुधार की आवश्यकता है
- खराब
और दिखाता है कि कौन सा विशिष्ट मीट्रिक किन पेजों पर विफल हो रहा है।
जब आप Google Page Speed के साथ ऑडिट करते हैं तो यह इस तरह दिखता है:
आप अपने प्रदर्शन स्कोर के बारे में और अधिक विवरण भी देख सकते हैं।
साइट संरचना और आंतरिक लिंकिंग
लिंक इक्विटी आंतरिक लिंक के ज़रिए बहती है। अगर यह गलत जगहों पर लीक या जमा हो रही है, तो जिन पेजों को रैंक करना चाहिए, वे नहीं करेंगे, भले ही बाकी सब कुछ सही हो।
क्रॉल गहराई ऑडिट
होमपेज से तीन क्लिक से अधिक दूर कोई भी महत्वपूर्ण पेज प्रभावी रूप से दब जाता है। Screaming Frog में, Crawl Depth कॉलम देखें। गहराई 4+ वाले पेजों को या तो नेविगेशन में प्रमोट किया जाना चाहिए या उच्च-अधिकार वाले पेजों से लिंक किया जाना चाहिए।
अनाथ पेज
एक अनाथ पेज वह है जिसमें कोई आंतरिक लिंक नहीं जाता। Googlebot इसे साइटमैप के माध्यम से ढूंढ सकता है, लेकिन आंतरिक लिंक के बिना, इसे कोई इक्विटी नहीं मिलती और यह कम महत्व का संकेत देता है। अपने साइटमैप URL को Screaming Frog की इनलिंक रिपोर्ट से क्रॉस-रेफरेंस करें।
अपनी साइट के कंटेंट-भारी अनुभागों में ब्रेडक्रंब नेविगेशन जोड़ना अनाथ पृष्ठों की समस्या को हल करने और उपयोगकर्ताओं और बॉट्स दोनों के लिए क्रॉल पथ स्पष्टता में सुधार करने का एक कुशल तरीका है।
रीडायरेक्ट चेन और लूप
जैसा कि पहले बताया गया है, किसी भी URL के लिए पूर्ण रीडायरेक्ट पथ देखने के लिए रीडायरेक्ट चेन और रीडायरेक्ट लूप की जाँच करें।
मोबाइल और स्ट्रक्चर्ड डेटा
मोबाइल उपयोगिता
संरचित डेटा
स्कीमा मार्कअप रिच रिजल्ट की गारंटी नहीं देता, लेकिन यह आपकी सामग्री को मशीन-पठनीय बनाता है। अधिकांश छोटी साइटों के लिए, सबसे अधिक मूल्य वाले स्कीमा प्रकार हैं: Article, FAQ, Breadcrumb, और Local Business (यदि स्थान-प्रासंगिक हो)। अपने कार्यान्वयन को मान्य करने के लिए उपयोग करें Google का रिच रिजल्ट्स टेस्ट.
स्ट्रक्चर्ड डेटा एरर को Tier 2 के रूप में फ़्लैग करें। स्ट्रक्चर्ड डेटा वॉर्निंग को Tier 3 के रूप में फ़्लैग करें। वे रिच रिज़ल्ट को दिखने से नहीं रोकते।
फिक्स की पुष्टि करें
अधिकांश गाइड "fix this." पर समाप्त होते हैं। यहीं वे आपको निराश करते हैं।
हर सुधार के बाद आगे बढ़ने से पहले एक पुष्टिकरण चरण आवश्यक है।
| समाधान प्रकार | सत्यापन विधि | समयरेखा |
| इंडेक्सेशन / नोइंडेक्स हटाया गया | जीएससी यूआरएल निरीक्षण → इंडेक्सिंग का अनुरोध करें | दिनों से हफ्तों तक |
| कोर वेब वाइटल्स में सुधार | Page Speed Insights पुनः चलाएं + GSC CWV रिपोर्ट | 28-दिन का फ़ील्ड डेटा अंतराल |
| क्रॉल त्रुटियां हल हो गईं | Screaming Frog पुनः क्रॉल; बेसलाइन से तुलना करें | तत्काल |
| संरचित डेटा जोड़ा गया | रिच रिजल्ट्स टेस्ट फिर से चलाएं | तत्काल सत्यापन |
Google कुछ सिग्नल जल्दी (URL-स्तरीय इंडेक्सेशन) और कुछ धीरे (CWV फ़ील्ड डेटा रियल यूज़र इंटरैक्शन के 28-दिन के रोलिंग विंडो को दर्शाता है) का पुनर्मूल्यांकन करता है।
रोजाना जांचने के बजाय कैलेंडर रिमाइंडर सेट करें।
आपको एसईओ ऑडिट कब करना चाहिए?
यह बहुत अच्छा है यदि आप इसे जितनी बार संभव हो कर सकते हैं, लेकिन कम से कम तिमाही आधार पर। यदि आप अपनी वेबसाइट रैंकिंग में कुछ गिरावट देखते हैं, तो यह एक नए ऑडिट के लिए एक अच्छा संकेत है, भले ही यह निर्धारित न हो।
पुनः ऑडिट कब करें
तकनीकी SEO ऑडिट एक बार का काम नहीं है। पूर्ण ऑडिट चलाएं:
- जब एक नई वेबसाइट लॉन्च कर रहे हैं — किसी भी ट्रैफ़िक के जमा होने से पहले एक साफ बेसलाइन स्थापित करें
- हर 6 महीने मानक रखरखाव के रूप में
- किसी भी बड़े साइट माइग्रेशन के बाद (नया CMS, नया डोमेन, नया URL स्ट्रक्चर)
- महत्वपूर्ण रैंकिंग गिरावट के बाद जो सामग्री परिवर्तनों द्वारा समझाया नहीं गया है
- नई साइट सेक्शन या टेम्पलेट जोड़ने के बाद जो नए क्रॉल पैटर्न पेश कर सकते हैं
ऑडिट के बीच, GSC की Coverage और Core Web Vitals रिपोर्ट को निष्क्रिय निगरानी परत के रूप में खुला रखें।
ऑडिट प्राथमिकता चेकलिस्ट
प्रत्येक अनुभाग पूरा करने के बाद इसका उपयोग करें। प्रत्येक आइटम ऊपर दिए गए एक अनुभाग से मेल खाता है।
निष्कर्ष
एक तकनीकी SEO ऑडिट सिर्फ एक बार का काम नहीं है—यह एक निरंतर प्रक्रिया है जो आपकी वेबसाइट को सर्च रिजल्ट्स में प्रतिस्पर्धी बनाए रखने में मदद करती है। अपनी साइट के तकनीकी पहलुओं की नियमित जांच करके, आप समस्याओं को पहचान और ठीक कर सकते हैं इससे पहले कि वे आपकी रैंकिंग्स को प्रभावित करें।
याद रखें कि तकनीकी SEO पहेली का सिर्फ एक टुकड़ा है। जबकि यह सफलता की नींव बनाता है, आपको अभी भी शीर्ष रैंकिंग हासिल करने के लिए गुणवत्तापूर्ण सामग्री और एक मजबूत बैकलिंक प्रोफाइल की आवश्यकता होगी।
तकनीकी SEO क्रॉलबिलिटी, इंडेक्सेशन, प्रदर्शन और उपयोगकर्ता अनुभव का समर्थन करता है, जो मजबूत सामग्री के साथ मिलकर खोज दृश्यता में सुधार कर सकता है। जोखिमों को कम करने और उभरते अवसरों का लाभ उठाने के लिए नियमित ऑडिट (हर 6-12 महीने) आवश्यक हैं।
वक्र से आगे रहें और हमारे न्यूज़लेटर की सदस्यता लें नवीनतम रुझानों और उद्योग अंतर्दृष्टि के लिए।
अक्सर पूछे जाने वाले प्रश्न
क्रॉलबिलिटी समस्या और इंडेक्सेशन समस्या में क्या अंतर है?
क्रॉलबिलिटी से तात्पर्य है कि क्या Googlebot किसी पेज तक पहुँच सकता है और उसे पढ़ सकता है (यह नेटवर्क या रोबोट स्तर पर ब्लॉक है)। इंडेक्सेशन से तात्पर्य है कि क्या Google ने उस पेज को अपने सर्च इंडेक्स में शामिल करना चुना है। एक पेज क्रॉल करने योग्य हो सकता है लेकिन फिर भी noindex टैग, डुप्लिकेट कंटेंट सिग्नल, या कहीं और इंगित करने वाले कैननिकल के कारण इंडेक्स से बाहर रखा जा सकता है। उन्हें अलग-अलग ऑडिट करें: पहले क्रॉलबिलिटी, फिर इंडेक्सेशन।
क्या रीडायरेक्ट चेन वास्तव में रैंकिंग को नुकसान पहुंचाती हैं?
Google ने कहा है कि 301 रीडायरेक्ट से Page Rank नहीं खोता है। रीडायरेक्ट चेन के साथ व्यावहारिक जोखिम विलंबता (प्रत्येक हॉप लोड समय बढ़ाता है) और Googlebot के चेन को पूरी तरह से हल करने से पहले छोड़ने की बढ़ी हुई संभावना है, विशेष रूप से धीमे सर्वर पर। चेन को सिंगल हॉप में कम करें क्रॉल दक्षता उपाय के रूप में, इसलिए नहीं कि प्रत्येक हॉप "खोता" है।
मेरे ऑडिट टूल ने 200+ समस्याएं चिह्नित कीं। मैं वास्तव में कहां से शुरू करूं?
Tier 1 चेकलिस्ट से शुरू करें: HTTPS अनिवार्यता, SSL वैधता, आकस्मिक noindex टैग और रीडायरेक्ट लूप। ये वे समस्याएँ हैं जो अभी दृश्यता को सक्रिय रूप से दबाने की सबसे अधिक संभावना रखती हैं। जब तक ये हल नहीं हो जातीं, Tier 1 या Tier 2 में न आने वाली किसी भी चीज़ को अनदेखा करें। एक साफ, क्रॉल करने योग्य, इंडेक्स करने योग्य साइट जिसमें स्वीकार्य Core Web Vitals हों, वह अनसुलझी ब्लॉकिंग समस्याओं वाली तकनीकी रूप से "perfect" साइट से बेहतर प्रदर्शन करेगी।
मुझे कितनी बार तकनीकी SEO ऑडिट करना चाहिए?
मानक रखरखाव के रूप में हर छह महीने में। इसके अतिरिक्त, किसी भी साइट माइग्रेशन, महत्वपूर्ण प्लेटफ़ॉर्म परिवर्तन, या अस्पष्टीकृत रैंकिंग ड्रॉप के बाद एक केंद्रित ऑडिट चलाएं। ऑडिट के बीच, GSC का कवरेज रिपोर्ट और Core Web Vitals डैशबोर्ड आपको नई समस्याओं को बढ़ने से पहले पकड़ने के लिए पर्याप्त निष्क्रिय संकेत देते हैं।