سایت مپ یا نقشه سایت چیست؟ چگونه سایت مپ بسازیم؟
نقشهها برای ما مزایای زیادی دارند. به عنوان مثال، برخی از افراد خوش شانس با نقشه گنج، ثروتمند میشوند. اما شاید کمتر به نقشه سایت یا سایت مپ علاقه نشان دهید! درک آنها خیلی ساده نیست و سرگرم کننده هم نیستند. اما اگر آنها را به درستی بشناسید، میتوانند سایت شما را به رتبه بالاتر و ترافیک بیشتری برسانند.
تعریف نقشه سایت (sitemap)
نقشه سایت فایلی است که آدرس تمام صفحات ضروری وب سایت شما را فهرست میکند. هدف اصلی آن هم کمک به موتورهای جستجو برای درک سایت شما و سهولت در مکان یابی صفحات خاص است. همچنین نقشههای سایتی برای کمک به کاربران جهت حرکت راحت در سایت شما وجود دارند.
در زیر نمونه ای از نقشه سایت آورده شده است.
هشدار: شاید ظاهرش ترسناک به نظر برسد 👹 اما برای فهمیدنش تا پایان این پست با ما همراه شوید.
برای درک اهمیت نقشه سایت در سئو، ابتدا باید عملکرد موتورهای جستجو را درک کنید. برای مثال اصطلاحات «crawl» و «index» به چه معنا هستند؟
- گوگل، رباتها یا عنکبوتهایی دارد که دائماً وب و صفحات وب موجود را اسکن میکنند. این کار را خزش یا کراول مینامند.
- سپس رباتها، هر صفحهای را که پیدا میکنند، در فهرست غولپیکر گوگل دستهبندی و ذخیره میکنند. به این کار هم فهرستسازی یا ایندکس کردن میگویند.
- به این ترتیب، وقتی در گوگل جستجو میکنید، گوگل در واقع کل وب را در لحظه برای شما اسکن نمیکند. در عوض، در حال بررسی منظم ایندکس خودش است، به همین دلیل در کسری از ثانیه به نتیجه میرسد.
معنی همه اینها این است که اگر خزش در صفحه شما سخت است، پس شاید وارد فهرست گوگل نشود و اگر در فهرست گوگل نباشد، نمیتواند در جستجوی گوگل نمایش داده شود. اینجاست که سایت مپها وارد عمل میشوند.
مزایای سایت مپ یا نقشه سایت
هرچه گوگل بهتر بتواند سایت شما را بشناسد و خزش در آن آسان تر باشد، میتوانید بابت کلمات کلیدی مدنظرتان، رتبه بندی بهتری دریافت کنید و ترافیک بیشتری را به سایت خودتان برسانید. در اینجا به بررسی مزایای داشتن نقشه سایت میپردازیم:
صفحات سایت را سریعتر، کراول و ایندکس کنید
گوگل نمیتواند هر روز کل اینترنت را کراول کند. در عوض، «برنامههای زمانی» خزش متفاوتی برای وبسایتها و انواع محتوا دارد. بنابراین شاید گاهی اوقات، هفتهها یا حتی ماهها طول بکشد تا گوگل، صفحات جدید را در سایت شما پیدا کند. نقشه سایت به گوگل کمک میکند تا صفحات جدید را سریعتر کشف و ایندکس کند.
مطلب پیشنهادی: چگونه سرعت کراول و ایندکس شدن سایت را افزایش دهیم؟
صفحات ارزشمند سایت، عملکرد خوبی دارند
آیا تا به حال صفحهای را در سایت خودتان به روز کردهاید؟ شاید محتوای همیشه سبز خودتان را به روز کردید ولی تغییری را در SERP نمیبینید؟ دلیلش این است که گوگل از زمان بهروزرسانی شما، صفحه را کراول نکرده است. با کراول و ایندکس کارآمدتر، کاربران هم به روزترین نسخه از محتوای متغییر را مشاهده میکنند.
به رباتهای جستجو کمک میکنید تا صفحات یتیم (orphan) را پیدا کنند
رباتهای گوگل، اغلب صفحات سایت شما را مانند بازدیدکنندگان پیدا میکنند. یعنی لینکهای درون صفحات را دنبال میکنند (به همین دلیل است که لینکگذاری داخلی بسیار مهم است). صفحات یتیم، صفحاتی هستند که لینکهای دیگری به آن اشاره نمیکنند و دسترسی به آنها برای گوگل سخت میشود. اما با قرار دادن این صفحات در سایت مپ، گوگل میتواند به راحتی آنها را مکان یابی و ایندکس کند.
به گوگل کمک میکنید تا صفحات تکراری را تشخیص دهد
چندین سناریو در مورد وجود صفحات تکراری یا تقریباً تکراری در سایتهای تجارت الکترونیک وجود دارد. برای مثال، شاید در یک سایت فروشگاهی، صفحات محصول تکراری با رنگهای مختلف آن محصول مشاهده شود. شاید گوگل در این موارد، نداند که نسخه اصلی صفحه که میخواهید رتبه بندی کنید، کدام نسخه است. با استفاده از نقشه سایت، میتوانید از تگهای کانونیکال استفاده کنید تا به بگویید که کدام نسخه، نسخه اصلی و کدام یک نسخه تکراری است.
آیا به سایت مپ نیاز دارم؟
به طور کلی، گوگل به تنهایی در یافتن صفحات وب در اینترنت، متخصص است. اما نقشه سایت، میتواند به بهبود سئوی شما کمک کند. به گفته گوگل، در شرایط زیر نیاز به نقشه سایت دارید:
- یک سایت بزرگ (بیش از 500 صفحه) دارید. داشتن هزاران صفحه یعنی شاید خزندههای گوگل صفحات جدید یا به روز شده را نادیده بگیرند.
- لینک سازی داخلی ندارید. یا صفحات یتیم زیادی دارید.
- سایت شما جدید است یا بک لینک کمی دارید. چون خزندههای وب، صفحات سایت را با دنبال کردن لینکها از یک سایت به سایت دیگر پیدا میکنند.
- محتوای رسانهای زیادی دارید. تصاویر، ویدیوها یا صفحات خبری که میخواهید در نتایج جستجو نشان داده شوند.
انواع نقشه سایت
دو نوع سایت مپ یا نقشه سایت وجود دارد که شامل نقشههای سایت HTML (زبان نشانهگذاری فرامتن، برای انسانها) و نقشههای سایت XML (زبان نشانهگذاری قابل توسعه، برای رباتها) است.
نقشههای سایت HTML
سایت مپ HTML یک صفحه وب سایت واقعی است که برای بازدیدکنندگان قابل مشاهده است و لیستی از لینکهای قابل کلیک به سمت تمام صفحات سایت شما را در بر می گیرد. این روشی قدیمی برای ایجاد سایت مپ است، اما همچنان ارزشمند است، به خصوص که برای سایتهای بزرگ کارآمد است.
گوگل نقشههای سایت HTML را میپسندد، زیرا با کمک فهرست سلسله مراتبی لینکها میتواند مهمترین چیزها را بهتر درک کند و بر این اساس فهرستبندی را انجام دهد.
در زیر نمونهای از نقشه HTML سایت homedepot.com را مشاهده میکنید.
نقشههای سایت XML
نقشه سایت XML یک فایل متنی است که لیستی از URLهای سایت را ارائه میدهد. معمولاً میتوانید نقشه هر سایتی را با مراجعه به آدرس: domainname.com/sitemap.xml پیدا کنید. (برای مثال: https://www.karlancer.com/sitemap.xml) همچنین میتوانید آن را به منظور محافظت از سایت، تغییر دهید. با این که میتوانید نقشه سایت XML را ببینید، اما قرار نیست ابزاری در اختیار بازدیدکنندگان باشد و فقط برای موتورهای جستجو مناسب است.
در زیر نقشه سایت XML ارائه شده است.
با نقشه سایت XML از تگها برای ارائه اطلاعاتی در مورد URLهای موجود در آن استفاده کنید. مثلا اطلاعاتی مانند تاریخ آخرین تغییرات را قید میکنید. همچنین میتوانید از افزونههای سایت مپ برای ارائه اطلاعات درباره ویدیو، تصویر و محتوای مقالههای خبری استفاده کنید.
فرمت پروتکل سایت مپ از تگهای XML تشکیل شده است. همه مقادیر داده در سایت مپ باید دارای entity escape شوند. خود فایل باید دارای کد UTF-8 باشد.
نقشه سایت باید:
- با تگ <urlset> شروع و با تگ </urlset> خاتمه یابد.
- طبق پروتکل استاندارد، فضای نام (namespace) را در تگ <urlset> قرار دهید.
- یک ورودی <url> برای هر URL، به عنوان تگ XML والد، اضافه کنید.
- یک ورودی فرزند <loc> برای هر تگ والد <url> وارد کنید.
سایر تگها هم اختیاری هستند. البته پشتیبانی از این تگهای اختیاری در بین موتورهای جستجو، متفاوت است. برای کسب جزئیات بیشتر به مستندات هر موتور جستجو مراجعه کنید.
همچنین، همه URLها در سایت مپ باید از یک هاست واحد مانند www.example.com یا store.example.com باشند.
تعاریف تگ XML
تگهای XML به تفصیل در ادامه توضیح داده شدهاند.
- <urlset> : الزامی است. فایل را کپسوله میکند و به استاندارد پروتکل فعلی ارجاع میدهد.
- <url> : الزامی است. تگ والد برای هر ورودی URL است. تگهای باقی مانده فرزندان این تگ هستند.
- <loc> : الزامی است. شامل URL صفحه است. باید با پروتکل (مانند http) شروع شود و در صورتی که سرور وب شما به آن نیاز دارد، با یک اسلش انتهایی پایان یابد. این مقدار باید کمتر از 2048 کاراکتر لحاظ شود.
- <lastmod> : اختیاری است. شامل تاریخ آخرین اصلاح صفحه است. این تاریخ باید در قالب W3C Datetime باشد. با کمک این فرمت، در صورت تمایل بخش زمانی را حذف کنید و از YYYY-MM-DD استفاده کنید.
توجه کنید که تاریخ باید روی تاریخ آخرین تغییرات صفحه لینک داده شده، تنظیم شود، نه روی زمانی که سایت مپ تولید شده است.
همچنین توجه کنید که این تگ جدا از هدر If-Modified-Since (304) است که سرور میتواند آن را برگرداند و شاید موتورهای جستجو از اطلاعات هر دو منبع به طور متفاوت استفاده کنند.
- <changefreq> : اختیاری است. شاید صفحه هر چند وقت یکبار، تغییر کند. این تگ، اطلاعات کلی را در اختیار موتورهای جستجو قرار میدهد و دقیقاً با تعداد دفعات خزش آنها در صفحه ارتباط ندارد. در مورد انواع آن، در ادامه توضیح خواهیم داد.
- < priority > :اختیاری است. اولویت هر URL نسبت به سایر URLهای سایت شما را میسنجد. مقدارش از 0.0 تا 1.0 متغیر است. این مقدار بر نحوه مقایسه صفحات شما با صفحات سایتهای دیگر تأثیری ندارد. فقط به موتورهای جستجو اجازه میدهد که بدانند کدام صفحات برای خزندهها مهم تر هستند. مقدار اولویت پیش فرض یک صفحه هم برابر با 0.5 است.
مطلب پیشنهادی: بودجه خزش چیست؟
ویژگیها و تگهای مهم در سایت مپ
تا اینجا میدانیم که نقشه سایت XML ابزاری قدرتمند برای سئو است. در حالی که کاربر معمولی هرگز به سایت مپ نگاه نمیکند یا حتی نمیداند که اصلا وجود دارد، ولی گوگل این طور است. سایت مپ تمام مقاصد منحصربهفردی که یک بازدیدکننده میتواند به آنها برسد، از صفحه اصلی تا پنهانترین صفحه فرعی را نشان میدهد.
ارسال سایت مپ خودتان برای گوگل از طریق سرچ کنسول، یکی از اولین مراحل سئو پس از راه اندازی سایت است. این ارسال به گوگل میگوید که سایت شما وجود دارد، فهرستی از صفحات عمومی شما را به آنها میدهد و مکانی را به آنها میدهد تا ببینند محتوای جدید پست میشود یا محتوای قدیمی بهروزرسانی میشود.
سایت مپ آنقدر مهم است که عملکرد آن در افزونههای سئو در وردپرس مانند افزونه یوست Yoast تعبیه شده است. ایجاد و ارسال نقشه سایت در شرح وظایف هر سئو کاری قرار دارد. در ادامه به دو ویژگی مهم سایت مپ که قبلا به آنها اشاره شد، بیشتر خواهیم پرداخت.
ویژگی اولویت (priority attribute) در سایت مپ
ویژگی اولویت یک ویژگی اختیاری است که میتوانید به نقشه سایت اضافه کنید. گوگل شما را به خاطر نداشتن آن جریمه نمیکند. با این ویژگی، کمی اطلاعات بیشتری در مورد URLهای موجود در سایت مپ را در اختیار موتورهای جستجو قرار میدهید.
اولویت (priority): همانطور که از نامش پیداست، به اولویت محتوای سایت شما امتیاز میدهد. این ویژگی یک مقدار عددی بین 0 و 1 است. بنابراین، تا یک دهم هم اعشار میگیرد. اولویت صفر نشان دهنده محتوایی با اولویت پایین است که مفید نیست و به روز رسانی نمیشود. اولویت یک، محتوای مهم سایت را نشان میدهد.
طبقه بندی اولویت صفحه
مقیاس بندی آن تا حدی به صورت زیر است:
- 0 تا 0.3: پستهای خبری قدیمی، راهنماهای قدیمی یا صفحات نامربوطی که نمیخواهید حذف، ادغام یا بهروزرسانی کنید.
- 0.4 تا 0.7: شامل مقالات، پستهای بلاگ، صفحات دسته بندی، پرسشهای متداول و صفحات سیستمی هستند. بخش عمدهای از محتوای سایت شما در این محدوده قرار میگیرد.
- 0.8 تا 1.0: محتوای بسیار مهم، مانند صفحه اصلی، صفحات دسته بندی اصلی، صفحات محصول و فهرستهای زیر دامنه هستند.
مشخص نیست که چگونه برخی از موتورهای جستجو با محتوای فاقد تگ اولویتی، رفتار میکنند. البته با توجه به مقیاس بندی فوق، میتوان فرضیاتی را مطرح کرد. اغلب محتواها معمولاً مقدار 0.5 میگیرند. این مقدار هر چه محتوا قدیمیتر و کم فایده تر باشد، پایین تر میآید و محتوای خاص و مهم هم، مقادیر بالاتری میگیرد.
اساساً، اگر مقدار پیش فرضی برای محتوای شما ایندکس نشود، موتورهای جستجو خودشان سطوح اولویت را مشخص میکنند. میتوانید مقادیر مدنظرتان را انتخاب کنید تا به موتورهای جستجو در مورد محتوای مهم درون سایت، اطلاع دهید.
شاید وسوسه شوید که اولویت تمامی صفحات درون سایت را روی 1.0 قرار دهید تا ارزش بیشتری از پستهای خودتان به دست آورید. متأسفانه موتورهای جستجو بسیار باهوشتر از این هستند و مقادیری که شما تعیین کردهاید را نادیده میگیرند.
در واقع، به گفته گوگل، آنها هر دو مقدار Priority و Changefreq را نادیده میگیرند. این به معنای بی اهمیتی آنها نیست. گوگل در هنگام بررسی سایت مپ، از نظر محتوای جدید یا به روز رسانیهای جدید، آنها را در نظر نمیگیرد.
توصیه کلی بر این است که صفحات اصلی خود را روی سطوح اولویت بالاتر تنظیم کنید. صفحات نه چندان مهم هم نیاز به اولویت بالایی ندارند و اگر موتورهای جستجو را مشغول آنها کنید، شاید باعث سردرگمی آنها شوید. صفحه اصلی شما معمولاً بالاترین اولویت را در بین تمام صفحات شما دارد.
ویژگی Chagefreq در سایت مپ
موتورهای جستجو از ویژگی Changefreq برای نشان دادن نحوه تغییر محتوای یک صفحه استفاده میکنند.
برای مثال شاید صفحه اصلی سایت، هر روز تغییر کند. حتی صفحه اصلی سایتی مانند فوربس، چندین بار در ساعت تغییر میکند. مقدار بالای «Changefreq» (که مخفف فرکانس تغییر است) نشان دهنده تغییرات بیشتر در صفحه است. برعکس، مقدار کمتر Changefreq نشان دهنده عدم تغییر صفحه است.
حالات Changefreq
ویژگی Changefreq میتواند یکی از هفت حالت زیر را بگیرد:
1.همیشگی (Always): این بدان معناست که صفحه به طور مداوم با به روز رسانیهای مهم و به روز در حال تغییر است. شاید صفحه دادههای بازار سهام و صفحه شاخص یک سایت خبری بزرگ، از این تگ استفاده کند.
2.ساعتی (Hourly): یعنی صفحه به صورت ساعتی به روز میشود. شاید سایتهای خبری بزرگ، سایتهای هواشناسی و انجمنهای وب فعال، از این تگ استفاده کنند.
3.روزانه (Daily): یعنی صفحه به طور متوسط یک بار در روز با محتوای جدید به روز میشود.شاید انجمنهای وب کوچک، صفحات آگهی طبقه بندی شده، روزنامههای روزانه و بلاگهای روزانه، از این تگ برای صفحه اصلی خودشان استفاده کنند.
4.هفتگی (Weekly): صفحه تقریباً هفته ای یک بار با محتوای جدید به روز میشود. صفحات اطلاعات محصول، بلاگهای کوچک و ایندکسهای وب سایت از این تگ استفاده میکنند.
5.ماهیانه (Monthly): صفحه حدود یک بار در ماه به روز میشود. کم و بیش صفحات دسته بندی، راهنماهای همیشه سبز با اطلاعات به روز شده و صفحه سوالات متداول، اغلب از این تگ استفاده میکنند.
6.سالانه (Yearly): صفحه به ندرت به روز میشود اما شاید یک یا دو بار در سال به روز رسانی شود. بسیاری از صفحات ثابت مانند صفحات ثبت نام، صفحات درباره ما و سیاستهای حفظ حریم خصوصی، در این دسته قرار میگیرند.
7.هرگز (Never): یعنی صفحه هرگز به روز رسانی نمیشود. مطالب قدیمی بلاگ، اخبار قدیمی و صفحات کاملا ثابت در این دسته قرار میگیرند.
این ویژگی به موتورهای جستجو اجازه میدهد تا بدانند تقریباً چند بار باید هر صفحه را بررسی کنند تا وجود تغییرات را مشاهده کنند.
جریمه استفاده از مقادیر نادرست Changefreq
تا آنجا که میدانیم، بابت استفاده از تگ Changefreq بالاتر از مقادیر لازم برای صفحات سایت، هیچ جریمه ای وجود ندارد. برای مثال اگر به موتورهای جستجو بگویید که صفحه درباره ما در سایت هر روز تغییر میکند، اما فقط یک بار در سال آن را تغییر دهید، وقتی رباتهای گوگل متوجه شوند که محتوا در دهها بار بررسی قبلی، تغییری نکرده است، به سادگی بررسی را متوقف میکنند. همچنین شاید آن تگ در سایت مپ شما را نادیده بگیرند.
برای نشریات بزرگتر، مانند فوربس (که در بالا ذکر شد)، داشتن تگ ساعتی، منطقی تر است. آنها میخواهند اخبار فوری، به سرعت منتشر شود و هر ساعت محتوای جدیدی دارند.
تگ Changefreq خودتان را روی حالتی واقع بینانه تنظیم کنید. تنظیم پر تکرار آن، موتورهای جستجو را گیج میکند و شاید منجر به بررسی بیش از حد سایت، حتی در صورت عدم وجود هر گونه تغییری شود. اگر یک پست بلاگ را در هفته منتشر میکنید، پس تنظیم صفحه اصلی بلاگ، روی هفتگی یا روزانه منطقی است. اما اگر آن را روی ساعتی تنظیم کنید، رباتها قبل از اینکه تفاوتی در محتوای صفحه شما ببینند، باید 168 بار وبلاگ شما را بررسی کنند.
مطلب پیشنهادی: دلایل ایندکس نشدن سایت
ضرورت استفاده از ویژگیها و تگهای نقشه سایت
در حقیقت، مجبور به استفاده از این تگها نیستید. شاید استفاده از آنها اصلاً ایده خوبی نباشد.
برخی از سایتها، استفاده از هر دوی این تگها را توصیه میکنند تا موتورهای جستجو را وادار به بررسی سایت شما کنند. در نتیجه محتوای جدید و تغییرات جدید را در اسرع وقت پیدا کرده و ایندکس میکنند.
اگرچه این هدف، اهمیت دارد، اما به دو دلیل دیگر موثر نیست:
اول: گوگل دیگر به این اطلاعات نیاز ندارد. یکی از ویژگیهای دیگر نقشه سایت، مُهر زمانی (timestamp) آخرین باری است که محتوا به روز شده است. گوگل فهرستی از صفحات شما، محتوای آنها و آخرین باری که محتوا ایندکس شده را در فهرست خود نگه میدارد. اگر آخرین باری که آنها صفحه را ایندکس کردند قبل از آخرین باری بود که سایت مپ شما میگوید به روز شده، پس دوباره آن را بررسی میکنند.
دوم: گوگل به کمک شما نیازی ندارد. آنها معتقدند که بسیاری از سایتهای کوچکتر اصلاً نیازی به سایت مپ ندارند. با توجه به گفته واحد توسعه دهندگان گوگل، تحت شرایط زیر نیازی به نقشه سایت ندارید:
سایت شما کوچک است
منظور از کوچک بودن، داشتن حدود 500 صفحه یا کمتر در سایت است (فقط صفحاتی که فکر میکنید باید در نتایج جستجو قرار بگیرند در اینجا حساب میشوند.)
روی یک سرویس هاست ساده مانند Blogger یا Wix مستقر هستید
اگر سایت شما روی سرویسی با صفحات از پیش قالب بندی شده و عناصر ناوبری مشخص قرار دارد،پس شاید سایت مپی را به صورت خودکار برای شما ایجاد کند و نیازی به انجام کاری ندارید. داکیومنت سرویس خودتان را برای کلمه «sitemap» جستجو کنید تا ببینید آیا نقشه سایت به طور خودکار ایجاد میشود یا اینکه آنها توصیه میکنند که نقشه سایت را خودتان تهیه کنید.
سایت شما به صورت داخلی لینک دهی شده است
این بدان معناست که گوگل میتواند با دنبال کردن لینکهایی که از صفحه اصلی شروع میشوند، تمام صفحات مهم سایت شما را پیدا کند.
فایلهای مدیا (ویدئو، تصویر) یا صفحات خبری زیادی برای ایندکس شدن ندارید
اگر میخواهید محتوایتان در نتایج جستجوی گوگل ظاهر شود، نقشههای سایت به گوگل کمک میکنند تا فایلهای ویدیویی و تصویری یا مقالات خبری را در سایت شما پیدا و درک کنند. اگر نیازی به نمایش محتوا در نتایج تصویری، ویدیویی یا خبری ندارید، پس احتمالا نیازی هم به سایت مپ ندارید.
استفاده از فایلهای ایندکس سایت مپ (برای گروه بندی چندین فایل نقشه سایت)
میتوانید چندین فایل نقشه سایت ارائه دهید، اما هر فایل نقشه سایتی، نباید بیش از 50000 URL داشته و نباید بزرگتر از 50 مگابایت (52,428,800 بایت) باشد. در صورت تمایل، میتوانید فایلهای نقشه سایت خودتان را با استفاده از gzip فشرده کنید تا پهنای باند مورد نیاز خودتان را کاهش دهید. با این حال، فایل نقشه سایت پس از فشرده نشدن نباید بزرگتر از 50 مگابایت باشد. اگر میخواهید بیش از 50000 URL را فهرست کنید، باید چندین فایل نقشه سایت ایجاد کنید.
فایل ایندکس سایت مپ باید:
- با یک تگ باز <sitemapindex> شروع و با یک تگ </sitemapindex> پایان یابد.
- یک ورودی <sitemap> برای هر نقشه سایت به عنوان تگ XML والد اضافه کنید.
- برای هر تگ والد <sitemap> یک ورودی فرزند <loc> وارد کنید.
- تگ اختیاری <lastmod> نیز برای فایلهای ایندکس سایت مپ موجود است.
توجه: یک فایل ایندکس نقشه سایت فقط میتواند نقشههای سایتی را مشخص کند که در همان سایت یافت میشوند. به عنوان مثال، https://www.yoursite.com/sitemap_index.xml نقشههای سایت در https://www.yoursite.com را در خودش دارد و نقشههای سایت https://www.example.com یا https://yourhost.yoursite. com را در خودش ندارد. فایل ایندکس سایت مپ همانند فایل نقشه سایت، باید کد UTF-8 را شامل شود.
اگر نقشه سایتی را با استفاده از مسیری با شماره پورت ارسال میکنید، باید آن شماره پورت را به عنوان بخشی از مسیر در هر URL فهرست شده در فایل نقشه سایت قرار دهید. به عنوان مثال، اگر نقشه سایت شما در https://www.example.com:100/sitemap.xml قرار دارد، هر URL فهرست شده در نقشه سایت باید با https://www.example.com:100 شروع شود.
مثالی از ایندکس سایت مپ XML
مثال زیر یک ایندکس حاوی دو نقشه سایت را نشان میدهد:
توجه: URLهای نقشه سایت، مانند تمام مقادیر موجود در فایلهای XML شما، باید entity escaped را داشته باشند.
مطلب پیشنهادی: بهترین ابزارهای سئو
تعاریف تگ ایندکس XML در سایت مپ
- <sitemapindex> : الزامی است. اطلاعات مربوط به تمام نقشههای سایت موجود در فایل را در خودش محفوظ میدارد.
- <sitemap> : الزامی است. اطلاعات مربوط به یک سایت مپ را در خودش گنجانده است.
- <loc> : الزامی است. مکان نقشه سایت را مشخص میکند. این مکان میتواند یک نقشه سایت، یک فایل Atom، یک فایل RSS یا یک فایل متنی ساده باشد.
- <lastmod> : اختیاری است. زمان تغییر فایل نقشه سایت را مشخص میکند. این مقدار با زمان تغییر هیچکدام از سایر صفحات ایندکس شده در سایت مپ، مطابقت ندارد. مقدار تگ lastmod باید در قالب W3C Datetime باشد. با ارائه آخرین timestamp تغییرات، خزندههای موتور جستجو را قادر میسازید تا تنها زیرمجموعهای از نقشههای سایت را در ایندکس، بازیابی کنند. یعنی یک خزنده فقط میتواند نقشههای سایتی را که از تاریخ معینی اصلاح شدهاند، بازیابی کند. این مکانیسم فچ (fetching) تدریجی نقشه سایت، امکان کشف سریع URLهای جدید در سایتهای بسیار بزرگ را فراهم میکند.
سایر فرمتهای نقشه سایت
با کمک پروتکل سایت مپ، جزئیاتی در مورد صفحات خودتان را در اختیار موتورهای جستجو قرار میدهید. علاوه بر پروتکل XML، فیدهای RSS و فایلهای متنی هم در دسترس هستند که اطلاعات محدودتری را ارائه میدهند.
Syndication feed
میتوانید فید RSS (Real Simple Syndication) 2.0 یا Atom 0.3 یا 1.0 ارائه دهید. به طور کلی، فقط در صورتی از این قالب استفاده کنید که سایت شما قبلاً یک فید syndication داشته باشد. توجه کنید که شاید این روش، اجازه دسترسی به همه URLهای سایت شما را به موتورهای جستجو ندهد، زیرا فید فقط اطلاعات URLهای اخیر را ارائه میدهد. البته موتورهای جستجو همچنان میتوانند از این اطلاعات برای اطلاع از سایر صفحات سایت شما در طول خزیدن عادی هم استفاده کنند. آنها لینکهای داخل صفحات درون فید را پردازش میکنند. مطمئن شوید که فید درون ایندکس در بالاترین سطحی قرار دارد که میخواهید موتورهای جستجو در آن بخزند. موتورهای جستجو اطلاعات درون فید را به صورت زیر استخراج میکنند:
- link> field>: نشان دهنده URL است
- modified date field (فیلد <pubDate> برای فیدهای RSS و تاریخ <updated> برای فیدهای Atom): نشان میدهد که هر URL آخرین بار چه زمانی اصلاح شده است. استفاده از فیلد تاریخ اصلاح شده، اختیاری است.
فایل متنی (Text file)
میتوانید یک فایل متنی ساده و حاوی یک URL در هر خط را ارائه دهید. فایل متنی باید این دستورالعملها را دنبال کند:
- در فایل متنی باید هر URL را در یک خط قرار دهید.
- باید URLها از جمله http را به طور کامل مشخص کنید.
- هر فایل متنی میتواند حداکثر 50000 URL داشته باشد و نباید بزرگتر از 50 مگابایت (52428800 بایت) شود. اگر سایت شما حاوی بیش از 50000 URL است، میتوانید لیست را به چندین فایل متنی جدا کرده و هر کدام را جداگانه اضافه کنید.
- فایل متنی باید از رمزگذاری UTF-8 استفاده کند. هنگام ذخیره فایل میتوانید این مورد را مشخص کنید (به عنوان مثال، در Notepad، این مورد در منوی رمزگذاری کادر محاوره ای Save As فهرست شده است).
- فایل متنی نباید اطلاعاتی به جز لیست URLها را شامل شود.
- فایل متنی نباید اطلاعات هدر یا فوتر را در بر گیرد.
- در صورت تمایل، میتوانید فایل متنی سایت مپ خودتان را با استفاده از gzip فشرده کنید تا پهنای باند مورد نیازتان را کاهش دهید.
- میتوانید نام فایل متنی را هر چیزی که میخواهید بگذارید. لطفاً بررسی کنید که URLهای شما از استاندارد RFC-3986 برای URIها و استاندارد RFC-3987 برای IRIها پیروی کنند.
- باید فایل متنی را در بالاترین دایرکتوری که میخواهید موتورهای جستجو در آن بخزند، آپلود کنید و مطمئن شوید که URLها را درون فایل متنی قرار گرفته در دایرکتوری سطح بالاتر، ایندکس نکنید.
نمونه ورودیهای فایل متنی در زیر نشان داده شده است.
اعتبارسنجی نقشه سایت شما
اسکیماهای XML زیر، عناصر و ویژگیهای قابل قرار گیری در فایل سایت مپ شما را تعریف میکنند. میتوانید این اسکیما را از لینکهای زیر دانلود کنید:
برای نقشه سایت:
https://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd
برای فایلهای ایندکس نقشه سایت:
https://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd
مطلب پیشنهادی: چک لیست سئو
با کمک ابزارهایی ساختار نقشه سایت خودتان را بر اساس این اسکیما، اعتبارسنجی کنید. میتوانید فهرستی از ابزارهای مرتبط با XML را در لینکهای زیر پیدا کنید:
https://www.w3.org/XML/Schema#Tools
https://www.xml.com/pub/a/2000/12/13/schematools.html
برای تأیید اعتبار نقشه سایت یا فایل ایندکس سایت مپ بر اساس یک اسکیما، فایل XML به هدرهای اضافی مانند شکل زیر نیاز دارد.
سایت مپ:
فایل ایندکس سایت مپ:
نحوه ایجاد سایت مپ
فرآیند تهیه سایت مپ به لطف ابزارهای موجود، بسیار ساده است. اساساً، باید نقشه سایت خودتان را تولید کنید، آن را با بهترین شیوهها بررسی کنید و سپس آن را برای گوگل ارسال کنید. در اینجا نحوه انجام این کار آمده است:
1. از سایت مپ ساز برای تهیه نقشه سایت استفاده کنید
سایت مپ سازها، پلاگینها و نرم افزارهایی هستند که فرآیندی عاری از کد نویسی را برای تهیه نقشه سایت، ارائه میدهند. برخی از بهترین سایت مپ سازها به شرح زیر هستند:
- Yoast: این مورد، یک افزونه رایگان در وردپرس است که نقشه سایت را به صورت رایگان برای شما میسازد.
- وردپرس 5.5 یا بالاتر: اگر از وردپرس 5.5 یا بالاتر استفاده میکنید، برای تهیه نقشه سایت نیازی به افزونههای خارجی ندارید.
- XML-Sitemaps.com: این ابزار بستههای پولی و رایگان را ارائه میدهد. تنها باید URL سایت خودتان را در قسمت سرچ قرار دهید و دکمه استارت را فشار دهید.
- Screaming Frog: با کمک این ابزار، نقشههای سایت XML را با تنظیمات پیشرفته مانند تگهای «last modified» ایجاد کنید.
- Slickplan: یک برنامه ریز نقشه سایت بصری و به عنوان بخشی از یک برنامه ریزی سایتی بزرگتر است که امکان تهیه نقشههای سایت متنی، XML یا وکتوری را فراهم میکند. پولی است، اما یک ترایال 30 روزه رایگان هم دارد.
- Dynomapper: یکی دیگر از برنامه ریزان نقشه سایت بصری پولی با ترایال رایگان است.
2.بهترین شیوههای بهبود عملکرد نقشه سایت را دنبال کنید
گوگل بهترین شیوهها برای بهبود عملکرد سایت مپ را ارائه داده است. در اینجا به چند دستورالعمل ساده برای شروع کار اشاره میکنیم:
- سایت مپهای بزرگ، را تفکیک کنید. اگر لیست طولانی از URLها دارید، نقشه سایت خود را به چند قسمت تقسیم کنید و سپس یک فایل ایندکس سایت مپ را ارسال کنید.
- فقط URLهای کانونیکال را فهرست کنید. اگر صفحات تکراری یا تقریباً تکراری دارید (همانطور که در بالا ذکر شد)، فقط URL اصلی برای نمایش در نتایج جستجو را در سایت مپ فهرست کنید. برای نسخههای دیگر، از تگ rel=canonical استفاده کنید.
- از رمزگذاری UTF-8 استفاده کنید. همه فایلهای نقشه سایت فقط میتوانند شامل کاراکترهای ASCII باشند، که به معنی اعداد 0-9، حروف انگلیسی A-Z و فقط برخی از کاراکترهای خاص است. نویسههایی مانند علامت اند، علامت نقل قول یا بزرگتری/کوچکتری باید با کدهای escape جابجا شوند:
- زیاد روی تگهای اولویت متمرکز نشوید. میتوانید از تگهای اولویت در نقشه سایت خودتان استفاده کنید تا برتری صفحات نسبت به یکدیگر را مشخص کنید (به عنوان مثال، تخصیص مقادیری از صفر تا 1.0). البته گوگل در پایان روز، طبق قوانین خودش خزیده و ایندکس میکند.
- هرگز URLهای NoIndex خودتان را ایندکس نکنید. نقشه سایت باید به گوگل بگوید که در کدام URLها بخزد و ایندکسشان کند، نه این که کدام یک را نادیده بگیرد.
3.نقشه سایت خودتان را برای گوگل ارسال کنید
هنگامیکه نقشه سایت خودتان را تهیه کردید، چند روش مختلف برای ارسال آن به گوگل وجود دارد.
1.گوگل سرچ کنسول: ساده ترین راه برای ارسال نقشه سایت است. هنگامیکه در Google Search Console هستید، نقشه سایت را در سمت چپ پنل پیدا کنید:
سپس URL نقشه سایت خودتان را اضافه کنید و گزینه Submit را بزنید.
مطلب پیشنهادی: آموزش سرچ کنسول
2.ابزار پینگ: با تایپ عبارت زیر میتوانید درخواست خودتان را مستقیماً در مرورگر خودتان ارسال کنید:
https://www.google.com/ping?sitemap=https://yourwebsite.com/sitemap
3.فایل Robots.txt: همچنین میتوانید با قرار دادن لینک سایت مپ خودتان در فایل robots.txt، نقشه سایت ارسال کنید.
4.WebSub: اگر از فید RSS به عنوان نقشه سایت استفاده میکنید، WebSub توصیه میشود.
5.ارسال نقشه سایت خودتان از طریق درخواست HTTP
برای ارسال سایت مپ با استفاده از یک درخواست HTTP (به جای <searchengine_URL> با URL ارائه شده توسط موتور جستجو)، درخواست خود را به URL زیر ارسال کنید:
<searchengine_URL>/ping?sitemap=sitemap_url
به عنوان مثال، اگر نقشه سایت شما در https://www.example.com/sitemap.gz واقع شده است، URL شما به صورت زیر خواهد بود:
<searchengine_URL>/ping?sitemap=https://www.example.com/sitemap.gz
URL همه چیز را پس از /ping?sitemap= رمزگذاری میکند.
<searchengine_URL>/ping?sitemap=http%3A%2F%2Fwww.yoursite.com%2Fsitemap.gz
میتوانید درخواست HTTP را با استفاده از wget، curl یا هر مکانیزم انتخابی دیگری ارسال کنید. یک درخواست موفق، کد پاسخ HTTP 200 را برمیگرداند. اگر پاسخ دیگری دریافت کردید، باید درخواست را دوباره ارسال کنید. کد پاسخ HTTP 200 فقط نشان میدهد که موتور جستجو، نقشه سایت شما را دریافت کرده است، نه این که خود نقشه سایت یا URLهای موجود در آن معتبر هستند. روشی آسان برای انجام این کار، راه اندازی یک فرایند خودکار برای تولید و ارسال نقشه سایت به طور منظم است.
توجه: اگر فایل ایندکس سایت مپ را ارائه میکنید، پس فقط باید یک درخواست HTTP حاوی لوکیشن فایل ایندکس را ارسال کنید. برای هر نقشه سایت ایندکس شده، درخواستهای جداگانه را ارسال نکنید.
4.حذف محتوا
طبق پروتکل سایت مپ، باید محتوای مدنظر برای ایندکس شدن را در اختیار موتورهای جستجو قرار دهید. برای این که به موتورهای جستجو بگویید که چه محتوایی را نمیخواهید ایندکس کنند، از فایل robots.txt یا متا تگ robots استفاده کنید.
در نهایت…
گوگل سایت شما را بابت نداشتن سایت مپ، جریمه نمیکند. اما داشتن آن ، مزایایی به همراه دارد. بدانید که نقشه سایت، قانونی نیست که گوگل باید از آن پیروی کند، بلکه بیشتر مجموعهای از اولویتها و دستورالعملها است که به کراول و ایندکس شدن هر چه بهتر سایت کمک میکند. بعلاوه، تهیه نقشه سایت رایگان است و به مهارت فنی چندانی نیاز ندارد.
منابع
https://www.wordstream.com/blog/ws/2022/11/14/what-is-a-sitemap
https://www.contentpowered.com/blog/xml-sitemap-priority-changefreq
دیدگاه شما