خزندگان موتور های جستجو : اگر دنیای وب را به یک کتابخانه تشبیه کنیم با این تفاوت که
این کتابخانه به اندازه ای بزرگ است که میلیارد ها کتاب و مقاله های قطور در آن نگهداری میشود ،
بر خلاف یک کتاب خانه ی معمولی که داده ها و محتوای آن همیشه ثابت است
این کتابخانه ی بسیار بزرگ تمام داده ها و محتویات آن روزانه در حال تغییر است و ثابت نمیماند.
یک کتابخانه حتی اگر کوچک و خصوصی باشد به کسی احتیاج داد که محتوای درون آن را بررسی کند
و کسانی را که برای تحویل کتاب به آنجا مراجعه میکنند را
راهنمایی میکند و بهترین و مرتبط ترین کتاب ها را در اختبار این افراد قرار میدهد ،
در دنیای وب هم به همین صورت است ، شخص یا اشخاصی باید باشند تا این محتوات را بررسی کنند ،
اما حجم این داده ها به حدی زیاد است که بررسی آنها ممکن است سالها طول بکشد ،
زمانی که فردی محتوایی تولید میکند و قصد دارد آن را روی اینترنت بارگذاری کند و در معرض دید عموم قرار درد نمیتواند سالها صبر کند تا
افراد محتوایش را بررسی کنند و اجازه ی بارگذاری بدهند یا امتیاز بدهند تا صفحه نمایش داده شود.
در این زمان crawler یا خزندگان وب ، بخش جدایی ناپذیر از موتور های جستجو وارد عمل میشوند .
کراولر ها یا خزندگان موتور های جستجو یا خزندگان وب مانند کتابداران این کتابخانه ی عظیم هستند ،
کراولر ها کتابدارانی دقیق هستند که زیر نظر موتور های جستجو کار میکنند .
کار آنها بررسی اطلاعات اصلی و موضوعات وب سایت ها یا صفحات و داده ها است.
این ربات ها ابتدا به موضوع اصلی وب سایت شما میپردازند و از محبوب ترین وب سایت ها و صفحات شروع به بررسی میکندد.
هرچه بررسی صفحات سریع تر انجام شود سایت سریع تر بالا میرود و امتیاز بیشتری میگیرد
برای این که بررسی توسط این خزندگان وب سرویع تر صورت بگیرد
باید محتوای داخل صفحات واضع و شفاف باشند و همچنین برای ربات ها خوانا و قابل فهم باشند
برای مثال از جمله بندی های درست استفاده کنید جایگاه کلمات کلیدی را حفظ کنید از تکرار جملات بپرهیزید یا اگر در تهران هستید لوکیشن را در اصفهان نزنید تا ربات ها گیج نشوند ، و یا خیلی موارد دیگر که باید به آنها توجه کرد .
بد نیست اشاره ای به انواع موتور های جستجو کنیم: در جهان غیر از گوگل حدود 30 موتور جستجو دیگر وجود دارد
که از مهم ترین آن ها می توان به بینگ ، اسک و یاهو اشاره کرد.
موتور های جستجو به طور کلی به دودسته تقسیم میشوند یک دسته موتور هایی که بر اساس خززیدن در سایت ها و پایگاه داده ها کار میکنند ،
و دسته ی دیگر دایرکتوری ها هستند
این خزندگان وب یا کراولر ها مربوط به دسته ی اول هستند که کار خزیدن در سایت ها و اطلاعات را انجام میدهد .
از برترین موهای جستجو میتوان به گوگل ، بینگ ، یاهو ، ask.com ، Baidu ، AOL.com ، Wolframapha ، آمازون ، DuckDuckGo و بسیاری دیگر اشاره کرد که در این بین گوگل پرچمدار است .
زمانی که ما یک وب سایت را طراحی کرده و به موتور های جستجو معرفی میکنیم
با توجه به اینکه هر موتور جستجو کرالر های منحصر به خودش را دارد ،
اطلاعات سایت ما را توسط خزندگان مخصوص خودش و طبق قوانین خاصی مورد بررسی قرار میدهد
تا پس از بررسی صفحات ما امتیاز گرفته و در معرض دید قرار بگیرند .
همانطور که در ابتدا اشاره کردیم داده های این کتابخانه دائما در حال تغییرند ،
پس کار این ربات ها تمامی ندارد و به طور دوره ای در حال بررسی داده های وب سایت و صفحات شما هستند.
و تا زمانی که این ربات ها صفحات و اطلاعات شما را بررسی نکنند در جستجو به کاربران نمایش داده نخواهد شد.
کرالر ها به لینک های مهم سرکشی میکنند و صفحاتی را که اهمیت بیشتری دارند را ابتدا مورد بررسی قرار میدهند تا کارها سریع تر پیش برود ،
برای کمک به این روند بهتر است ما هم صفحاتی را که نمیخواهیم ایندکس شوند را مشخص کنیم ،
در هر وبساتی صفحاتی و جود دارد که کاربر به هیچ وجه آن ها را جستجو نخواهد کرد. برای مثال می توان به صفحه سبد خرید اشاره کرد.
فرض کنید دیجی کالا سرچ می کردید و لینک دوم صفحه نتایج ، سبد خرید دیجی کالا بود.
مسلما شما به عنوان یک کاربر تازه وارد نیازی ندارید وارد این صفحه شوید ، اما از طرفی وجود این صفحه الزامی است.
پس باید این صفحه وجود داشته باشد اما امتیاز و ranking آن اهمیتی نداشته باشد تا کراولر ها را درگیر بررسی آن نکنیم .
این خزندگان تاثیر مستقیم بر سئو ی وب سایت شما میگذارند به عبارتی نظر این ربات ها در نمره و امتیاز گرفتن صفحات شما حائز اهمیت است .
همچنین وجود خزندگان موتور های جستجو به بالا رفتن سرعت بارگذاری صفحات در زمان جستجو ی کاربران هم کمک میکند
به صورتی که وقتی بار ها اطلاعات شما را مورد بررسی قرار داده باشند دیگر نیاز نیست وقتی کاربر محتوایی را جستجو کند ، در انتظار بماند تا اطلاعاتی پیدا شوند و سپس نمایش داده شوند
قطعا پیدا کردن اطلاعات مشابه میان میلیارد ها صفحه ی وب کاری زمان بر است
اما کراولر ها با بررسی اطلاعات و پیدا کردن اطلاعات مرتبط از طریق لینک های صفحات آدرس ها را حفظ کرده و محل اطلاعات شناخته شده است
به عبارتی یک نمایه بندی از موضوعات مرتبط انجام میدهد ، پس به راحتی هنگام سوال کاربر ، پاسخ را برداشته و تحویل میدهد.(نمایش لینکهای مرتبط در پاسخ به عبارت جستجو شده توسط یک کاربر)
تصویر زیر درک بهتری از کار این خزندگان وب به شما میدهد
این ربات کد HTML آن صفحه را اسکریپ میکند و سپس عنوان ، تگ ویدئو یا تصاویر آن صفحه را برای هر دو کاربر نمایش میدهد
عملکرد ربات این موتورجستجو کمک میکند تا مرتبط ترین صفحات به شما نمایش داده شوند .
دسته بندی ها :