موتور جستجو چیه؟

قبل از صحبت کردن در مورد این که موتور جستجو چطور کار میکنه بهتره بدونین که اصلاً یه موتور جستجو یا Search Engine چیه!

یه موتور جستجو از دو تا قسمت اصلی تشکیل شده: یه پایگاه داده از اطلاعات و الگوریتم هایی که رتبه یه کوئری جستجو شده رو محاسبه می‌کنن و مشخص می‌کنن که چه نتیجه‌ای برای چه کوئری مناسبه!

در مورد موتورهای جستجوی وب مثل گوگل، پایگاه داده از میلیاردها صفحه وب تشکیل شده و الگوریتم ها صدها عامل رو برای ارائه مناسب‌ترین نتایج بررسی می‌کنن.

موتور جستجو چطور کار میکنه ؟

موتورهای جستجو با گرفتن لیستی از URL های شناخته شده کار می‌کنن و سپس به یه Scheduler میرن. این Scheduler تصمیم می‌گیره که چه موقع هر URL رو کراول کنه.

صفحات خزیده میشن و سپس به تجزیه کننده (parser) میرن که در اون اطلاعات حیاتی استخراج و فهرست بندی میشه. پیوندهای تجزیه شده به Scheduler مراجعه می‌کنن که اونجا Crawl و re-crawl کردن اونها رو اولویت بندی می‌کنه.

حالا وقتی شما چیزی رو جستجو می‌کنین، موتورهای جستجو صفحات منطبق رو برمی‌گردونن و الگوریتم ها اونها رو از نظر ارتباطی رتبه بندی می‌کنن پس نحوه کار موتور جستجو به زبان ساده و غیرفنی به این صورته!

شکل زیر یه نمودار از Google است که این روند رو براتون به تصویر کشیده:

نگران الگوریتم های رتبه بندی نباشین چون اونها رو هم به زودی پوشش خواهیم داد. اما اول باید بیشتر در مورد مکانیزم‌های مورد استفاده برای ساخت و نگهداری ایندکس کردن وب صحبت کنیم تا بدونیم موتور جستجو چطور کار میکنه. همچنین درباره عواملی که برای دونستن عملکرد موتورهای جستجو بهشون نیاز داریم و عبارتند از: برنامه ریزی (scheduling)، خزیدن (crawling)، تجزیه (parsing) و فهرست بندی (indexing)، بیشتر بدونیم.

در کل موتورهای جستجو دارای سه تا عملکرد اصلی هستن:

  • کراول کردن: اینترنت رو به منظور پیدا کردن محتوا جستجو میکنه، کد/محتوای هر URLیی رو که پیدا میکنه جستجو میکنه.
  • ایندکس کردن: محتوایی که در هنگام خزیدن، پیدا کرده رو ذخیره و سازماندهی میکنه و وقتی که یه صفحه ایندکس شد، می‌تونه برای پاسخ به کوئری‌های مرتبط نمایش داده بشه.
  • رتبه بندی کردن: بخش‌هایی از محتوا رو طوری ارائه میده که مرتبط‌ترین پاسخ به کوئری جستجوگر تحویل داده بشه، یعنی که نتایج به ترتیب مرتبط‌ترین و کم ربط‌ترین رتبه بندی میشن.

عملکرد موتوهای جستجو در ایندکس اطلاعات

نحوه کار موتورهای جستجو به این ترتیب است که ربات ها یا خرنده های آن از میان چندین هزار صفحه موجود که مانند ایستگاه های مختلف یک قطار شهری هستند بخزند و اطلاعات مرتبط را بازیابی کنند. در این مسیر از اطلاعات مختلفی مثل، آدرس صفحه، عبارات بکار رفته در متن، شرح عکس ها و تصاویر، تعداد بازدید های صفحه و میزان توقف کاربران در صفحات استفاده می کنند. صفحاتی که محبوب تر باشند بیشتر از سایرین و در جایگاه بهتری نمایش داده خواهند شد. بنابر این بین فعالان دنیای مجازی برای دستیابی به جایگاه بهتر در صفحات موتورهای جستجو رقابت وجود دارد.

یافته های موتورهای جتسجو در پایگاه های اطلاعات بسیار گسترده ای که در سراسر جهان وجود دارد ذخیره می شوند تا به سرعت در دسترس کاربر قرار بگیرند.

نحوه عملکرد موتورهای جستجو در یافتن پاسخ های مناسب

نحوه عملکرد موتورهای جستجو به شکلی است که همواره پاسخ های کاملا مرتبط با سوال شما را می یابند و حتی اگر در خصوص مکانی سوال کرده باشید نزدیک ترین آن به محل اقامت کنونی تان را در اختیار شما می گذارد. این امر نیازمند یک عملکرد پیچیده فنی است.

برای این کار باید دو مرحله انجام پذیرد ابتدا یافتن پاسخ های مرتبط به سوال شما در پایگاه داده ها و دوم رتبه بندی آن ها براساس مفید بودن اطلاعات.

امروزه صدها فاکتور در عملکرد ربات های موتورهای جستجو موثر اند که حرفه متخصصان سئو یافتن این فاکتورها و ساماندهی صفحات وب براساس آن چیزی است که موتورهای جستجو می پسندند.

نحوه عملکرد موتورهای جستجو در بازیابی و رتبه بندی

الگورتیم های ربات های جستجوگر در خصوص نحوه عملکرد موتورهای جستجو معمولا به شکل یک راز در بین دارندگان موتورهای جستجو حفظ شده و تلاش می کنند رازهای صنعت را برای همگان آشکار نکنند.

اما متخصصان سئو با بررسی نتایج جستجو و داده های آماری سعی می کنند تا حد امکان این رازها را آشکار کرده و از آن جهت بهینه سازی صفحات وب بهره ببرند. برخی از این موارد عبارت است از:

  • الگورتیم های موتورهای جستجوی برتر جهان در حال حاضر قادر به تشخیص صفحات کپی و غیر مرتبط هستند و به سایت هایی که از این روش ها استفاده کنند رتبه منفی داده و رتبه آن ها را به شکل محسوسی افزایش می دهند تا در موتورهای جستجو بازیابی و ایندکس نشوند. این امتیازات منفی اثرات مخربی بر روی سایت ها خواهد داشت.
  • کلمات کلیدی نقش اساسی در بازیابی اطلاعات و رتبه بندی صفحات وب دارند. در گذشته بیشتر لینک های ورودی به یک صفحه به اعتبار بخشی صفحات کمک می کرد اما الگریتم های جدید برای پیشگیری از ایجاد هرزنامه ها از پارامترهای معتبر تری مثل کلمات کلیدی و… بهره می برند.
  • عنوان صفحات یکی از مواردی است که توسط موتور های جستجو کنترل می شود . بنابراین همواره تاکید می شود که عنوان سئو باید با موضوع صفحات بیشترین ارتباط را داشته باشد.
  • پیشرفت الگوریتم های موتورهای جستجو در سال های اخیر محتوای اثر بخش و باکیفیت را در صدر اهمیت قرار داده و توجه به محتوا را به اصلی ترین دغدغه متخصصان سئو تبدیل کرده است.