یکشنبه پانزدهم خرداد ۱۳۹۰ - ۷:۵۰ ب.ظ - دکتر لیلا (مهستی) جویباری -
موتور جستجو
موتورهای جستجوگر، با درجات متفاوتی از موفقیت، در واقع یک کار انجام می دهند: فراهم آوردن یک وسیله جستجوی ساده برای کمک به کاربران در رسیدن به
اطلاعات مورد نیاز. برای نیل به این مهم، موتورهای جستجوگر از اطلاعات موجود در پایگاه دادهای خود و همچنین الگوریتم ارائه نتایج کمک گرفته ، تا کاربر را در به دست آوردن اطلاعات مورد نیاز از منابع عظیمی که در این دنیای مجازی میباشد کمک کنند. اطلاعات این پایگاه داده نیز به روشهای گوناگونی تامین میشود.
برخی از موتور جستجوهای معتبر عبارتند از:
Google, Altavista, Msn, Ask, AllTheWeb, HotBot, Overture
اجزاء موتور جستجو
عنکبوت: عنکبوت یا روبات، نرمافزاری است که کار جمع آوری اطلاعات مورد نیاز یک موتور جستجوگر را بر عهده دارد. عنکبوت به صفحات مختلف سر
میزند، محتوای آنها را میخواند، اطلاعات مورد نیاز را جمع آوری میکند و آنرا در اختیار سایر بخشهای موتور جستجوگر قرار میدهد. کار یک عنکبوت ، بسیار شبیه کار
کاربران وب است. همانطور که کاربران، صفحات مختلف را بازدید میکنند، عنکبوت هم درست این کار را انجام میدهد با این تفاوت که عنکبوت کدهای HTML صفحات
را میبیند اما کاربران نتیجه حاصل از کنار هم قرار گرفتن این کدها را.اما یک عنکبوت آنرا چگونه میبیند؟ برای این که شما هم بتوانید دنیای وب را از دیدگاه یک عنکبوت ببینید، کافی است که کدهای HTML صفحات را مشاهده کنید...
عنکبوت ، به هنگام مشاهده صفحات، از خود بر روی سرورها رد پا برجای میگذارد. شما اگر اجازه دسترسی به آمار دید و بازدیدهای صورت گرفته از یک سایت و اتفاقات انجام شده در آنرا داشته باشید، میتوانید مشخص کنید که عنکبوت کدام یک از موتورهای جستجوگر صفحات سایت را مورد بازدید قرار داده اند.
یکی از فعالیتهای اصلی که در SEO انجام میشود تحلیل آمار همین دید و بازدیدها می باشد. عنکبوت کاربردهای دیگری نیز دارند، به عنوان مثال عدهای از آنها به سایتهای
مختلف مراجعه میکنند و فقط به بررسی فعال بودن لینکهای آنها میپردازند و یا به دنبال آدرس پست الکترونیکی میگردند.
پیمایشگر یا خزنده : خزنده ، نرمافزاری است که به عنوان یک فرمانده برای اسپایدر عمل میکند. آن مشخص می کند که اسپایدر کدام صفحات را مورد بازدید قرار دهد. در واقع خزنده تصمیم می گیرد که کدام یک از لینک های صفحه ای که اسپایدر در حال حاضر در آن قرار دارد، دنبال شود. ممکن است همه آنها را دنبال کند، بعضی ها را دنبال کند و یا هیچ کدام را دنبال نکند. خزنده ، ممکن است قبلا برنامه ریزی شده باشد که آدرس های خاصی را طبق برنامه، در اختیار اسپایدر قرار دهد تا از آنها دیدن کند که page Rank برای تمامی صفحات خزش شده وجود دارد.
دنبال کردن لینکهای یک صفحه به این بستگی دارد که موتور جستجوگر چه حجمی از اطلاعات یک سایت را می تواند در پایگاه داده اش ذخیره کند و همچنین ممکن است اجازه دسترسی به بعضی از صفحات به موتورهای جستجوگر داده نشده باشد. شما به عنوان دارنده سایت، همان طور که دوست دارید موتورهای جستجوگر اطلاعات سایت شما را با خود ببرند، میتوانید آنها را از بعضی از صفحات سایت تان دور کنید و اجازه دسترسی به محتوای آن صفحات را به آنها ندهید.
تنظیم میزان دسترسی موتورهای جستجوگر به محتوای یک سایت توسط پروتکل ربات انجام میشود که در مقالات دیگر سایت به آن پرداخته شدهاست. به عمل کراولر ، خزش میگویند.
بایگانی کننده: تمام اطلاعات جمع آوری شده توسط اسپایدر در اختیار ایندکسر قرار میگیرد. در این بخش اطلاعات ارسالی مورد تجزیه و تحلیل قرار می گیرند و به بخشهای متفاوتی تقسیم می شوند. تجزیه و تحلیل بدین معنی است که مشخص می شود اطلاعات از کدام صفحه ارسال شده است، چه حجمی دارد، کلمات موجود در آن کدام است، کلمات چندبار تکرار شدهاست، کلمات در کجای صفحه قرار دارند و ....
در حقیقت ایندکسر، صفحه را به پارامترهای آن خرد میکند و تمام این پارامترها را به یک مقیاس عددی تبدیل می کند تا سیستم رتبه بندی بتواند پارامترهای صفحات مختلف را با هم مقایسه کند. در زمان تجزیه و تحلیل اطلاعات، ایندکسر برای کاهش حجم داده ها از بعضی کلمات که بسیار رایج هستند صرف نظر می کند. کلماتی نظیر a ،an ،the ،www ،is و ... . از این گونه کلمات هستند.
پایگاه داده: تمام داده های تجزیه و تحلیل شده در ایندکسر، به پایگاه داده ارسال میگردد. در این بخش دادهها گروه بندی، کدگذاری و ذخیره میشود.
همچنین داده ها قبل از آنکه ذخیره شوند، طبق تکنیکهای خاصی فشرده میشوند تا حجم کمی از پایگاه داده را اشغال کنند. یک موتور جستجوگر باید پایگاه داده
عظیمی داشته باشد و به طور مداوم حجم محتوای آنرا گسترش دهد و البته اطلاعات قدیمی را هم به روز رسانی نماید. بزرگی و به روز بودن پایگاه داده یک موتور
جستجوگر برای آن امتیاز محسوب می گردد. یکی از تفاوت های اصلی موتورهای جستجوگر در حجم پایگاه داده آنها و همچنین روش ذخیره سازی دادهها در پایگاه
دادهاست.
سیستم رتبه بندی: بعد از آنکه تمام مراحل قبل انجام شد، موتور جستجوگر آماده پاسخ گویی به سوالات کاربران است. کاربران چند کلمه را در جعبه جستجوی آن وارد می کنند و سپس با فشردن Enter منتظر پــاسخ میمانند. برای پاسخگویی به درخواست کاربر، ابتدا تمام صفحات موجود در پایگاه داده که به موضوع جستجو شده، مرتبط هستند، مشخص می شوند. پس از آن سیستم رتبه بندی وارد عمل شده، آنها را از بیشترین ارتباط تا کمترین ارتباط مرتب میکند و به عنوان نتایج جستجو به کاربر نمایش میدهد.حتی اگر موتور جستجوگر بهترین و کامل ترین پایگاه داده را داشته باشد اما نتواند پاسخهای مرتبطی را ارایه کند، یک موتور جستجوگر ضعیف خواهد بود. در حقیقت سیستم رتبه بندی قلب تپنده یک موتور جستجوگر است و تفاوت اصلی موتورهای جستجوگر در این بخش قرار دارد.
سیستم رتبه بندی برای پاسخ گویی به سوالات کاربران، پارامترهای بسیاری را در نظر میگیرد تا بتواند بهترین پاسخها را در اختیار آنها قرار دارد.
انواع موتور جستجو
ابر جستجوگر: ابرجستجوگر از نتایج سایر موتورهای جستجوگر استفاده میکند. کار آن بدین صورت است که سوال کاربر را همزمان به موتورهای جستجوگر مختلفی ارسال میکند. پس از دریافت نتایج جستجوی آنها به بررسی نتایج دریافت شده میپردازد و در نهایت ترکیبی از رتبه های بالای آنها را طبق الگوریتم خود بعنوان نتایج جستجو به کاربر نشان میدهد. ابر جستجوگر اسپایدر و پایگاه داده ندارد. برخی از آنها عبارتند از:
Vivisimo, Mamma, IXQuick, WebCrawler, Kartoo, DogPile
موتورهای جستجو چگونه کار می کنند؟
زمانی که یک سایت روی اینترنت قرار می گیرد فقط افرادی می توانند به آن دسترسی داشته باشند که آدرس سایت یا همان نام دامنه را بدانند. قبل از بوجود آمدن موتورهای جستجوگر و لینکستانها این مسئله بسیار عادی بود اما با پیدایش آنها عمده بینندگان سایتها از این طریق از سایت هدف بازدید می کنند به عنوان مثال برای یک سایت معمولی در بدترین حالت گوگل در حدود روزانه ۵۰ نفر بازدید کننده ارسال می کند.
موتورهای جستجو از یک نرمافزار به نام ربات یا خزنده استفاده میکنند به عنوان مثال ربات یا خزنده گوگل "GoogleBot" نام دارد. این ربات ها با دنبال کردن پیوندها سایتهای مختلف را بازدید میکنند و اطلاعات مورد نظر خود را دریافت کرده و به سرور اصلی ارسال میکنند. سرور یا سرورهای اصلی با ذخیره سازی و پردازش آنها بانک اطلاعاتی مورد نظر خود را ایجاد میکنند.
محتوای این بانکهای اطلاعاتی در میان موتورهای جستجوی مختلف متفاوت است اما همه آنها الگوریتمی دارند که براساس اطلاعات دریافتی از رباتهای خود و داده های پردازش شده به هر صفحه نسبت به یک کلمه خاص - که به "کلمات کلیدی" مشهورند - امتیاز میدهد. این امتیاز نمایانگر مقدار نزدیکی محتوای سایت به کلمه کلیدی است. بر همین اساس زمانی که فردی به دنبال یک موضوع خاص میگردد موتورهای جستجو به بانک اطلاعاتی خود مراجعه کرده و به ترتیب نزدیک ترین سایت ها از لحاظ نزدیکی محتوای سایت به کلمه یا کلمات کلیدی استفاده شده را به وی پیشنهاد میدهند.
از آنجا که هر موتور جستجوگر الگوریتم "وب کاوی" مخصوص به خود را دارد بنابراین امتیاز یک صفحه نسبت به یک کلمه کلیدی ممکن است در موتورهای جستجوی مختلف متفاوت باشد. البته اکثر این الگوریتمها از یکسری اصول اولیه و ابتدایی مشترک استفاده میکنند.
از آنجا که پایه همه این تصمیم گیریها بر اساس هوش مصنوعی و رباتهای جستجوگر است در بسیاری از مواقع زمانی که مدیران سایتها (صاحبان سایتها) نسبت
به قوانین موتورهای جستجو بی تفاوت باشند و سعی در سازگاری سایتهای خود با موتورهای جستجوی بزرگ نکنند، رباتها اطلاعات ناقص یا اشتباهی را مخابره می کنند و سایت امتیازی پایین تر از آنچه که شایسته است میگیرد و این یعنی رتبه پایین تر، بازدید کننده کمتر و نهایتا بی استفاده ماندن سایت.
ارائه وب سایت
تمامی موتور های جستجو از برنامه اسپایدرهای خودشان برای پیدا کردن صفحات جدید استفاده می کنند، اسناد را پیدا میکنند، به هر کدام نامی می دهند،
نوشته های آن ها را بر میدارند و به پایگاه داده خودشان می برند. وقتی در سایتی صفحات جدیدی پیدا می کنند مجددا بر میگردند و آن اطلاعات را بر میدارند. به اسپایدر گوگل googlebot می گویند و در زمانی که به سایت شما سر می زند می توانید در لاگ های سایتتان آن را مشاهده کنید.
اما گوگل شما را چگونه پیدا میکند؟
در حال حاضر سه روش برای پیدا کردن سایت شما وجود دارد:
اول: ثبت سایت در گوگل از طریق آدرس
http://www.google.com/addurl.html
دوم: در زمانی که گوگل سایتی را مورد بررسی قرار می دهد در صورتی که سایت شما در آن باشد سایت شما را پیدا می کند.
سوم: در صورتی که سایت خود را در Google Webmaster Tools ثبت کنید. شما می توانید از نرمافزار های ثبت سایت در موتور های جستجو هم استفاده کنید
بعد از ثبت آدرس سایت موتورهای جستجو به هر صفحه از سایت نسبت به یک کلمه کلیدی خاص امتیاز میدهد که این امتیاز نشان دهنده میزان ارتباط محتوای صفحه با کلمه کلیدی جستجو شدهاست. امتیاز اخذ شده بسیار مهم است زیرا که امتیاز کمتر یعنی رتبه پایین تر و رتبه پایین تر یعنی بازدید کننده کمتر و شکست سایت.
پیروی از قوانین موتورهای جستجو در طراحی سایت و سپس سازگار ساختن محتوای سایت با الگوریتم موتورهای جستجو را "بهینه سازی وب سایت" یا "SEO" میگویند.
موتورهای جستجوگر پولی یا رتبه به ازای پول: کار آنها بسیار شبیه یک مزایده است: با توجه به واژه کلیدی انتخابی، برای بالاترین رتبه، باید بالاترین قیمت نسبت به سایر متقاضیان پرداخت شود.برخی از آنها عبارتند از:
FindWhat, Overture
موتورهای جستجوگر خاص: این نوع از موتورهای جستجوگر بر موضوعی خاص تمرکز دارند و تنها سایتهای مرتبط با آن موضوع را در پایگاه داده خود قرار میدهند. این موتورهای جستجوگر اطلاعات تخصصی تری را ارائه میدهند زیرا معمولا توسط افراد متخصص در آن زمینه اداره میشوند.
موتورهای جستجوگر منطق های و موضوعی به این دسته تعلق دارند. برخی از آنها عبارتند از:
ChemicalSearch, IndustrySearc
پیشنهاد کننده کلمات کلیدی
کلیدواژه ها همان کلماتی هستند که وقتی مورد جستجو قرار میگرفتند سایت یا سند ما در صفحات نخست نتایج جستجو (حداقل ۳ صفحه اول) ظاهر شود. در انتخاب کلمات کلیدی باید به چند نکته توجه شود:
• ارتباط معنایی با محتویات سایت: کلیدواژه ها باید با موضوع سایت مرتبط باشند. اگر این چنین نباشد رتبه سایت بسیار پایین خواهد آمد و حتی ممکن است به عنوان تقلب (Spam) شناخته شود.
• میزان محبوبیت : محبوبیت کلیدواژه به معنای میزان تقاضای آن از طرف کاربران است. هر چه این محبوبیت بیشتر باشد، بدون شک بعد از قرار گیری در رتبه بندی موتور جستجو، ترافیک بیشتری بوجود میآید. دامنه محبوبیت هم از اهمیت بالایی برخوردار است. مثلا یک واژه آلمانی بین یک عده خاص (آلمانی زبانها) دارای محبوبیت است.
• در نظر گرفتن رقیبان : اگر کلید واژه شما از محبوبیت بالایی برخوردار است اما رقیبان بسیار زیادی با شما رقابت میکنند (بویژه که از سایتهای مهم باشند) بهتر است از آن واژه صرف نظر کنید و یا تا حد امکان تخصصی تر آن را دنبال کنید، یعنی با ترکیب واژه با دیگر واژهها یک عبارت چند کلمهای بسازید. کیفیت رقبای شما نیز خیلی مهم است.
• بکارگیری کلیدواژه ها در آدرس سایت ها : نام دامنه سایت خود را متناسب با محتوای سایتتان انتخاب کنید و کلیدواژه ها را در نام پوشه و نام فایل بکار برید.
• بکارگیری کلیدواژه ها در صفحه سایت :
◦ عنوان صفحه: عنوان صفحه شامل ۵ تا ۱۰ کلمه است و همان متنی است که بالای گردشگر اینترنت ظاهر میشود و موقع ذخیره کردن صفحه و اضافه کردن آن به صفحات محبوب به عنوان اسم پیش فرض ظاهر میشود.
◦ تگ توصیف : برخی از موتورهای جستجو این متن را که شامل ۲۵ تا ۳۰ کلمه در توصیف صفحهاست بعد از عنوان سایت در نتایج جستجوی خود نشان میدهند. از کلیدواژه ها در این متن استفاده کنید.
◦ تگ کلیدواژه ها : این تگ جزء تگهای بسیار مهم سایت است زیرا موتورهای جستجو برای این بخش ارزش زیادی قائلند.ابتدا کلیدواژه اصلی، بعد کلید واژه دوم و بعد چند کلید واژه مشابه را قرار دهید.
◦ تگ مشخصات عکس : وقتی در سایتی ماوس را بر روی عکسی نگاه می دارید برای چند ثانیه متنی ظاهر میشود که شامل توضیحی در مورد عکس است. موتورهای جستجو حتی این توضیحات به ظاهر کوچک را در نظر میگیرند به همین دلیل از کلیدواژه ها در این متن استفاده کنید.
◦ نام فایل های عکس : نام فایل های عکس موجود در سایتتان را از میان کلید واژه ها انتخاب کنید و نام را فارسی انتخاب نکنید.
◦ متن صفحه : ارتباط کامل متن با موضوع و نگارش ساده و صحیح آن مهم است. کلیدواژه ها را نیز طوری در متن صفحه بکار برید که ساختار متن حفظ شود.
پارامترهای زیر را در به کارگیری کلیدواژه ها در نظر بگیرید:
***جایگاه کلیدواژه : منظور میزان نزدیکی کلیدواژه به ابتدای صفحه است. اولویت به ترتیب در مکان های زیر است : عنوان متن، عنوان فصل ها، اولین کلمه پاراگراف، خطهای اول پاراگراف اول، پاراگراف اول، خطوط بالای متن .
چگالی کلیدواژه : منظور از چگالی، نسبت دفعات تکرار کلمات کلیدی به کل متن است. باید مقدار این پارامتر را در حد معقول نگهدارید.
تعداد کلیدواژه : منظور از تعداد کلید واژه، دفعاتی است که یک کلید واژه بکار برده می شود. هر چه دفعات تکرار بیشتر باشد، نمره این پارامتر بالاتر میرود.
توزیع کلیدواژه : منظور این است که کلیدواژه ها چقدر از هم دور یا به هم نزدیک هستند. باید سعی شود که کلیدواژه ها خیلی به هم نزدیک نباشند و در همه جای متن وجود داشته باشند.
• تعداد کلید واژه : منظور از تعداد کلید واژه، دفعاتی است که یک کلید واژه بکار برده می شود. هر چه دفعات تکرار بیشتر باشد،نمره این پارامتر بالاتر میرود.
• توزیع کلید واژه : منظور این است که کلیدواژه ها چقدر از هم دور یا به هم نزدیک هستند. باید سعی شود که کلیدواژه ها خیلی به هم نزدیک نباشند و در همه جای متن وجود داشته باشند.
چک کننده سایت ها در موتور جستجو: این ابزار در بیشتر سایت های مرتبط با ابزار سئو کار شما را آسان کرده و شما می توانید امتیاز خود را در موتور جستجوها چک کنید. از جمله سایت هایی که این ابزار را در اختیار وب سایت قرار می دهند به شرح زیر میباشد:
ParaMeter.google،Zippy.co.uk
موقعیت سایت ها در موتور جستجو : ابزار بعدی نیز تعداد نتایج جستجوی سایت شما را در موتورهای جستجوی بزرگ نمایش میدهد. از جمله سایت هایی که این ابزار را در اختیار وب سایت قرار می دهند به شرح زیر می باشد:
cleverstat.google ، Mapelli.info
محبوبیت لینک : این بخش از بهینه سازی از اهمیت بسیار بالایی برخوردار است و از چند جهت برسی میشود:
◦ لینکهای ورودی
◦ لینکهای خارج شونده
◦ لینک دوجانبه
◦ اهمیت و کیفیت لینک های ورودی: لینکی که بین دو سایت با زمینه کاری مشابه رد وبدل شده، با کیفیت است و لینکی از یک سایت با رتبه بالا مهم است.
◦ متنی که لینک می شود : وجود کلیدواژهای که صفحه بر مبنای آن بهینه سازی شده در این متن مهم است چون موتورهای جستجو این پارامتر را هم در نظر می گیرند.
منبع: اسلایدهای بدون نام (احتمالا از این منبع است: کلیک کنید)
بسم الله الرحمن الرحیم