«این صفحه
درباره ی چیست؟»
یکی از اصلیترین وظایف یک بازاریاب آنلاین، کمک کردن به
موتورهای جستجو به منظور یافتن پاسخ برای سؤال فوق است. موتورهای جستجو نمیتوانند
صفحات وب را آنطور که انسان میتواند بخواند، بنابراین ما با ترکیب ساختار
و سرنخهایی مناسب، منظور خود را از
یک محتوا به موتورهای جستجو میفهمانیم. در نتیجه عنصر ارتباط – relevance از SEO تأمین شده و
پرسشها منجر به پاسخهای مفیدتری در لیست نتایج جستجو خواهند شد.
با آموختن تکنیکهای فهم متن توسط موتورهای جستجو میتوان
علائم بهتری از آنچه یک متن در مورد آن است در اختیار قرار داد. این نوشته مجموعهای
از تکنیکهای درون- صفحهای را ارائه میکند.
هرچند گوگل جزئیات دقیقی از الگوریتمش را ارائه نمیکند،
در طی چندین سال با شواهد به دست آمده از مصاحبهها، مقالات پژوهشی، بایگانی
اختراعات ثبت شدهی آمریکا ومشاهدات تجربی میتوان فرآیندهای اصلی الگوریتم
موتورهای جستجو (به ویژه گوگل) را متوجه شد. اما باید توجه داشت که مطالب ذیل تنها
چند راه است که گوگل از طریق آن ارتباط – relevancy درون
– صفحهای را تعیین کرده و اینها قانون مطلق نیستند. تجربهی شخصی همیشه بهترین سیاست
در این خصوص است.
1- استفاده از کلمات کلیدی
در بدو ایجاد موتورهای جستجو، تنها کلمات کلیدی بودند که در
سرتاسر یک صفحه وب حضور داشتند. مفهوم اساسی این بود که اگر یک صفحه بر روی یک عنوان
معین تمرکز کند، موتورهای جستجو کلمات کلیدی را در نواحی مهم کشف خواهند کرد. این
نواحی عبارت بودند از تگ عنوان، سرتیترها، خصیصه alt از تصاویر و در
سرتاسر متن. بهینهسازان سایت برای موتورهای جستجو با قرار دادن کلمات کلیدی در
این نواحی، برای صفحات رتبه کسب میکردند. حتی امروز هم ما با کلمات کلیدی شروع میکنیم
و این هنوز ابتداییترین فرم بهینهسازی درون – صفحهای به شمار میرود.
بیشتر ابزارهای SEO درون – صفحهای براساس جانمایی کلمات کلیدی به
صفحات امتیازدهی کرده و هرچند این هنوزنقطهی مناسبی برای شروع است، تحقیقات حاکی
از اُفتِ تأثیر این رویکرد هستند. هرچند این موضوع مهم است که مطمئن شویم هر صفحه حداقل
شامل کلمات کلیدی مورد نظر برای رتبهبندی است، این مطلب که محل قرارگیری کلمات به
خودی خود تأثیر زیادی در پتانسیل رتبهبندی دارد، (در رویکردهای جدید رتبهبندی) صحیح
نیست.
2- TF-IDF (Term
Frequency–Inverse Document Frequency)
پژوهشگران
گوگل اخیرا بیان داشتهاند که TF-IDF و
شکلهای دیگر آن از دیرباز به عنوان شاخصی برای نمایه (index) کردن
صفحات مورد استفاده قرار گرفته و به عنوان جزئی از بسیاری از اختراعات ثبت شدهی
گوگل به کار گرفته شدهاند.
TF-IDF میزان تکرار یک
کلمه کلیدی را در یک صفحه وب در نظر نمی گیرد؛ بلکه معیاری از اهمیت کلمه
را از طریق مقایسهی تعداد دفعات تکرار یک کلمه در متن با انتظار (تکرار) آن کلمه
در مجموعهای بزرگتر از مستندات، به دست میدهد.
به عنوان مثال اگر کلمه «سبد» را در مقایسه با عبارت «سبد
سهام» در نظر بگیریم، فهمیده میشود که عبارت «سبد سهام» نسبت به کلمه «سبد» کمتر
مورد استفاده قرار میگیرد. برمبنای تناوب تکرار این دو، میتوان نتیجه گرفت که عبارت
«سبد سهام» در صورتی که در یک متن تکرار شود کلمهی مهم است در صورتی که
آستانهی مهم در نظر گرفتن کلمهی «سبد» خیلی بالاتر است.
برای اهداف SEO، وقتی که نسبت
همبستگی TF-IDF با رتبهی بالاتر را در میگیریم، این شاخص تنها اندکی از شاخص کلمات کلیدی
مؤثرتر است. به بیان دیگر ایجاد TF-IDF بالاتر به خودی
خود برای تقویت SEOکافی نیست؛ بلکه این
شاخص میبایست به عنوان جزئی از مفاهیم پیشرفتهتر در بهینهسازی درون – صفحهای
مد نظر قرار گیرد.
3- مترادفها و گونههای
نزدیک
با بیش از 6 میلیارد جستجو در هر روز، گوگل ثروتی عظیم از
اطلاعات در اختیار دارد که به کمک آن میتواند تعیین کند که وقتی کاربری یک عبارت
پرس و جو (query) را
تایپ میکند، دنبال چه معنا و منظوری میگردد. پژوهش گوگل به تنهایی نشان میدهد مترادفها
نقشی مهم در حدود 70 درصد جستجوها دارند.
برای حل این مشکل، موتورهای جستجو حجم انبوهی از کلمات
مترادف و گونههای نزدیک را برای تشکیل میلیاردها عبارت در اختیار
دارند که با آنها این امکان را میدهد که حتی اگر کاربری عبارات متفاوتی را برای
یک مفهوم به کار ببرد، صفحهی مربوط و مناسب را به او نمایش دهند. به عنوان مثال
عبارت پرس و جوی «تصویر درخت» میتواند هممعنای عبارات زیر باشد:
- تصاویر درختان
- تصویر منظره یک درخت
- عکس درخت
- نقاشی درخت
از سوی دیگر، عبارت پرس و جوی «تصویر سوختن درخت» میتواند
به طور کلی معنایی دیگر را برساند که فهم این تفاوت برای موتورهای جستجو بسیار مهم
است.
از نقطه نظر بهینهسازی (برای) موتورهای جستجو –SEO این به معنای این است که باید به دنبال ساخت محتوا براساس زبان طبیعی
(natural language) و نظایر و گونههای آن (variations)
بود نه به دنبال استفاده از کلمات کلیدی بارها و بارها در متن...
استفاده از مترادف و گونههای دیگر یک عنوان و تاپیک همچنین
میتواند به افزودن معنای عمیقتر و حل مسالهی ابهامزدایی (در هنگامی که
یک کلمه میتواند به چند معنا ارجاع داده شود) منجر شود. برای مثال کلمه «حال» و«اکنون»
در کنار هم معنایی را میرسانند که غیر از زمانی است که «حال» به معنای «روحیه و
انگیزه» است.
امروزه الگوریتم Hummingbird گوگل از حضور
همزمان (co-occurrence)
برای شناسایی مترادفها و تعویض پرس و جوها استفاده میکند.
4- قطعه بندی یا بخش بندی
صفحه
این که کلمات در کجای یک صفحه استفاده شوند اغلب اهمیتی در
حد خود کلمات دارد.
هر صفحهی وب از بخشهای مختلفی مانند سرصفحه (header)، پایین
صفحه (footer)،
نوار کناری (sidebar) و
... ساخته شده است. موتورهای جستجو تلاشهای طولانی مدتی را در راستای تعیین مهمترین
قسمت یا بخش از یک صفحه انجام دادهاند. هر دوی مایکروسافت و گوگل اختراعات ثبتشده ی فراوانی
را توسعه دادهاند که وزن بیشتری به قسمتهای مربوط تر یک صفحه میدهند.
محتوایی که در بدنهی اصلی متن به کار رفته اهمیت بیشتری
نسبت به محتوای سرصفحه یا کنار صفحه دارد. تکرار کلمات در نواحی کماهمیت و حواشی
خطر تنزل بیشتر را بالاتر میبرد.
بخشبندی صفحه هرچه بیشتر به سمت دستگاههای موبایل پیش میرویم،
مهمتر میشود زیرا معمولا بخشی از صفحه در آنها پنهان میشود. موتورهای جستجو
تمایل دارند به کاربران بخشهای مهمتر و رؤیتپذیرتر را نمایش دهند، بنابراین این
نواحی سزاوار تمرکز بیشتری هستند.
Html5، عناصر معنایی
بیشتری برای بخشبندی صفحه و تعریف نواحی مختلف در اختیار قرار میدهد.
5- فاصله ی معنایی و نسبت بین عبارات
وقتی در مورد بهینهسازی درون - صفحهای صحبت میشود، فاصلهی
معنایی به ارتباط و نسبت بین کلمات و عبارات مختلف در یک متن تعبیر میشود.
این فاصله از فاصلهی فیزیکی بین عبارات متفاوت است و بر این نکته تمرکز دارد که
چگونه عبارات به جملات و پاراگرافها و دیگر المانهای html متصل شدهاند.
به نظر شما موتورهای جستجو از کجا متوجه میشوند که کلمهی
«واکنشگرا-responsive» به
«طراحی سایت» مربوط میشود در صورتی که این دو عبارت در یک جمله نباشند؟
موتورهای جستجو این مسأله را با اندازهگیری فاصلهی
بین کلمات و عبارات مختلف در المانهای html حل
میکنند. هرچه مفاهیم از لحاظ معنایی به هم نزدیکتر باشند، به هم مربوط تر هستند.
عبارات واقع شده در یک پاراگراف نسبت به بلوکهای جدا از هم از لحاظ
معنایی به هم نزدیکتر هستند.
به علاوه ممکن است المانهای html فاصلهی
معنایی بین مفاهیم را کوتاهتر کرده و آنها را به هم نزدیکتر کنند. برای مثال لیستی
از آیتمها را میتوان نسبت به یکدیگر از لحاظ معنایی دارای یک فاصلهی برابر
دانست یا میتوان عنوان صفحه را میتوان به عبارات دیگر در متن صفحه نزدیکتر
دانست.
6- حضور همزمان و نمایه
کردن مبتنی بر عبارت
تا اینجا، کلمات کلیدی به شکل انفرادی و نیز نسبت و ارتباط
بین آنها بحث شد. موتورهای جستجو همچنین روشی برای نمایه کردن صفحات براساس عبارات کامل (complete phrases) و ارتباط بین آنها به خدمت گرفتهاند. این فرایند به عنوان
نمایهسازی مبتنی بر عبارت (phrase-based indexing) شناخته میشود.
نکتهی جالب در مورد این فرایند این نیست که گوگل چگونه
عبارات مهم را در یک صفحهی وب تعیین میکند، بلکه این که گوگل چگونه میتواند از
این عبارات برای رتبهبندی صفحه بر مبنای میزان ارتباط بین عبارات، استفاده
کند مهم است.
با استفاده از مفهوم وقوع-همزمان (co-occurrence) موتورهای جستجو متوجه میشوند که یک عبارت معین میتواند
دیگر عبارات را پیشبینی کند. اگر عنوان اصلی یک متن «بهینهسازی موتورهای
جستجو - سئو» باشد، این عبارت معمولا با عبارات دیگری مانند «انتخاب کلمات کلیدی»
و «وبمستر» همراه است. صفحهای با این عبارات مرتبط با احتمال بالاتری در مورد «بهینهسازی
موتورهای جستجو - سئو» است، در قیاس با صفحهای که این عبارات را ندارد.
به نکات بالا لینکهای واردشونده از صفحاتی با
عبارات مربوط با وقوع-همزمان را بیفزایید تا قدرت محتوایی صفحهی شما بالاتر
برود.
7- اهمیت و برجستگی یک
موجودیت
با نگاه به آینده موتورهای جستجو در حال کاوش راههایی برای
استفاده از ارتباط و نسبت بین موجودیتها و نه فقط کلمات کلیدی هستند، به منظور
تعیین ارتباط موضوعی هستند.