«این صفحه درباره ی چیست؟»

یکی از اصلی‌ترین وظایف یک بازاریاب آنلاین، کمک کردن به موتورهای جستجو به منظور یافتن پاسخ برای سؤال فوق است. موتورهای جستجو نمی‌توانند صفحات وب را آنطور که انسان می‌تواند بخواند، بنابراین ما با ترکیب ساختار و سرنخ‌هایی  مناسب، منظور خود را از یک محتوا به موتورهای جستجو می‌فهمانیم. در نتیجه عنصر ارتباط – relevance  از SEO تأمین شده و پرسش‌ها منجر به پاسخ‌های مفیدتری در لیست نتایج جستجو خواهند شد.

با آموختن تکنیک‌های فهم متن توسط موتورهای جستجو می‌توان علائم بهتری از آنچه یک متن در مورد آن است در اختیار قرار داد. این نوشته مجموعه‌ای از تکنیک‌های درون- صفحه‌ای را ارائه می‌کند.

هرچند گوگل جزئیات دقیقی از الگوریتم‌ش را ارائه نمی‌کند، در طی چندین سال با شواهد به دست آمده از مصاحبه‌ها، مقالات پژوهشی، بایگانی اختراعات ثبت شده‌ی آمریکا ومشاهدات تجربی می‌توان فرآیندهای اصلی الگوریتم موتورهای جستجو (به ویژه گوگل) را متوجه شد. اما باید توجه داشت که مطالب ذیل تنها چند راه است که گوگل از طریق آن ارتباط – relevancy درون – صفحه‌ای را تعیین کرده و این‌ها قانون مطلق نیستند. تجربه‌ی شخصی همیشه بهترین سیاست در این خصوص است.

1- استفاده از کلمات کلیدی

در بدو ایجاد موتورهای جستجو، تنها کلمات کلیدی بودند که در سرتاسر یک صفحه وب حضور داشتند. مفهوم اساسی این بود که اگر یک صفحه بر روی یک عنوان معین تمرکز کند، موتورهای جستجو کلمات کلیدی را در نواحی مهم کشف خواهند کرد. این نواحی عبارت بودند از تگ عنوان، سرتیترها، خصیصه alt از تصاویر و در سرتاسر متن. بهینه‌سازان سایت برای موتورهای جستجو با قرار دادن کلمات کلیدی در این نواحی، برای صفحات رتبه کسب می‌کردند. حتی امروز هم ما با کلمات کلیدی شروع می‌کنیم و این هنوز ابتدایی‌ترین فرم بهینه‌سازی درون – صفحه‌ای به شمار می‌رود.

بیشتر ابزارهای SEO درون – صفحه‌ای براساس جانمایی کلمات کلیدی به صفحات امتیازدهی کرده و هرچند این هنوزنقطه‌ی مناسبی برای شروع است، تحقیقات حاکی از اُفتِ تأثیر این رویکرد هستند. هرچند این موضوع مهم است که مطمئن شویم هر صفحه حداقل شامل کلمات کلیدی مورد نظر برای رتبه‌بندی است، این مطلب که محل قرارگیری کلمات به خودی خود تأثیر زیادی در پتانسیل رتبه‌بندی دارد، (در رویکردهای جدید رتبه‌بندی) صحیح نیست.

2- TF-IDF (Term Frequency–Inverse Document Frequency)

پژوهشگران گوگل اخیرا بیان داشته‌اند  که TF-IDF و شکل‌های دیگر آن از دیرباز به عنوان شاخصی برای نمایه (index) کردن صفحات مورد استفاده قرار گرفته و به عنوان جزئی از بسیاری از اختراعات ثبت شده‌ی گوگل به کار گرفته شده‌اند.

TF-IDF میزان تکرار یک کلمه کلیدی را در یک صفحه وب در نظر نمی گیرد؛ بلکه معیاری از اهمیت کلمه را از طریق مقایسه‌ی تعداد دفعات تکرار یک کلمه در متن با انتظار (تکرار) آن کلمه در مجموعه‌ای بزرگتر از مستندات، به دست می‌دهد.

به عنوان مثال اگر کلمه «سبد» را در مقایسه با عبارت «سبد سهام» در نظر بگیریم، فهمیده می‌شود که عبارت «سبد سهام» نسبت به کلمه «سبد» کمتر مورد استفاده قرار می‌گیرد. برمبنای تناوب تکرار این دو، می‌توان نتیجه گرفت که عبارت «سبد سهام» در صورتی که در یک متن تکرار شود کلمه‌ی مهم است در صورتی که آستانه‌ی مهم در نظر گرفتن کلمه‌ی «سبد» خیلی بالاتر است.

برای اهداف SEO، وقتی که نسبت همبستگی TF-IDF با رتبه‌ی بالاتر را در می‌گیریم، این شاخص تنها اندکی از شاخص کلمات کلیدی مؤثرتر است. به بیان دیگر ایجاد TF-IDF بالاتر به خودی خود برای تقویت  SEOکافی نیست؛ بلکه این شاخص می‌بایست به عنوان جزئی از مفاهیم پیشرفته‌‌تر در بهینه‌سازی درون – صفحه‌ای مد نظر قرار گیرد.

3- مترادف‌ها و گونه‌های نزدیک

با بیش از 6 میلیارد جستجو در هر روز، گوگل ثروتی عظیم از اطلاعات در اختیار دارد که به کمک آن می‌تواند تعیین کند که وقتی کاربری یک عبارت پرس و جو (query) را تایپ می‌کند، دنبال چه معنا و منظوری می‌گردد. پژوهش گوگل به تنهایی نشان می‌دهد مترادف‌ها نقشی مهم در حدود 70 درصد جستجوها دارند.

برای حل این مشکل، موتورهای جستجو حجم انبوهی از کلمات مترادف و گونه‌های نزدیک را برای تشکیل میلیاردها عبارت در اختیار دارند که با آنها این امکان را می‌دهد که حتی اگر کاربری عبارات متفاوتی را برای یک مفهوم به کار ببرد، صفحه‌‌ی مربوط و مناسب را به او نمایش دهند. به عنوان مثال عبارت پرس و جوی «تصویر درخت» می‌تواند هم‌معنای عبارات زیر باشد:

-  تصاویر درختان

-  تصویر منظره یک درخت

-  عکس درخت

-   نقاشی درخت

از سوی دیگر، عبارت پرس و جوی «تصویر سوختن درخت» می‌تواند به طور کلی معنایی دیگر را برساند که فهم این تفاوت برای موتورهای جستجو بسیار مهم است.

از نقطه نظر بهینه‌سازی (برای) موتورهای جستجو –SEO این به معنای این است که باید به دنبال ساخت محتوا براساس زبان طبیعی (natural language) و نظایر و گونه‌های آن (variations) بود نه به دنبال استفاده از کلمات کلیدی بارها و بارها در متن...

استفاده از مترادف و گونه‌های دیگر یک عنوان و تاپیک هم‌چنین می‌تواند به افزودن معنای عمیق‌تر و حل مساله‌ی ابهام‌زدایی (در هنگامی که یک کلمه می‌تواند به چند معنا ارجاع داده شود) منجر شود. برای مثال کلمه «حال» و«اکنون» در کنار هم معنایی را می‌رسانند که غیر از زمانی است که «حال» به معنای «روحیه و انگیزه» است.

امروزه الگوریتم Hummingbird گوگل از حضور همزمان (co-occurrence) برای شناسایی مترادف‌ها و تعویض پرس و جوها استفاده می‌کند.

4- قطعه بندی یا بخش بندی صفحه

این که کلمات در کجای یک صفحه استفاده شوند اغلب اهمیتی در حد خود کلمات دارد.

هر صفحه‌ی وب از بخش‌های مختلفی مانند سرصفحه (header)، پایین صفحه (footer)، نوار کناری (sidebar) و ... ساخته شده است. موتورهای جستجو تلاش‌های طولانی مدتی را در راستای تعیین مهم‌ترین قسمت یا بخش از یک صفحه انجام داده‌اند. هر دوی  مایکروسافت و گوگل اختراعات ثبت‌شده ی فراوانی را توسعه داده‌اند که وزن بیشتری به قسمت‌های مربوط‌‌‌ تر یک صفحه می‌دهند.

محتوایی که در بدنه‌ی اصلی متن به کار رفته اهمیت بیشتری نسبت به محتوای سرصفحه یا کنار صفحه دارد. تکرار کلمات در نواحی کم‌اهمیت و حواشی خطر تنزل بیشتر را بالاتر می‌برد.

بخش‌بندی صفحه هرچه بیشتر به سمت دستگاه‌های موبایل پیش می‌رویم، مهم‌تر می‌شود زیرا معمولا بخشی از صفحه در آن‌ها پنهان می‌شود. موتورهای جستجو تمایل دارند به کاربران بخش‌های مهم‌تر و رؤیت‌پذیرتر را نمایش دهند، بنابراین این نواحی سزاوار تمرکز بیشتری هستند.

Html5، عناصر معنایی بیشتری برای بخش‌بندی صفحه و تعریف نواحی مختلف در اختیار قرار می‌دهد.

5- فاصله ی معنایی و نسبت بین عبارات 

وقتی در مورد بهینه‌سازی درون - صفحه‌ای صحبت می‌شود، فاصله‌ی معنایی به ارتباط و نسبت بین کلمات و عبارات مختلف در یک متن تعبیر می‌شود. این فاصله از فاصله‌ی فیزیکی بین عبارات متفاوت است و بر این نکته تمرکز دارد که چگونه عبارات به جملات و پاراگراف‌ها و دیگر المان‌های html متصل شده‌اند.

به نظر شما موتورهای جستجو از کجا متوجه می‌شوند که کلمه‌ی «واکنشگرا-responsive» به «طراحی سایت» مربوط می‌شود در صورتی که این دو عبارت در یک جمله نباشند؟

موتورهای جستجو این مسأله را با اندازه‌گیری فاصله‌ی بین کلمات و عبارات مختلف در المان‌های html حل می‌کنند. هرچه مفاهیم از لحاظ معنایی به هم نزدیک‌تر باشند، به هم مربوط تر هستند. عبارات واقع شده در یک پاراگراف ‌نسبت به بلوک‌های جدا از هم از لحاظ معنایی به هم نزدیک‌تر هستند.

به علاوه ممکن است المان‌های html فاصله‌ی معنایی بین مفاهیم را کوتاه‌تر کرده و آنها را به هم نزدیک‌تر کنند. برای مثال لیستی از آیتم‌ها را می‌توان نسبت به یکدیگر از لحاظ معنایی دارای یک فاصله‌ی برابر دانست یا می‌توان عنوان صفحه را می‌توان به عبارات دیگر در متن صفحه نزدیک‌تر دانست.

6- حضور هم‌زمان و نمایه کردن مبتنی بر عبارت

تا اینجا، کلمات کلیدی به شکل انفرادی و نیز نسبت و ارتباط بین آنها بحث شد. موتورهای جستجو هم‌چنین روشی برای نمایه کردن صفحات  براساس عبارات کامل (complete phrases) و ارتباط بین آن‌ها به خدمت گرفته‌اند. این فرایند به عنوان نمایه‌سازی مبتنی بر عبارت (phrase-based indexing)  شناخته می‌شود.

نکته‌ی جالب در مورد این فرایند این نیست که گوگل چگونه عبارات مهم را در یک صفحه‌ی وب تعیین می‌کند، بلکه این که گوگل چگونه می‌تواند از این عبارات برای رتبه‌بندی صفحه بر مبنای میزان ارتباط بین عبارات، استفاده کند مهم است.

با استفاده از مفهوم وقوع-هم‌زمان (co-occurrence) موتورهای جستجو متوجه می‌شوند که یک عبارت معین می‌تواند دیگر عبارات را پیش‌بینی کند. اگر عنوان اصلی یک متن «بهینه‌سازی موتورهای جستجو - سئو» باشد، این عبارت معمولا با عبارات دیگری مانند «انتخاب کلمات کلیدی» و «وب‌مستر» همراه است. صفحه‌ای با این عبارات مرتبط با احتمال بالاتری در مورد «بهینه‌سازی موتورهای جستجو - سئو» است، در قیاس با صفحه‌ای که این عبارات را ندارد.

به نکات بالا لینک‌های واردشونده از صفحاتی با عبارات مربوط با وقوع-هم‌زمان را بیفزایید تا قدرت محتوایی صفحه‌ی شما بالاتر برود.

7- اهمیت و برجستگی یک موجودیت

با نگاه به آینده موتورهای جستجو در حال کاوش راه‌هایی برای استفاده از ارتباط و نسبت بین موجودیت‌ها و نه فقط کلمات کلیدی هستند، به منظور تعیین ارتباط موضوعی هستند.


آموزش برنامه نویسی سی شارپ، آموزش ASP.NET MVC، آموزش طراحی صفحات وب، آموزش برنامه نویسی موبایل (Xamarin) - از مقدماتی تا پیشرفته در سپیدآریا