LSI چیست؟

Latent Semantic Indexing یک متد ریاضی است که در سال 1980 به منظور افزایش دقت در بازیابی اطلاعات ارائه شد. این روش از یک تکنیک به نام singular value decomposition برای اسکن داده های بدون ساختار استفاده می کند تا روابط بین مفاهیمی که در آنها وجود دارد را شناسایی کند. در واقع، روابط پنهان (Latent) بین کلمات (Semantic) را کشف می کند تا بتواند درک بیشتری از مفاهیم داشته باشد (Indexing). این متد پیشرفت بزرگی در زمینه درک مطلب بوده که به کامپیوترها کمک کرده تا اصطلاحات بومی زبان را بفهمند، در حقیقت با توجه به اینکه کامپیوتر نمی توانست زبان های مختلف را درک کند این سیستم را پیاده سازی نمودند تا کامپیوتر هم بتواند زبانی که ما صحبت می کنیم را کم و بیش درک نماید.

تکنولوژی های قدیمی تر از  مترادف های کلمات استفاده می کنند که زبان طبیعی (Natural Language) آنها را مشخص میکند و هر تغییری در آنها باعث می شود که مفاهیم دیگری داشته باشند. به عنوان مثال دو کلمه تور و ترکیه را در نظر بگیرید این دو کلمه دارای مفاهیم بسیار ساده و قابل درکی هستند، اما هر دو ممکن است بر اساس اینکه کجا و چطور استفاده می شوند چندین معنی دیگر داشته باشند. فقط کافیست این دو کلمه را در کنار هم قرار دهیم تا به یک مفهوم کاملا متفاوت از هر دو برسیم؛ تور ترکیه.

خب حالا چطور می توانیم یک ماشین (کامپیوتر) را آموزش دهیم تا با تفاوت ها منطبق باشد؟ این مشکلی است که برای سالها ذهن انسان های زیادی را درگیر خودش کرده است.

LSI توانست به کامپیوترها کمک کند تا زبان های محاوره ای را درک کنند. این متد بر روی متن های استاتیک و مجموعه متن های کوچک بهتر کار می کند که برای مقاصد اولیه ای که دارد عالی و کاربردی است. همچنین می تواند متون را با توجه به موضوعات مشترکی که دارند دسته بندی کند، این قابلیت برای موتورهای جستجو بسیار مفیدست.

حالا می توانیم یک تعریف کلی از LSI داشته باشیم، این تعریف را می توان به صورت زیر خلاصه کرد:

  • یک تکنولوژی بازیابی اطلاعات که در سال 1980 توسعه یافت. کاربرد اصلی آن برطرف کردن مشکلات تکنولوژی های قدیمی تر در درک هم معنایی (synonymy) و چندمعنایی (polysemy) است.
  • یک رویکرد خاص که تلاش می کند ساختار معناداری را در زبان های مختلف درک کند.
  • یک تکنولوژی که قادر به تشخیص کلمات و موضوع یک متن با استفاده از دسته بندی های سلسله مراتبی است.
  • یک تکنولوژی کاربردی برای دسته های متنی کوچک و استاتیک (بدون تغییر)

LSI و تاثیرش بر سئو

در بخش قبلی گفتیم موتور جستجو می تواند با استفاده از LSI معنای عبارت ها را تشخیص دهد، پس این متد می تواند به موتور جستجو کمک کند که محتوای سایت شما را نیز درک کند.
منظور ما از اینکه می تواند موتور جستجو محتوای شما را درک کند چیست؟ قبل تر ها که همچین ویژگی ای در موتورهای جستجو وجود نداشت موتور های جستجو از یک دستور العمل ساده استفاده می کردند. آن هم به این شکل بود که فرض کنیم شخصی به دنبال این بود که ببیند “کلمات کلیدی LSI” چیست؟ وارد گوگل میشد و عبارت کلمه کلیدی LSI چیست را جستجو می کرد، موتورهای جستجو در بین سایت هایی که داشتند بدنبال این عبارت می گشتند و هر کسی که دقیقاً این عبارت را در متن خود یا هرجایی در صفحه به کار برده بود پیدا می کردند و به کاربر نمایش می دادند. اما الان چطور کار می کنند؟ امروزه ممکن است هر کسی در مورد LSI سوال دیگری داشته باشد، مثلاً اینکه این کلمه کلیدی در سئو چه تاثیری دارد. وقتی ربات گوگل محتوای ما را میخواند درک می کند که ما در مورد همه چیز این موضوع صحبت کرده ایم و وقتی کسی سوالی می پرسد که ما دقیقاً با آن عبارت سوال را مطرح نکرده ایم، گوگل این موضوع را تشخیص می دهد و آن محتوا را به کاربر نمایش می دهد.

LSI نقش مهمی در توسعه موتورهای جستجوی اولیه داشته است. به نظر راجر مونتی (Roger Montti،کارشناس و مشاور سئو) « LSI نقش چرخ های کمکی برای موتورهای جستجو را دارد». اما دلیل نمی شود قبول کنیم که هنوز هم چنین نقشی را دارد. در این که گوگل می خواهد موضوع و مفهوم هر محتوایی را بفهمد شکی نداریم و Semantics یا معناشناسی (مطالعه معانی و مفاهیم در زبان ها) زیربنای این رویکرد گوگل است. در ضمن دلایل زیادی داریم که ثابت می کند تکنولوژی گوگل بسیار پیشرفته تر از اینهاست و از تکنولوژی «یادگیری ماشین» برای ایندکس کردن و بازیابی اطلاعات استفاده می کند. در اواخر سال 2017، JR Oakes (پژوهشگر فنی سئو) مقاله ای در زمینه رشد تکنولوژی سئو نوشت که شامل معرفی تکنولوژی های بازیابی محتوای مدرن و نحوه کارکردن گوگل می شود. با این حال که گوگل سعی می کند توانایی خود را در جستجوی معنایی از طریق تکنولوژی های جدید توسعه بدهد.

دو فاکتور در الگوریتم LSI وجود دارد که به شما اجازه می دهند سئوی خود را بهبود دهید:

  • پردازش زبان های طبیعی Natural language processingیک حیطه تحقیقاتی که به بررسی رابطه میان زبان انسان و کامپیوتر می پردازد. پردازش زبان های طبیعی شامل فرضیه توزیع یا توزیع مفهومی (Distributional Hypothesis) می شود، حوزه تحقیقاتی که برروی کمیت بخشی و طبقه بندی تشابهات میان زبان ها تمرکز می کنند. در واقعیت، این فرضیه به موتورهای جستجو کمک می کند تا بفهمد کدام عبارات و کلمات معنای مشابهی دارند و این کار را با شناسایی عبارات و کلماتی که معمولاً در کنار آنها آورده می شود انجام می دهد.
  • تجزیه ارزش های مفرد Singular Value Decomposition : ” فاکتورگیری از یک ماتریس واقعی یا پیچیده. ” SVD یک متد کاملاً اتوماتیک برای مطالعه برروی الگوهای روابط بین کلمات و کانسپت هاست. این الگوها به عنوان مجموعه ای از متون ساختار نیافته شناسایی می شوند. به زبان ساده، LSI از SVD برای شناسایی اطلاعاتی که باید بازخوانی شود استفاده می کند.
  • چطور می توان از این اطلاعات استفاده کرد؟ از آنجایی که LSI یک متد ریاضیاتی است می دانیم که به پیکربندی وابسته است. تمام کاری که لازم است انجام دهیم این است که محتوای خود را به نحوی بهینه سازی کنیم که این الگوها را شبیه سازی کند و اینجاست که پردازش زبان های طبیعی و SVDها وارد داستان می شوند.
    پاراگراف های مشابهی را با پخش کردن عبارات، کلمات، مترادف ها و اصطلاحات مشترک در محتوا قرار دهید.
    یک قالب خوب برای محتوای خود ایجاد کنید که از کلمات و عبارات مشابه و مناسب در آن استفاده شده باشد، با این کار می توانید از SVD استفاده کنید.

2 متدی که در زیر معرفی می کنیم، متدهای LSI هستند که می توانند جهش های بزرگی را در مدت زمان بسیار کوتاه برای وبسایت شما به ارمغان بیاورند:

  1. ساختاردهی نسخه های وبسایت
  2. استفاده از کیووردهای LSI

1 – ساختاردهی نسخه وبسایت: LSI تاکید بسیار شدیدی برروی کیفیت و سازمان دهی نسخه وبسایت شما دارد. هر چیزی از تگ های H1 گرفته تا زبان بدن به کار رفته در عکس های محتوای شما (!) می تواند برروی رتبه موتورهای جستجو اثر داشته باشد.

شما می توانید بدن محتوایتان را برای سئو را با استفاده از درک تاثیر هر فاکتور برروی رتبه دهی وب سایت، ساختار دهی کنید. مثل همیشه، لیست بلند بالایی از مواردی که می توانید بهینه سازی کنید وجود دارد، اما دو مورد از مهمترین مواردی که توجه به آنها می تواند موفقیت کوتاه مدت شما را تضمین کنند شامل کلمات بولد شده و کلمات کج شده که اهمیت بیشتری دارند و استفاده از مترادف های کیووردها برای افزایش ارزش محتوا و ارتباط صفحه می شوند.

2 – استفاده از کیووردهای LSIشرکت دادن کیووردها و عبارات LSI در محتوای وبسایت شما حیاتی ترین معیار برای ایجاد تاثیر جهشی مثبت برروی استراتژی سئوی شما دارد. ما دو مدل کیوورد های LSI داریم؛ کیووردهای مترادف و کلمات و عبارات مرتبط.

مزایای LSI

فهرست بندی معنایی نهفته کلمات به هیچ وجه با دنیای موتورهای جستجو بیگانه نیست، اما برای بسیاری از بازاریابان و سئوکاران در صندلی های عقبِ عقب قرار دارد. (اولویت های آخر) به همین دلیل، تعداد خیلی کمی از مردم می دانند که چطور محتوای خود را بر اساس LSI بهینه سازی کنند. این چیز خوبی است! این بدین معنیست که کسانی که برای پیاده سازی و اعمال تاکتیک های LSI در استراتژی سئوی خود وقت می گذارند، خط مقدم سئو را رهبری می کنند.

اگر همچنان متقاعد نشده اید که LSI یکی از بهترین متدها برای افزایش عملکرد سئوی شماست، به این لیست مفصل از مزایای استفاده از تکنیک های LSI نگاهی بیاندازید:

  • اصلاح پروسه ی فهرست بندی برای بهبود نحوه دید موتورهای جستجو به مقالات
  • سایت هایی که از کیووردهای LSI استفاده می کنند با افزایش ترافیک و رتبه بهتر مواجه می شوند
  • افزایش پتانسیل سودآوری بیشتر
  • بلاک کردن تلاش ربات ها برای شناسایی محتوای شما به عنوان اسپم
  • آسان کردن کار موتورهای جستجو جهت تطابق کوئری جستجوشده با نتایج دقیق از طریق فراهم کردن ارتباط میان ساختار و مفهوم محتوا
  • محتوا را سریع تر به دست جستجوکننده می رساند
  • اعتبار بلاگ و وبسایت شما را بالا می برد
  • نرخ پرش وب سایت را کاهش می دهد
  • فراهم کردن یک متد برای درک روابط میان کلمات، عبارات و کیووردهایی که ترافیک ارگانیک هدفمند را ایجاد می کنند

استاد شدن در قوانین LSI کار ساده ایست. تمام این موضوع بستگی به مفهوم متن و مرتبط ساختن اعضای محتوا دارد.

اگر در مورد قهوه می نویسید، عنوان صفحه شما بهتر است شامل چیزی در مورد قهوه باشد. از عبارت کیوورد شما ” یک کیسه قهوه ” باشد، باید مترادف ها، کلمات مرتبط و عبارات مرتبط به صورت مساوی در محتوای شما پخش شده باشد که هم راستا با پروسه ی زبان طبیعی باشند.

منبع: آکادامی دیجیتال مارکتینگ