LSI چیست؟

 

Latent Semantic Indexing یک متد ریاضی است که در سال 1980 به منظور افزایش دقت در بازیابی اطلاعات ارائه شد. این روش از یک تکنیک به نام singular value decomposition برای اسکن داده های بدون ساختار استفاده می کند تا روابط بین مفاهیمی که در آنها وجود دارد را شناسایی کند. در واقع، روابط پنهان (Latent) بین کلمات (Semantic) را کشف می کند تا بتواند درک بیشتری از مفاهیم داشته باشد (Indexing). این متد پیشرفت بزرگی در زمینه درک مطلب بوده که به کامپیوترها کمک کرده تا اصطلاحات بومی زبان را بفهمند، در حقیقت با توجه به اینکه کامپیوتر نمی توانست زبان های مختلف را درک کند این سیستم را پیاده سازی نمودند تا کامپیوتر هم بتواند زبانی که ما صحبت می کنیم را کم و بیش درک نماید.