
چکیده:
این پروژه به طور کلی به بررسی تکنیکهای Document Clustering
که به طور گسترده استفاده شده است می پردازد.ما با استفاده از مدل فضای
برداری از طریق تکامل آن و گسترش به دیگر مدل های پیچیده تر و آماری صدا
آغاز می کنیم. ما جزئیات دو مدل ، مخلوطی از Von Mises-Fisher و Latent Dirichlet Allocation
را از آنجاییکه در سال های اخیر توجه گسترده ای را با توجه به عملکرد خوب
خود را بیش از سایر مدل ها داشته اند مقایسه می کنیم. در نهایت میبینیم
آزمایشهای بیشتر نیازمند موضوع یا اشیا دیگر است.