پروژه بهینه سازی خوشه ها با استفاده از الگوریتم های تکاملی برای شخصی سازی وب
عنوان : بهینه سازی خوشه ها با استفاده از الگوریتم های تکاملی برای شخصی سازی وب تعداد صفحات : 82 چکیده: گرانبارشدن اطلاعات یک مشکل عمده در وب کنونی به شمار میرود. برای مقابله با اینمشکل، سیستمهای شخصی سازی وب ارائه شده اند که محتوا و سرویس های یکوب سایت را با افراد براساس علایق و رفتار گردشی آنها سازگار میکنند. یکمؤلفهی اساسی در هر سیستم شخصیسازی وب، مدل کاربر آن است. هدف از شخصیسازی وب، مهیا ساختن محتوا و سرویس های مورد نیاز کاربران به وسیله دانشبه دست آمده از تعاملات قبلی کاربران در صفحات وب است. در حال حاضر، برایشخصی سازی وب چندین متد خوشه بندی در دسترس است. روشهایی که تاکنونارائه شده اند، در مواردی دارای اشکالاتی بودند. البته تکنیک های جدیدیدر رفع این مشکلات و بهبود آنها ارائه شده است. اما در بیشتر این تکنیکها،مسائل افزونگی داده و مقیاس بندی بالا وجود دارد. با توجه به اینکهافزایش کاربران وب منجر به افزایش اندازهی خوشه میگرد، نیاز بهبهینهسازی خوشهها اجتنابناپذیر خواهد بود. در تحقیق، یک متدولوژی بهینهسازی خوشه بر اساس سیستم فازی ارائه شده است. به منظور افزایش دقت نهاییخوشه بندی، برای تنظیم پارامترهای توابع عضویت از الگوریتم ژنتیک استفادهشده است. نتایج حاصل از شبیهسازی نشان میدهد که روش پیشنهادی دقت خوشهبندی صفحات وب را تا حد قابل توجهی افزایش میدهد.فصل اول: کلیات تحقیق 1-1- مقدمه باتوسعه سیستمهای اطلاعاتی، داده به یکی از منابع پراهمیت سازمانها مبدلگشته است. بنابراین روشها و تکنیکهایی برای دستیابی کارا به داده، اشتراکداده، استخراج اطلاعات از داده و استفاده از این اطلاعات، مورد نیازمیباشد. با ایجاد و گسترش وب و افزایش چشم گیر حجم اطلاعات، نیاز به اینروشها و تکنیکها بیش از پیش احساس میشود. وب، محیطی وسیع، متنوع و پویااست که کاربران متعدد اسناد خود را در آن منتشر میکنند. در حال حاضر بیشاز دو بیلیون صفحه در وب موجود است و این تعداد با نرخ 7.3 میلیون صفحه درروز افزایش مییابد. با توجه به حجم وسیع اطلاعات در وب، مدیریت آن باابزارهای سنتی تقریباً غیر ممکن است و ابزارها و روشهایی نو برای مدیریتآن مورد نیاز است. به طور کلی کاربران وب در استفاده از آن با مشکلات زیرروبرو هستند: 1-یافتن اطلاعات مرتبط: یافتن اطلاعات مورد نیاز در وب دشوار میباشد.روشهای سنتی بازیابی اطلاعات که برای جستجوی اطلاعات در پایگاه دادهها بهکار میروند، قابل استفاده در وب نمیباشند و کاربران معمولاً از موتورهایجستجو که مهمترین و رایج ترین ابزار برای یافتن اطلاعات در وب می باشند،استفاده میکنند. این موتورها، یک پرس و جوی مبتنی بر کلمات کلیدی از کاربردریافت کرده و در پاسخ لیستی از اسناد مرتبط با پرس و جوی وی را که براساس میزان ارتباط با این پرس و جو مرتب شده اند، به وی ارائه میکنند. اماموتورهای جستجو دارای دو مشکل اصلی هستند (Baeza-Yates, 2004). اولاً دقتموتورهای جستجو پایین است، چراکه این موتورها در پاسخ به یک پرس و جویکاربر صدها یا هزاران سند را بازیابی میکنند، در حالی که بسیاری از اسنادبازیابی شده توسط آنها با نیاز اطلاعاتی کاربر مرتبط نمیباشند (Bharat,and et. al., 2001). ثانیاً میزان فراخوان این موتورها کم میباشد، به آنمعنی که قادر به بازیابی کلیه اسناد مرتبط با نیاز اطلاعاتی کاربر نیستند.چرا که حجم اسناد در وب بسیار زیاد است و موتورهای جستجو قادر به نگهداریاطلاعات کلیه اسناد وب، در پایگاه دادههای خود نمیباشند (Chakrabarti,and et. al., 1999). 2-ایجاد دانش جدید با استفاده از اطلاعات موجود در وب: در حال حاضر این سوالمطرح است که چگونه میتوان دادههای فراوان موجود در وب را به دانشی قابلاستفاده تبدیل کرد، به طوری که یافتن اطلاعات مورد نیاز در آن به سادگیصورت بگیرد. همچنین چگونه میتوان با استفاده از دادههای وب به اطلاعات ودانشی جدید دست یافت. 3-خصوصی سازی اطلاعات: از آن جا که کاربران متفاوت هر یک درباره نوع ونحوهی بازنمایی اطلاعات سلیقه خاصی دارند، این مسئله باید توسط تأمینکنندگان اطلاعات در وب مورد توجه قرار بگیرد. برای این منظور با توجه بهخواستهها و تمایلات کاربران متفاوت، نحوه ارائه اطلاعات به آنها بایدسفارشی گردد. تکنیکهای وب کاوی قادر به حل این مشکلات میباشند (Chakrabarti, 2000). 2-1- تعریف مسئله وببه یک بخش تسلیم نشدنی جهان تبدیل شده است و گشت و گذار وب، یک فعالیت مهمبرای مشتریانی که خرید آنلاین دارند، به شمار میآید (Varghese, 2012).همانطور که گفته شد، با توجه به حجم وسیع اطلاعات در وب، مدیریت آن باابزارهای سنتی تقریباً غیر ممکن است و ابزارها و روشهایی نو برای مدیریتآن مورد نیاز است. یکی از این روشها وبکاوی است. به طور کلی وبکاوی رامیتوان داده کاوی بر روی دادههای محتوا، ساختار و کاربرد وب به حسابآورد. هدف وبکاوی کشف مدلها و الگوهای نهفته در منابع وب میباشد. هدف وبکاوی کاربرد وب به طور خاص کشف الگوهای رفتاری کاربران وب میباشد. کشفچنین الگوهایی از حجم عظیمی از دادههای تولید شده توسط وب سرورهاکاربردهای مهمی دارد (Anand, and Mobasher, 2005). از جملهی آنها میتوانبه سیستم هایی که میزان مؤثر بودن یک سایت را در برآوردن انتظارات کاربرارزیابی میکنند، تکنیک هایی برای متعادل کردن پویای بار و بهینهسازی وبسرورها برای دستیابی مؤثرتر کاربران و کاربردهای مربوط به ساختاردهی مجدد وتطبیق یک سایت براساس نیازهای پیش بینی شدهی کاربر اشاره کرد. کشفاستخراج اطلاعات مفید از دادهی وب یا فایلهای وبلاگ، بهبود کاراییاطلاعات وب و فراهم کردن تکنولوژی برای کاربردهای وب به عنوان مثال،شخصیسازی و غیره از جمله اهداف دیگر وبکاوی میباشد. برای مدیریتتصمیمگیری، نتیجه کاوش کاربرد وب میتواند برای تبلیغات، بهبود طراحی وب،بهبود رضایت مشتری، هدایت استراتژی تصمیم آنالیز بازار و سازمان مورداستفاده قرار گیرد (Naveena Devi et al., 2012). درسال های اخیر تکنیکهای وبکاوی کاربرد وب به عنوان رویکردی دیگر که مبتنیبر کاربر است در شخصیسازی وب ارائه شده است که برخی از مشکلات مربوط بهفیلترکردن جمعی را کاهش میدهد. به طور خاص وب کاوی کاربرد وب برای افزایشگسترشپذیری سیستم های شخصیسازی شدهی سنتی که برمبنای تکنیکهایفیلترکردن جمعی میباشند استفاده شده است. شخصیسازیصفحه وب شامل خوشهبندی صفحات مختلف وبی است که الگوی مشابهی دارند.شخصیسازی وب از تکنیک کاربرد وب کاوی برای سفارشی کردن صفحات وب برای یککاربر خاص استفاده میکند. این مسئله شامل استخراج جلسات کاربر از فایلهایورود به سیستم میشود. یک جلسه کاربر، دنبالهی صفحات وبی که توسط کاربردر یک دوره زمانی خاص مورد دسترسی قرار گرفته، میباشد.3-1- اهمیت و ضرورت تحقیق بارشد ناگهانی اندازه وب و استفاده از وب گسترده جهانی، برای کاربران بسیارمشکل شد که بتوانند به طور مؤثر به اطلاعات مرتبط و مورد علاقه خود دسترسیپیدا کنند. نیاز به پیشبینی نیازهای کاربر به منظور بهبود قابلیت استفاده وحفظ کاربر سایت، آشکار است و میتواند با استفاده از شخصیسازی آدرسدهیشود. شخصیسازی وب، پردازشی از یک سایت برای بر طرف کردن نیاز یک کاربر خاصیا مجموعهای از کاربران با استفاده از دانش به دست آمده از طریق تحلیلرفتار گشت و گذار کاربر است. هدف از سیستم شخصی سازی وب، مهیا ساختناطلاعات و نیازهای کاربران، بدون این که صریحاً از آنها سوالی پرسیده شود. هراقدامی که اطلاعات یا سرویسهای فراهم شده توسط یک وبسایت با نیازهای یککاربر یا گروه خاصی از کاربران با به کارگیری دانش بدست آمده از رفتارگردشی کاربر و علایق خاص او به صورت ترکیب با محتوا و ساختار وبسایتسازگار میکند شخصی سازی وب نامیده میشود (Eirinaki, 2003). بطور کلی اهداف شخصی سازی وب عبارتند از: –شخصی سازی سرویسهای ارائه شده توسط یک وبسایت نقش مهمی در کاهش گرانبارشدن اطلاعات ایفا میکند و وبسایت را به یک محیط کاربر پسندتر برای افرادتبدیل میکند. – با فراهم کردن اطلاعات دلخواه کاربر به روش مناسب و در زمان مناسب، باعث بهبود گردش کاربر در وب سایت میشود. –در تجارت الکترونیکی مکانیزیمی برای درک بهتر نیازهای مشتری، شناساییتمایلات آیندهی او و در نهایت افزایش پابرجایی مشتری به سرویس ارائه شدهفراهم میکند. درسال های اخیر تکنیکهای وبکاوی کاربرد وب به عنوان رویکردی دیگر که مبتنیبر کاربر است در شخصیسازی وب ارائه شده است که برخی از مشکلات مربوط بهفیلترکردن جمعی را کاهش میدهند. به طور خاص وب کاوی کاربرد وب برای افزایشگسترش پذیری سیستمهای شخصیسازی شدهی سنتی که برمبنای تکنیکهایفیلترکردن جمعی میباشند استفاده شده است. بهطور نمونه شخصی سازی برروی پردازش شناسایی کاربر وب، جمع آوری اطلاعات ازطریق اولویت یا علاقهمندی های کاربر، تمرکز دارد. به طور مختصر شخصی سازیوب میتواند برای مهیا ساختن سرویس با کیفیت تر استفاده شود و برنامهکاربردی از وب را برای کاربران در طول گشت و گذار آنها در وب مهیا سازد.این فعالیتها می تواند با مشخص کردن لینکها و لینکهای جدید مورد علاقهکاربر به صورت اتوماتیک و ایجاد صفحات ایندکس جدید، ساخته شود. رویکردتنها مبتنی بر کاربرد در شخصیسازی وب یک عیب مهم دارد و آن این است کهفرآیند توصیه به کاربر تنها براساس دادههای تراکنشی موجود او صورت میگیردو از این رو اقلام یا صفحاتی که اخیراً به سایت اضافه شدهاند نمیتوانندبه او توصیه شوند. این مشکل عموماً مشکل قلم جدید نامیده میشود. از سویدیگر اگرچه الگوهای کشف شدهی مربوط به کاربرد منابع وب از طریق وبکاویکاربرد وب در کشف ارتباطات اقلام با یکدیگر یا کاربران با یکدیگر و نیزتعیین شباهت در جلسات کاربر مفیدند اما بدون استفاده از دانش عمیقتری ازدامنهی وب سایت مورد نظر چنین الگوهایی درک اندکی از دلایل آن که چرااقلام یا کاربران در گروه هایی با هم قرار میگیرند در اختیار ما قرارمیدهند. یک رویکرد معمول برای حل این مشکل در فیلتر کردن جمعی آن است کهمشخصات محتوای صفحات را با رتبه بندی ها و قضاوت های کاربر ادغام کنیم.به طور کلی در این رویکردها کلمات کلیدی از محتوای وبسایت استخراج میشوندو برای اندیسگذاری صفحات براساس محتوا یا طبقهبندی آنها به دسته هایمختلف مورد استفاده قرار میگیرند. در حوزهی شخصی سازی وب این رویکرد بهسیستم اجازه می دهد تا صفحات را نه تنها براساس افراد مشابه بلکه براساسشباهت محتوایی آنها به صفحاتی که کاربر اخیراً بازدید کرده است به اوتوصیه کند. یکضعف عمده در بیشتر رویکردهای موجود که از محتوای وب برای بهبود مدل کاربراستفاده میکنند این است که این روشها معمولاً از بردار عبارات برای نمایشعلایق کاربر استفاده میکنند و ارتباطات معنایی بین این عبارات را نادیدهمیگیرند. در صورتی که میتوان با استفاده از معنا این روش نمایش را بهبودداد. روشهاییکه تاکنون ارائه شدهاند، در مواردی دارای اشکالاتی بودند. البتهتکنیکهای جدیدی در رفع این مشکلات و بهبود آنها ارائه شده است. اما دربیشتر این تکنیکها، مسائل افزونگی داده و مقیاسبندی بالا وجود دارد.الگوریتمهای خوشهبندی متعددی براساس تکنیک های مختلف وجود دارد. بیشتراین الگوریتم ها، اشکالات متعددی دارند. همانطور که اندازه خوشه در طیافزایش کاربران وب افزایش مییابد، نیاز به بهینهسازی خوشه ها اجتنابناپذیر خواهد بود. در این پایاننامه قصد بر آنست تا یک متدولوژیبهینهسازی خوشه بر اساس سیستم فازی و الگوریتم ژنتیک ارائه شود. فهرست مطالب: چکیده فصل اول 1-1-مقدمه 1-2-تعریف مسئله 1-3-اهمیت و ضرورت تحقیق 1-4-شیوه پژوهش 1-5-چارچوب پایان نامه مراجع فصل دوم 2-1-مقدمه 2-2-مروی بر کارهای انجام شده مراجع فصل سوم 3-1-مقدمه 3-2-مراحل وب کاوی 3-2-1-انواع وبکاوی 3-3-شخصیسازی وب 3-3-1-دلایل نیاز به شخصیسازی وب 3-3-2-مراحل شخصی سازی وب 3-3-2-1-جمعآوری داده 3-3-2-2-پردازش داده 3-3-2-3-کشف الگو 3-3-2-4-تحلیل دانش 3-3-3-تکنیک های مدلسازی کاربر در شخصیسازی وب 3-3-3-1-تکنیک tf-idf 3-3-3-2-تکنیک متا مدل و ابزار OLAP 3-3-3-3-تکنیک براساس محتوای وب 3-3-3-4-تکنیک براساس فراهم کردن دادههای موثر (ODP)3-3-3-5-شخصیسازی وب با استفاده از روشهای ترکیبی 3-3-3-6-شخصیسازی وب براساس الگوریتم استقرایی و تکنولوژی tf-idf 3-3-3-7-شخصیسازی وب با استفاده از کندوکاو الگوی ترتیبی و درخت الگو 3-4-خوشهبندی برای شخصیسازی وب 3-4-1-خوشه بندی فازی 3-4-1-1-الگوریتم پایهای خوشهبندی فازی 3-4-1-2-الگوریتم فازی کامینز 3-4-1-3-خوشهبندی صفحات وب با استفاده از خوشه بندی فازی k-means 3-4-2-الگوریتم ژنتیک 3-4-2-1-بهینهسازی خوشهبندی فازی با استفاده از الگوریتم ژنتیک 3-4-3-روش پیشنهادی در این تحقیق 3-4-4-شمای کلی سیستم پیشنهادی 3-4-5-مثالی از سیستم پیشنهادی 3-4-6-شبه کد روش پیشنهادی 3-5-جمع بندی مراجع فصل چهارم 4-1-مقدمه 4-2-مجموعه داده ها 4-2-1-دیتاست YANDEX 4-2-1-1-پیش پردازش انجام شده با مجموعه دادههای خام قبل از انتشار 4-3-پارامترهای ارزیابی 4-4-آزمایشات انجام شده 4-4-1-سخت افزار مورد استفاده 4-4-2-نتایج آزمایشات 4-5-جمع بندی مراجع فصل پنجم 5-1-مقدمه 5-2-نتایج و دستاوردهای پروژه 5-3-پیشنهادات مراجع
دانلود فایل پروژه بهینه سازی خوشه ها با استفاده از الگوریتم های تکاملی برای شخصی سازی وب
پروژه بهینه سازی خوشه ها با استفاده از الگوریتم های تکاملی برای شخصی سازی وب,بهینه سازی خوشه ها ,الگوریتم های تکاملی ,شخصی سازی وب,خوشه سازی بهینه