پایان نامه ارشد رایگان درمورد ادبیات تحقیق، مدل ترکیبی، روش های ترکیبی

دانلود پایان نامه

مینه سیستمهای توصیهگر و با توجه به زمینه اصلی موضوع پایان نامه در رابطه با بهبود و پیادهسازی یک سیستم ترکیبی مبتنی بر شبکه اعتماد، مهمترین اهداف و دستاوردهای این تحقیق عبارتند از:
بررسی نقاط ضعف و قوت مدلهای ترکیبی موجود
ترکیب روش مبتنی بر اعتماد با یکی از روشهای موجود در زمینه پالایش گروهی
پیاده سازی و بهبود مدل TrustWalker[20] به عنوان یک مدل ترکیبی نوین و برتر از طریق ایجاد تغییر در نحوه پیمایش شبکه اعتماد میان کاربران
بهبود دقت پیشبینی امتیازات کاربران به آیتمهای مختلف به کمک پیادهسازی و بکارگیری مکانیزمی جهت تفسیر و تعدیل نظر کاربران
کاهش خطا و افزایش درصد پوشش در زمان ارائه پیشنهاد به کاربران تازه وارد
محاسبه میزان دقیق اعتماد میان کاربران عضو شبکه اعتماد به صورت اعشاری با بکارگیری روشها و دیدگاه های مختلف در این زمینه[19] به جهت افزایش و بهبود دقت و در نظر گرفتن مقدار محاسبه شده بجای مقدار صفر یا یک
پالایش شبکه اعتماد گسترده میان کاربران به نحوی که مدل پیشنهاد شده بر روی داده های کمتری اجرا گردد.

1-9- سوالات و فرضیههای تحقیق

فرضیههای موجود در این تحقیق عبارتند از:
وجود یک شبکه مبتنی بر اعتماد میان کاربران
بیان اعتماد میان کاربران در قالب یک عدد صحیح یا اعشاری در بازه ]1,0[
مبنا و اساس قراردادن پیاده سازی شخصی انجام گرفته از مدل TrustWalker به عنوان یکی از مدلهای برتر در زمینه موضوع تحقیق
اعتماد و تکیه بر نتایج تحقیقات و مقالات معتبر مورد ارجاع قرار گرفته در زمینه سیستمهای توصیهگر مبتنی بر شبکه اعتماد میان کاربران
وجود دادهها و نتایج تحقیقات قبلی صورت گرفته بر روی مجموعه داده Epinions35
سوالات مطرح نیز عبارتند از:
آیا ترکیب روش پالایش گروهی و روش مبتنی بر اعتماد باعث بهبود عملکرد سیستم توصیهگر میگردد؟
آیا عمق پیمایش شبکه اعتماد میان کاربران تاثیری بر روی نتایج دارد؟
آیا بکارگیری روش مبتنی بر آیتم در مقابل روش مبتنی بر کاربر باعث بهبود نتایج میگردد؟
آیا تعدیل و تفسیر نظرات کاربران باعث افزایش دقت و بهبود نتایج میگردد؟
از میان انواع روشهای محاسبه اندازه اعتماد میان کاربران کدام روش نتایج قابل قبولتری را ارائه مینماید؟
ترکیب روشهای موجود چه تاثیری بر روی درصد پوشش خواهد گذاشت؟
وجود شبکه اعتماد میان کاربران تا چه حد به حل مشکل ارائه توصیه به کاربران تازه وارد کمک مینماید؟
چه معیارهایی برای محاسبه تشابه دو کاربر یا دو آیتم مد نظر قرار گیرند؟
ترکیب روش مبتنی بر اعتماد با کدامیک از سایر روشهای موجود در زمینه سیستمهای توصیهگر می تواند باعث بهبود نتایج گردد؟
مکانیزم پیمایش شبکه عظیم میان هزاران کاربر چگونه خواهد بود؟

1-10- مراحل تحقیق

مراحل پیشنهادی برای انجام تحقیق عبارتند از:
بررسی و مطالعه روشهای دادهکاوی مورد استفاده در سیستمهای توصیهگر
مطالعه و بررسی روشها، مدلها و الگوریتم های موجود در زمینه سیستمهای توصیهگر مبتنی بر اعتماد
جستجو و یافتن یکی از مدلهای برتر در زمینه سیستمهای توصیهگر ترکیبی مبتنی بر اعتماد
پیادهسازی مدل انتخاب شده به کمک یکی از زبانهای برنامه نویسی به جهت آشکار شدن نقاط ضعف و قوت آن و بررسی چگونگی امکان بهبود یا تغییر مدل مذکور
جمع آوری و یکپارچه نمودن داده های مربوط به مجموعه دادههای مورد استفاده جهت انجام آزمایشات در یک پایگاه داده مستقل
آنالیز، پالایش و استخراج دادههای مورد نیاز برای انجام آزمایشات از پایگاه داده ایجاد شده
تحقیق و بررسی نتایج مدل پیاده سازی شده با نتایج موجود از تحقیقات قبلی
تلاش در جهت رفع نقایص و بهبود نتایج بدست آمده از طریق انجام اصلاحات در روش پایه یا ترکیب آن با سایر روشهای مطالعه شده
آزمایش میزان دقت، خطا و درصد پوشش مدل جدید با دادههای واقعی، بررسی نتایج، رفع نقایص و تکرار آزمایشات
مدون نمودن نتایج مدل جدید و ارائه علمی آنها
جمع بندی و بحث پیرامون نتایج

1-11- فصول پایاننامه

این پایان نامه در پنج فصل تنظیم و مدون شده است .در ادامه مقدمه که در فصل اول بیان گردید در فصل دوم ادبیات تحقیق مورد استفاده در زمینه سیستمهای توصیهگر، انواع روشها و مدلهای دادهکاوی موجود، با ذکر جزئیات و چگونگی عملکرد آنها و مباحث موجود در خصوص هر کدام از روشها و الگوریتمها تشریح میگردند. در فصل سوم مروری بر سیر تکاملی و تحقیقات گذشته انجام شده در زمینه سیستمهای توصیهگر ترکیبی و مبتنی بر اعتماد و بحث پیرامون نقاط ضعف و قوت آنها مطرح میگردد. در فصل چهارم جزئیات مدل ترکیبی پیشنهادی، مکانیزم الگوریتم و چگونگی عملکرد آن به صورت کامل تشریح میگردد و سعی در بررسی نکات و پاسخگویی به سوالاتی میشود که در این تحقیق به دنبال یافتن راهکار و پاسخی مناسب برای آنها هستیم. در فصل پنجم مجموعه دادههای مورد استفاده جهت انجام آزمایشات معرفی و چگونگی آماده سازی دادههای مورد نیاز جهت انجام آزمایشات بیان میگردند و نتایج بدست آمده از انجام آزمایشات مختلف و اجرای مدل پیشنهادی در شرایط گوناگون جمعآوری و مورد آنالیز، تحلیل و بحث قرار میگیرد و نهایتا در فصل آخر ضمن جمعبندی و ارائه نتایج کلی، پیشنهاداتی نیز برای تحقیقات آینده ارائه خواهد شد.

فصل دوم

مروری بر ادبیات تحقیق و مبانی نظری تحقیق

2- مروری بر ادبیات تحقیق و مبانی نظری تحقیق

2-1- مقدمه

در سالهای اخیر از تکنیکها و روشهای مختلف آماری، دادهکاوی، هوش مصنوعی و الگوریتمهای ریاضی در پیادهسازی سیستمهای توصیهگر استفاده شده است که از معروفترین و مهمترین این روشها و تکنیکها می توان به روش پالایش گروهی، پالایش محتوایی، گرافکاوی، روشهای مبتنی بر اعتماد و روش های ترکیبی نام برد .
در ادامه به تفصیل به معرفی و شرح هر کدام از روشهای فوق پرداخته میشود و نحوه کاربرد، نقاط ضعف و قوت آنها بیان میگردد. روشها و مدلهای فوق به صورت کلی به دو دسته مبتنی بر مدل36 و مبتنی بر حافظه37 تقسیم بندی میگردند که به لحاظ سرعت، هزینه اجرا، دقت، تک هدفی یا چند هدفی بودن، در نظر گرفتن نیازهای کوتاه مدت و بلند مدت کاربران با یکدیگر تفاوت دارند و هریک در پارهای از موضوعات کاربرد مناسبتر و راندمان بهتری دارند.
از میان روشهای فوق روش پالایش گروهی و پالایش محتوایی از سابقه نسبتا زیادی برخوردار میباشند و تحقیقات بسیار زیادی توسط محققان در خصوص موضوعات مرتبط با آنها، بهبود و بکارگیری در محیطهای مختلف مطرح گردیده است و بخش عمده ای از مطالب را به خود اختصاص میدهند، اما در مقابل، موضوع سیستمهای توصیهگر مبتنی بر اعتماد به تازگی مورد توجه محققان قرار گرفته است و از سابقه نسبتا کمی برخوردار است لذا به نسبت روشهای پیشین، تحقیقات اندکی در این حوزه صورت گرفته است و حجم اندکی از تحقیقات را به خود اختصاص می دهد. در ادامه، در هریک از بخشها به بررسی و مطالعه یکی از این روشها پرداخته می شود.

2-2- پالایش گروهی (Collaborative Filtering)

پالایش گروهی از بررسی رفتار گذشته کاربران و تشابه آنها با یکدیگر مدلی ایجاد مینماید[21] و سپس از آن مدل برای پیشبینی آیتمهای مورد علاقه کاربر یا پیشبینی امتیازدهی یک کاربر به یک آیتم خاص استفاده مینماید. این روش در واقع سعی در مدل نمودن پروسه اجتماعی نظرخواهی از دوستان و توجه به توصیههای آشنایان و اطرافیان دارد. یکی از مزایای اصلی این روش عدم وابستگی به محتوای قابل آنالیز به صورت مکانیزه میباشد و بنابراین بدون نیاز به داشتن اطلاعات کافی و درک دقیق از ماهیت یک آیتم پیچیده همچون “فیلم” امکان ارائه پیشنهاداتی در زمینه فیلم را دارا می باشد.
رفتار گذشته کاربر می تواند شامل تراکنشهای گذشته کاربر یا نظرات بیان شده وی در خصوص یک محصول خاص باشد، به عنوان مثال کاربر x به 4 فیلم امتیاز 5 را اختصاص داده است، یک سیستم توصیهگر با تکیه بر شیوه پالایش گروهی، اطلاعات در دسترس را پردازش میکند و کلیه کاربرانی را که به همان 4 فیلم امتیاز 5 را اختصاص دادهاند را جستجو نموده و لیست سایر فیلمهای مورد علاقه ایشان را به کاربر x توصیه میکند.
دیاگرامی از چگونگی کارکرد روش پالایش گروهی در شکل2-1 نشان داده شده است. همان طور که در تصور قابل مشاهده است سطرهای ماتریس m×n نشان دهنده کاربران و ستونها بیانگر آیتمها میباشند و هر سلول ماتریس بیانگر امتیازی است که توسط کاربر m به آیتم n داده شده است. مقدار هر سلول عددی در بازه ]5,1[ می باشد که مقدار 0 بیانگر این است که کاربر به آیتم مورد نظر امتیازی تخصیص نداده است [22].

شکل 2-1 : چگونگی کارکرد روش پالایش گروهی (Collaborative Filtering)[22]

پالایش گروهی خود به دو روش “مبتنی بر همسایگی38” و “مبتنی بر مدل39” تقسیمبندی میگردد. در اصطلاح رایج مدل “مبتنی بر همسایگی” به عنوان مدل “مبتنی بر حافظه40” نیز مورد ارجاع قرار می گیرد [23].

2-2-1- پالایش گروهی مبتنی بر حافظه(Memory Based)

در این تکنیک زیر مجموعهای از کاربران بر اساس تشابه آنها با کاربر مقصد انتخاب میگردند و ترکیبی وزندار41 از مجموعه نظرات ایشان، پیشنهاد مورد نظر کاربر مقصد را تولید میکنند. روند این تکنیک را می توان مطابق مراحل زیر بیان نمود[24]:
به تمامی کاربران بر اساس میزان تشابه آنها با کاربر مقصد وزنی تخصیص مییابد.
تعداد n کاربر که دارای بیشترین تشابه با کاربر مقصد میباشند انتخاب میگردد که به این مجموعه “همسایگان” گفته میشود.
از ترکیب وزندار نظرات کاربران مجموعه همسایگی، پیش بینی نظر کاربر مقصد در خصوص یک آیتم محاسبه میگردد.
در مرحله اول وزن wa,u بیانگر میزان تشابه میان کاربر مقصد a و کاربر u می باشد. متداولترین روش محاسبه تشابه استفاده از فرمول “پیرسون42” می باشد[25] که در ذیل این فرمول قابل مشاهده می باشد .
(1)

در این فرمول I مجموعه آیتمهایی میباشد که هر دو کاربر مشترکا به آنها امتیاز دادهاند و ru,i امتیازی می باشد که توسط کاربر u به آیتم i داده شده است و r ̅_u میانگین امتیازات کاربر u به مجموعه آیتمهای مجوعه I میباشد.
در مرحله سوم امتیازی که توسط کاربر مقصد a به آیتم i داده خواهد شد با متغیر Pa,i نشان داده میشود و جهت محاسبه آن، از میانگین وزنی انحراف از میانگین نظرات مجموعه همسایگان استفاده میگردد که این امر در فرمول شماره 2 قابل مشاهده میباشد.
(2)

در این فرمول wa,u مقدار تشابه میان کاربر a و u می باشد و K مجموعه کاربران موجود در مجوعه همسایگی می باشند. محاسبه تشابه بر اساس فرمول پیرسون بر اساس وجود وابستگی خطی میان دو متغیر عمل می نماید.
از دیدگاه دیگر می توان امتیاز داده شده توسط دو کاربر را به عنوان
دو بردار در یک فضای m بعدی در نظر گرفت و تشابه میان دو کاربر را بر اساس کسینوس زاویه میان این دو بردار محاسبه نمود[26] در فرمول شماره 3 نحوه محاسبه این روش بیان شده است.
(3)

بر اساس قوانین حاکم بر فرمولهای ریاضی، در زمان محاسبه تشابه دو کاربر بر اساس فرمول تشابه کسینوسی، امتیاز یک کاربر به یک آیتم نمیتواند منفی باشد و امتیاز آیتمهایی که به آنها توسط کاربر امتیازی تخصیص داده نشده است صفر در نظر گرفته میشود. مطالعات تجربی[21] نشان داده است که دقت فرمول پیرسون در محاسبه تشابه از دقت فرمول کسینوسی بیشتر است. روشهای محاسبه تشابه دیگری نیز در تحقیقات مختلف بیان شده است که می توان به پارهای از آنها اشاره نمود[27][28]:
Spearman rank correlation
Kendall’s τ correlation
mean squared differences
entropy
adjusted cosine similarity

2-2-1-1- روش پالایش گروهی مبتنی بر آیتم43

بکارگیری روش پالایش گروهی مبتنی بر حافظه در شرایطی که در محیطهای واقعی میلیونها کاربر و آیتم وجود دارد به دلیل پیچیدگیهای محاسباتی جستجوی کاربران مشابه، از بازده مناسبی برخوردار

این نوشته در پایان نامه ها ارسال شده است. افزودن پیوند یکتا به علاقه‌مندی‌ها.

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *