ارزیابی دادگان تجمیع رتبه‌بندی نتایج جستجو از منظر گراف
پذیرفته شده برای ارائه شفاهی ، صفحه 627-638 (12) XML اصل مقاله (1.05 MB)
نویسندگان
1کارشناسی مهندسی کامپیوتر، دانشکده مهندسی دانشکدگان فارابی دانشگاه تهران
2استادیار گروه مهندسی کامپیوتر، دانشکده مهندسی دانشکدگان فارابی دانشگاه تهران
چکیده
با افزایش اهمیت شبکه‌ها در زندگی امروزه، تحلیل دادگان بر اساس نظریه شبکه به منظور استخراج ویژگی‏های پنهان در مجموعه داده، به عنوان یک رویکرد تحقیقاتی جدید، مورد توجه جامعه محققان قرار گرفته است. از سوی دیگر، این روش تحلیل، امکان مقایسه بین مجوعه ‏های داده مختلف را نیز فراهم می‏آورد. در این پژوهش، دو مجموعه داده تجمیع رتبه‏ بندی نتایج جست‌وجو یعنی MQ2007-agg و MQ2008-agg، از منظر گراف مورد بررسی قرار گرفته است. برای این‌کار، ابتدا دادگان را به وسیله شاخص کندال به گراف شباهت ویژگی تبدیل کرده و ویژگی‌هایی از جمله اندازه اجزا، طول مسیر، اثر دنیای کوچک، توزیع درجه، قوانین توانی و ضرایب خوشه‌بندی را برای این شبکه‌ها محاسبه می‏ شود و سپس بررسی تحلیلی ویژگی‌های بدست آمده در هر مجموعه داده، صورت گرفته است. نتایج بررسی‏ها نشان می‏ دهد که گراف هیچ کدام از دادگان مورد ارزیابی، از نوع گراف‌های بدون مقیاس نبوده و تنها گراف متناظر با مجموعه MQ2007-agg از نوع دنیای کوچک است.
کلیدواژه ها