ارزیابی دادگان تجمیع رتبهبندی نتایج جستجو از منظر گراف
پذیرفته شده برای ارائه شفاهی ، صفحه 627-638 (12) اصل مقاله (1.05 MB)
نویسندگان
1کارشناسی مهندسی کامپیوتر، دانشکده مهندسی دانشکدگان فارابی دانشگاه تهران
2استادیار گروه مهندسی کامپیوتر، دانشکده مهندسی دانشکدگان فارابی دانشگاه تهران
چکیده
با افزایش اهمیت شبکهها در زندگی امروزه، تحلیل دادگان بر اساس نظریه شبکه به منظور استخراج ویژگیهای پنهان در مجموعه داده، به عنوان یک رویکرد تحقیقاتی جدید، مورد توجه جامعه محققان قرار گرفته است. از سوی دیگر، این روش تحلیل، امکان مقایسه بین مجوعه های داده مختلف را نیز فراهم میآورد. در این پژوهش، دو مجموعه داده تجمیع رتبه بندی نتایج جستوجو یعنی MQ2007-agg و MQ2008-agg، از منظر گراف مورد بررسی قرار گرفته است. برای اینکار، ابتدا دادگان را به وسیله شاخص کندال به گراف شباهت ویژگی تبدیل کرده و ویژگیهایی از جمله اندازه اجزا، طول مسیر، اثر دنیای کوچک، توزیع درجه، قوانین توانی و ضرایب خوشهبندی را برای این شبکهها محاسبه می شود و سپس بررسی تحلیلی ویژگیهای بدست آمده در هر مجموعه داده، صورت گرفته است. نتایج بررسیها نشان می دهد که گراف هیچ کدام از دادگان مورد ارزیابی، از نوع گرافهای بدون مقیاس نبوده و تنها گراف متناظر با مجموعه MQ2007-agg از نوع دنیای کوچک است.
کلیدواژه ها