پروژه های پژوهشی و تحقیقاتی دانشگاه ها با موضوع :کاربرد داده کاوی در کشف ...

۴۹۰٫۸۳۱٫۵۸۰

۱۱/۰

۵/۲۸۹۹

منطقه ۲۲

۱۱۳٫۲۶۲

۸۱۵٫۸۶۱٫۱۰۰

۱۱/۰

۳/۷۲۰۳

همان طور که مشاهده می شود منطقه ۱۲ با سرانه تماس ۰٫۲۵ درصد، بیشترین نرخ تماس را نسبت به جمعیت ساکن در مقایسه با مناطق دیگر داراست. پس از منطقه ۱۲، منطقه ۶ با سرانه تماس ۰٫۲۰ درصد رتبه دوم را دارد. این در حالی است بدون منظور نمودن عامل جمعیت بیشترین تعداد تماس در طول سال ۸۹ متعلق به منطقه ۴ می باشد.
با مقایسه سرانه تماس و سرانه اعتبار مصوب عمرانی در هر منطقه در می یابیم؛ منطقه ۱۲ با دارا بودن بیشترین سرانه تماس در سال۸۹ ، بعد از منطقه ۲۲ بیشترین سرانه اعتبار مصوب عمرانی(بودجه) را نیز داراست. اگرچه این نسبت در مورد تعدادی از مناطق، نظیر مناطق ۱، ۱۲، ۱۳، ۱۴، ۱۵، ۱۶، ۱۷ به خوبی رعایت شده اما در مورد سایر مناطق به نظر می رسد عامل سرانه اعتبار مصوب متناسب با سرانه تماس نیست.
نمودار زیر رابطه بین جمعیت ساکن در هر منطقه، تعداد تماس و میزان اعتبار مصوب عمرانی در آن منطقه را به شکل حبابی به تصویر کشیده است:
شکل۴-۳: رابطه میان تعداد تماس، جمعیت و اعتبار مصوب عمرانی
همان طور که در شکل مشخص است محور افقی جمعیت منطقه، محور عمودی تعداد کل تماس ها در هر منطقه و اندازه هر حباب میزان اعتبار مصوب عمرانی در آن منطقه می باشد. نتایج قابل تفسیر از این نمودار در فصل بعد آورده شده است.
تحلیل داده ها با بهره گرفتن از تکنیک های داده کاوی
یکی از بهترین روش هایی که می تواند به منظور تحلیل داده های حجیم، با هدف کشف دانش، مورد استفاده قرار بگیرد، داده کاوی است. همان طور که در فصل اول گفته شد؛ داده کاوی با پردازش جامع داده ها و انجام فرایند تصمیم سازی از طریق استخراج دانشِ با ارزش از داده، تصمیم گیری را برای مدیران سازمان تسهیل می نماید. بر اساس نتایج به دست آمده از این تحلیل ها می توان وقایع و مشکلاتی که ممکن است در آینده گریبان شهر را بگیرد پیش بینی کرد و آماده ی مقابله با این مشکلات شد و در نتیجه در جهت افزایش رضایتمندی شهروندان گام برداشت.

(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))

تکنیک های اصلی تحلیل‌های صورت گرفته در این فصل عبارتند از:

خوشه بندی

پیش بینی

قوانین وابستگی

مدل خطی تعمیم یافته

در اجرای تکنیک های داده کاوی از نرم افزار Clementine12 استفاده شده است. دلیل استفاده از این نرم افزار، توانایی آن در پردازش مجموعه های داده ای بزرگ و متداول بودن آن در میان کاربران است. در بخش آماده سازی داده ها، رسم نمودارها و جداول از نرم افزارهایی نظیر Sql server 2008، Excel 2007 و Spss 16 استفاده شده است.
لازم به ذکر است موضوعات آورده شده در ذیل، جهت تحلیل از طریق تکنیک های داده کاوی، همگی بر اساس نوع و کیفیت داده های در دسترس انتخاب شده است. بدیهی است در صورت دسترسی به دیگر داده های شهری، گستره ی انتخاب موضوع بسیار وسیع تر و متنوع تر خواهد گردید به گونه ای که حضور کارشناسان شهری و متولیان سامانه ۱۳۷ جهت انتخاب اولویت موضوع ضروری خواهد بود.
شناسایی مناطق همگن از منظر سامانه ۱۳۷
یکی از پارامترهای موثر در ارزیابی مناطق شهرداری، ارزیابی عملکرد این مناطق از دیدگاه سامانه ی مدیریت شهری ۱۳۷ می باشد. به این ترتیب که هر منطقه با توجه با شاخص هایی نظیر میزان پیام های دریافتی، سرعت و صحت انجام پیام، شرایط محیطی و جغرافیایی منطقه و … مورد ارزیابی قرار می گیرند.
اگرچه در ارزیابی مناطق به ترتیبی که در بالا بیان شد، تصویری نسبتاً کامل از وضعیت هر منطقه از منظر عملکرد آن در بخش رسیدگی به مشکلات و معضلات شهری به دست می آید، اما همگنی مناطق در میزان آمادگی و آگاهی آنان در اعلام مشکل از طریق سامانه ۱۳۷ در هیچ یک از تحلیل ها مورد توجه قرار نمی گیرد. در این بخش سعی داریم به شناسایی مناطق همگن از منظر سامانه ۱۳۷ بپردازیم. دانستن این نکته به مدیران شهری در ترسیم تصویری بزرگ تری^[۶۱] از سیمای شهر کمک می کند. مدیران می توانند بر اساس میزان مشابهت و تفاوت مناطق، بسته های سیاستی – نظارتی خاص آنان را طراحی کنند تا به نیاز این مناطق در پاسخگویی به معضلات شهری موثرترین اقدام صورت پذیرد.
همان طور که در فصل دوم شرح داده شد، هنگامی که بخواهیم یک جمعیت نامنظم را به زیر گروه های منظم تقسیم کنیم در حالی که برچسب از پیش تعریف شده ای برای این کار نداریم، از خوشه بندی یا تحلیل خوشه ای استفاده می کنیم.
در این بخش به منظور شناسایی مناطق همگن از منظر نوع تماس‌ها یا نوع مشکلاتی که شهروندان از طریق سامانه ی ۱۳۷ با شهرداری تهران مطرح نموده اند از تحلیل خوشه بندی مناطق با بهره گرفتن از روش خوشه بندی دو مرحله‌ای^[۶۲]استفاده شده است.
علت استفاده از الگوریتم دو مرحله ای، توانایی این الگوریتم در به کارگیری^[۶۳] مجموعه داده های بزرگ و داده های ازنوع mixed است. الگوریتم دو مرحله ای می تواند چندین راهکار خوشه ای را تست کرده و بهترین را انتخاب نماید، بنابراین نیازی به تعیین تعداد خوشه های خروجی نیست. هم چنین قادر به شناسایی و حذف خودکار داده های پرت می باشد.
همان طور که در فصل قبل شرح داده شد هر یک از تماس های مشتریان ذیل یکی از گروه های تماس از پیش تعیین شده طبقه بندی می شود. هر گروه در واقع تبیین کننده یک نوع مشکل می باشد. مشکلات موجود در بانک اطلاعاتی سامانه ۱۳۷، در ۵۱ نوع طبقه بندی می شود. آماده سازی اولیه داده ها به ترتیبی که در فصل قبل به آن اشاره شد، منجر به حذف تعدادی از گروه های تماس گردید و در نهایت ۲۵ گروه که نشان دهنده ۲۵ نوع از مشکلات و معضلات شهری می باشد باقی ماند که در مرحله ی تحلیل توصیفی داده ها به تفصیل به شرح و فراوانی آن پرداخته شد.
با توجه به این که متغیر ورودی برای خوشه بندی گروه های تماس بود، بنابراین با انجام پردازش بر روی داده های خام به ترتیبی که در ادامه به آن اشاره می شود، داده ها برای استفاده در نرم افزار آماده سازی نهایی شدند. اقدامات انجام شده در این بخش عبارتند از:

ماتریسی از داده ها تهیه شد که در آن سطر ها نشان دهنده مناطق و ستون‌ها نشان دهنده گروه های تماس بودند و هر عنصر ماتریس نمایانگر فراوانی تماس‌های گرفته شده یک منطقه خاص ذیل هریک از گروه های تماس. برای تهیه این ماتریس از ابزار Pivot در نرم افزار اکسل استفاده شد.

سپس با تقسیم عناصر هر سطر از ماتریس بر جمعیت منطقه، سرانه ی تماس‌های مربوط به هر منطقه محاسبه شد.

همان طور که بیان شد، برای خوشه بندی از تکنیک دو مرحله‌ای در نرم افزار Clementine استفاده شده است. تعداد بهینه خوشه‌ها، به صورت اتوماتیک و با بهره گرفتن از شاخص فاصله ی اقلیدوسی توسط نرم افزار مشخص شده است. برای یافتن فاصله اقلیدوسی بین X و Y ابتدا باید تفاوت مولفه های متناظر X و Y را پیدا کرد و آن ها را به توان ۲ رساند. فاصله برابر است با جذر مجموع تفاوت هایی که به توان ۲ رسیده اند(شهرابی ۱۳۹۰).
در این تحقیق تعداد حداقل و حداکثرخوشه‌ها به صورت پیش فرض به ترتیب برابر ۲ و ۱۵ قرار گرفته است. در نهایت با بهره گرفتن از روش دو مرحله ای و اندازه‌های اقلیدسی بین خوشه‌ها، تعداد بهینه خوشه ها برابر ۲ به دست آمد.
همان طور که در فصل دوم بیان شد، معیار اصلی؛ میزان شباهت داده های قرار گرفته در هر خوشه می باشد. در حالی که داده های قرار گرفته در دو خوشه مختلف از نظر شباهت با یکدیگر فاصله زیادی دارند.
پس از اجرای مدل، نتایج نشان داد، ۱۶ منطقه در خوشه اول و ۶ منطقه در خوشه دوم قرار می گیرد.
هر یک از ۱۶ منطقه قرار گرفته درخوشه اول و نیز هریک از ۶ منطقه خوشه دوم از نظر سرانه مشکلات و معضلات شهری با یکدیگر همگن می باشند.
در ادامه بررسی به تاثیر هر کدام از عوامل ( مشکلات) در خوشه بندی می پردازیم. برای خوانایی بیشتر نتایج به دست آمده از این تحلیل را در سه شکل مجزا بررسی شده است. در شکل ۴-۴ میزان اهمیت و تاثیر ۹ عامل اول در خوشه بندی مورد بررسی قرار گرفته است.

شکل۴-۴ بررسی نه عامل اول در خوشه بندی
همان‌طور که مشخص است ۷ عامل از میان ۹ عامل دارای اهمیت معنی‌دار (مقدار احتمال کمتر از ۰٫۰۵) می‌باشند که در شکل با علامت قرمز رنگ مشخص شده اند. این ۷ عامل عبارتند از:
آب گرفتگی و آب افتادگی ،آسفالت ، آسیبهای اجتماعی،اتوبوس، تاکسی، تغییر کاربری، تفکیک و بازیافت
همان‌طور که در شکل نیز مشخص است سرانه ی تماس‌ها در هریک از ۷ نوع مشکل یاد شده در خوشه دوم بیشتر از خوشه اول است. و از این بابت اختلاف معناداری بین آن ها وجود دارد.
در ادامه میزان اهمیت و تاثیر ۹ عامل دوم در بخش بندی مورد بررسی قرار گرفته است. همان‌طور که از شکل ۴-۵ مشخص است ۶ عامل از این میان دارای اهمیت معنی‌دار (مقدار احتمال کمتر از ۰٫۰۵) می‌باشند. این شش عامل عبارتند از: جمع آوری و نصب، حیوانات، درخت، زباله و ضایعات، ساخت و ساز، سد معبر

فرم در حال بارگذاری ...

فید نظر برای این مطلب

شن	یک	دو	سه	چهار	پنج	جم
<< <				> >>
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30

وبلاگ

توضیح وبلاگ من

پروژه های پژوهشی و تحقیقاتی دانشگاه ها با موضوع :کاربرد داده کاوی در کشف ...