مقاله با موضوع ، كاوي، كشف، طلا، استخراج، کاوی، مدل‌های، فراگيري

مي‌باشد.
1-2-هدف پایان نامه1 -ساخت بانک داده برای محققانی که در آینده قصد ادامه فعالیت دراین زمینه را دارند.داده‌های مورد استفاده برای تورم و دلار و شاخص کل از سایت بانک مرکزی،داده‌های مربوط به قیمت نفت و طلای جهانی از سایت forexو داده‌های مربوط به طلای ایران از زرگری ها تهیه می‌شود.
2- با توجه به عوامل تاثیرگذار در قیمت ها که ساختار محلی دارند،بررسی روش‌های قبلی در پیش بینی قیمت طلا.
3-شناخت عوامل موثر در قیمت طلای ایران.
4-ارائه مدل‌هایی که با دقت بالا در داخل کشور با توجه به عوامل تاثیر گذار،برای پیش بینی قیمت طلا استفاده می‌شوند.
5-هدف ساخت مدلی است که با دقت بالا بتواند پیش بینی کند،بنابراین ما از روش‌های مختلف همانند رگرسیون و الگوریتم‌های شبکه عصبی بهره خواهیم برد.در ضمن با بررسی روشهای پیش پردازش مثل انتخاب خصیصه مهم را در این راستا خواهیم داشت.
1-3- مراحل انجام تحقیق دراین تحقیق،برای پیش بینی قیمت طلا،همه‌ی عوامل موثر بر پیش بینی قیمت طلا از سال 88 تا اواخر سال 92 گردآوری و مشخصه ها در55 فیلد مورد بررسی قرار می‌گیرند. آنالیز‌های اولیه روی داده‌های اولیه انجام شده و روی داده ها عملیات مرتب سازی و پاکسازی اعمال شده و سپس الگوریتم‌های متداول در شناسایی مشخصه‌های مهم و مدل‌های پیش بینی مورد یررسی قرار گرفته و در نهایت بازنگری و ارائه راهکار مناسب مورد مطالعه قرار می‌گیرد.
1-4 – ساختار پايان نامه اين پايان نامه در پنج فصل تنظيم شده است. در فصل اول مقدمه، ضرورت، اهميت و اهداف پیش بینی قیمت طلا، هدف پايان نامه و مراحل انجام تحقيق بيان گرديد. فصل دوم شامل ادبيات موضوع و مباني نظري در زمينه پیش بینی قیمت طلا مي پردازد و مزايا و معايب روش‌‌های موجود بررسي مي گردد. در فصل سوم،عوامل موثر بر پیش بینی قیمت طلا مورد بررسی قرار می‌گیرد.در فصل چهارم، راهكار پيشنهادي ارائه شده و مراحل مربوط به آن به تفضيل بيان مي گردد. فصل پنجم، حاوي جمع بندي مطالب مطرح شده، نتيجه گيري و پيشنهاداتي براي پژوهش‌‌های آينده مي باشد. منابع مورد استفاده در اين پايان نامه نيز در يك فصل جداگانه در انتهاي پايان نامه قرار دارند.

فصل دوم2- ادبيات موضوع و مباني نظري تحقيق2-1-مقدمه هدف اين فصل آشنايي با داده كاوي، فراگيري ماشين، فرايند داده كاوي ابزارها و تكنيك‌‌های داده كاوي روشهاي داده كاري و بررسي پژوهشي كارهاي انجام شده در زمينه پیش بینی قیمت طلا است.
2-2-رويكرد ماشين و داده كاوي عصر حاضر،عصر انفجاراطلاعات است. اطلاعات فراواني در قالب پايگاه‌‌های داده ذخيره شده است كه تبديل آن ها به دانش با استفاده از ابزارهاي جديد و فرآيند تحليل، تفسیر داده ها و نتيجه گيري را تسهيل مي نمايد به منظور تسهیل فرآيندتصمیم گیری، سیستم ها بايد به دانش لازم و قابليت تصميم گيري براساس داده ها تجهيز شوند جهت دستيابي به اين هدف محققان به ارائه ايده‌‌های جديد از فراگيري ماشين پرداخته اند، با توجه به اين ايده ها وظيفه فراگيري ماشين، تبديل داده ها (ورودي) به دانش (خروجي) خواهد بود. همچنين براساس اين ايده ها ضرورت پيدايش يك حوزه تحقیقاتی جديد كه داده كاوي نام گرفته به وجود آمده است. (Michalski et al 1998).
به عنوان يك ابزار تحليل داده و اهداف داده كاوي براي آشكار كردن روندها يا الگوهایي كه تاكنون ناشناخته بودند يا بنا كردن روابطي در مجموعه‌‌های داده بزرگ براي كمك به تصميم گيرندگان براي گرفتن تصميمات بهتر است كه اين هدف را به وسيله به كارگيري روش‌‌های آماري همچون تحليل لجستيك و خوشه بندي و همچنين با استفاده از روش‌های تحليل داده به دست آمده از رشته‌‌های ديگر همچون شبكه‌‌های عصبي در هوش مصنوعي و درختان تصميم در يادگيري ماشين انجام مي دهند.(Kotl &Gervaise 2008)
داده و اطلاعات يا دانش، يك نقش قابل توجه در فعاليت‌‌های انسان دارد. داده كاوي فرايند كشف دانش توسط تحليل حجم عظيمي از داده از منابع مختلف و تبديل آن به اطلاعات مفيد است به علت اهميت استخراج دانش و اطلاعات از پايگاه داده‌‌های عظيم داده كاوي يك مولفه اساسي در زمينه‌‌های گوناگون زندگي بشر شامل كسب و كار تحصيلات، پزشكي، علم و… شده است.
كشف دانش در پايگاه داده ها اغلب داده كاوي ناميده مي شوند كه به هدف كشف اطلاعات مفيد از مجموعه‌‌های داده است. برنامه‌‌های كاربردي داده كاوي مختلفي به طور موفقيت آميز در حوزه‌‌های مختلفي همچون خدمات درماني، امور مالي، خرده فروشي، كشف تقلب، و تحليل ريسك و…. پياده سازي شده است.(Goel et al 2012).
به اين علت كه ابزارهاي داده كاوي روندها و رفتارهاي آينده را توسط رصد پايگاه داده ها براي الگوهاي نهان پيش بيني مي كنند باعث مي شوند كه سازمان ها تصميمات مبتني بر دانش و فعالانه بگيرند و به سوالاتي كه پيش از اين حل آن ها بسيار زمان بر بود پاسخ دهند. (Ramamohan et al 2012).
داده كاوي يك ابزار مفيد براي كاوش دانش از داده‌‌های حجيم است روش ها و الگوهاي متفاوت در دسترس در داده كاوي هستند. (Patic et al 2012).
داده كاوي يافتن اطلاعات با معاني خاص از يك تعداد زيادي از داده به وسيله بعضي از فناوري ها به عنوان رويه اي براي كشف دانش از پايگاه داده است. كه گام‌‌های آن شامل موارد زير است :
.(Han & kumber 2001).
1- پاكسازي داده ها : حذف داده نويز و ناسازگار
2- يك پارچه سازي داده : تركيب منابع داده ي گوناگون
3- انتخاب داده :يافتن داده مرتبط با موضوع از پايگاه داده
4- تبديل داده : تبدیل داده به شكل مناسب براي كاوش
5- داده كاوي : استخراج مدل‌‌های داده با بهره گيري از تكنولوژي
6- ارزيابي الگو : ارزيابي مدل هایي كه واقعاً براي ارائه دانش مفيد هستند.
7- ارائه دانش : ارائه دانش بعد از كاوش به كاربران به وسيله استفاده از تكنولوژي همچون ارائه بصري. (Lin &yeh 2012).
2-3-فرايند داده كاوي
استانداردهاي مختلفي براي انجام فرايند‌‌های داده كاوي وجود دارد كه معروف ترين استانداردهاي مورد استفاده در اين زمينه استاندارد Crisp-dm مي باشد.
1-تعریف مسئله(Business understanding)
تعریف مسئله شامل تعریف هدف مسئله،ارزیابی شرایط فعلی،تعریف اهداف داده کاوی وایجاد یک برنامه زمان بندی پروژه داده کاوی است.
2-تحلیل داده ها(Data Understanding)
وقتی که هدف مسئله مشخص شد و برنامه ریزی پروژه انجام گرفت،گام تحلیل داده ها نیازمندی‌های داده ای را مورد مطالعه قرار می‌دهد.این مرحله شامل تهیه مجموعه داده‌های اولیه، توصیف داده ها،کنکاش در داده ها و ارزیابی کیفیت داده ها است.کنکاش داده ها شامل مشاهده‌ی پارامتر‌های آماری،می تواند در پایان این فاز نیز اتفاق بیفتد.مدل‌هایی مثل خوشه بندی (clustering)می تواند در طول این گام به منظور شناسایی الگوها در داده ها انجام گیرد.
3-آماده سازی داده ها (Data Preparation)
زمانی که منابع در دسترس داده مشخص شدند،بایستی داده ها از آن انتخاب (Selecting)، پاک (Cleanin) و در قالب مورد نظر ریخته شوند.
همچنین کنکاش عمیق تر داده ها نیز در طول این فاز می‌تواند انجام گیرد.به علاوه ممکن است مدلهای دیگری نیز به کار روند تا بتوان الگوها را براساس تعریف مسئله استخراج کرد.
4-مدل سازی(Modeling)
ابزار‌های نرم افزاری داده کاوی همچون تصویر سازی (Visualization)و تحلیل خوشه بندی برای تحلیل‌های اولیه مفید هستند.ابزار‌هایی مانند شناسایی قوانین عمومی می‌تواند قوانین همبستگی اولیه را استخراج کند.وقتی که فهم بیشتری از داده ها بوسیله‌ی شناسایی الگو که با توجه به خروجی‌های مدل‌های اولیه حاصل می‌شود،افزایش می‌یابد،مدل‌های تخصصی تر بر حسب نوع داده می‌تواند مورد استفاده قرار بگیرد.
در این مرحله تقسیم بندی داده ها به مجموعه داده‌های آموزشی و مجموعه داده‌های آزمون لازم است.
5-ارزیابی(Evaluation)
نتایج مدل‌های استفاده شده در مراحل قبلی بایستی در بستر مسئله تعریف شده و اهداف تعریف شده در مراحل اولیه مورد ارزیابی قرار بگیرد.این کار منجر به شناسایی نیازهای بعدی خواهد شد.این نیازها اغلب شامل بازگشت به مراحل قبلی در فرایند CRISP-DMاست.تعریف مسئله در داده کاوی فرایند تکراری با بازگشت به عقب است که در آن نتایج اقدامات مدل سازی مختلف و تکرار آن ها روابط جدید بین داده ها را به کاربر نشان می‌دهد که باعث درک عمیق تر از مسئله برای کاربر خواهد شد.
6- توسعه(Deployment)
تكميل يك مدل اغلب هدف نهايي نيست بلكه هدف كشف اطلاعات بيشتر از داده است. اطلاعات از داده ي اصلي نياز خواهد داشت كه بيشتر سازماندهي شود و سپس تبديل شود به فرمي كه بتواند براي مشتري استفاده شود. اين اغلب شامل كاربرد مدل‌‌های عملكردي در فرايند‌‌های تصميم گيري سازمان است. اين فاز مي تواند ساده و در عين حال پيچيده باشد كه بستگي به نيازمندي ها دارد. اغلب اين فاز را مشتري به class=’link’>5

متن کامل در سایت homatez.com

About: admin