مقاله با موضوع ، کاوی، کشف، طلا، استخراج، کاوی، مدل‌های، فراگیری

می‌باشد.
1-2-هدف پایان نامه1 -ساخت بانک داده برای محققانی که در آینده قصد ادامه فعالیت دراین زمینه را دارند.داده‌های مورد استفاده برای تورم و دلار و شاخص کل از سایت بانک مرکزی،داده‌های مربوط به قیمت نفت و طلای جهانی از سایت forexو داده‌های مربوط به طلای ایران از زرگری ها تهیه می‌شود.
2- با توجه به عوامل تاثیرگذار در قیمت ها که ساختار محلی دارند،بررسی روش‌های قبلی در پیش بینی قیمت طلا.
3-شناخت عوامل موثر در قیمت طلای ایران.
4-ارائه مدل‌هایی که با دقت بالا در داخل کشور با توجه به عوامل تاثیر گذار،برای پیش بینی قیمت طلا استفاده می‌شوند.
5-هدف ساخت مدلی است که با دقت بالا بتواند پیش بینی کند،بنابراین ما از روش‌های مختلف همانند رگرسیون و الگوریتم‌های شبکه عصبی بهره خواهیم برد.در ضمن با بررسی روشهای پیش پردازش مثل انتخاب خصیصه مهم را در این راستا خواهیم داشت.
1-3- مراحل انجام تحقیق دراین تحقیق،برای پیش بینی قیمت طلا،همه‌ی عوامل موثر بر پیش بینی قیمت طلا از سال 88 تا اواخر سال 92 گردآوری و مشخصه ها در55 فیلد مورد بررسی قرار می‌گیرند. آنالیز‌های اولیه روی داده‌های اولیه انجام شده و روی داده ها عملیات مرتب سازی و پاکسازی اعمال شده و سپس الگوریتم‌های متداول در شناسایی مشخصه‌های مهم و مدل‌های پیش بینی مورد یررسی قرار گرفته و در نهایت بازنگری و ارائه راهکار مناسب مورد مطالعه قرار می‌گیرد.
1-4 – ساختار پایان نامه این پایان نامه در پنج فصل تنظیم شده است. در فصل اول مقدمه، ضرورت، اهمیت و اهداف پیش بینی قیمت طلا، هدف پایان نامه و مراحل انجام تحقیق بیان گردید. فصل دوم شامل ادبیات موضوع و مبانی نظری در زمینه پیش بینی قیمت طلا می پردازد و مزایا و معایب روش‌‌های موجود بررسی می گردد. در فصل سوم،عوامل موثر بر پیش بینی قیمت طلا مورد بررسی قرار می‌گیرد.در فصل چهارم، راهکار پیشنهادی ارائه شده و مراحل مربوط به آن به تفضیل بیان می گردد. فصل پنجم، حاوی جمع بندی مطالب مطرح شده، نتیجه گیری و پیشنهاداتی برای پژوهش‌‌های آینده می باشد. منابع مورد استفاده در این پایان نامه نیز در یک فصل جداگانه در انتهای پایان نامه قرار دارند.

فصل دوم2- ادبیات موضوع و مبانی نظری تحقیق2-1-مقدمه هدف این فصل آشنایی با داده کاوی، فراگیری ماشین، فرایند داده کاوی ابزارها و تکنیک‌‌های داده کاوی روشهای داده کاری و بررسی پژوهشی کارهای انجام شده در زمینه پیش بینی قیمت طلا است.
2-2-رویکرد ماشین و داده کاوی عصر حاضر،عصر انفجاراطلاعات است. اطلاعات فراوانی در قالب پایگاه‌‌های داده ذخیره شده است که تبدیل آن ها به دانش با استفاده از ابزارهای جدید و فرآیند تحلیل، تفسیر داده ها و نتیجه گیری را تسهیل می نماید به منظور تسهیل فرآیندتصمیم گیری، سیستم ها باید به دانش لازم و قابلیت تصمیم گیری براساس داده ها تجهیز شوند جهت دستیابی به این هدف محققان به ارائه ایده‌‌های جدید از فراگیری ماشین پرداخته اند، با توجه به این ایده ها وظیفه فراگیری ماشین، تبدیل داده ها (ورودی) به دانش (خروجی) خواهد بود. همچنین براساس این ایده ها ضرورت پیدایش یک حوزه تحقیقاتی جدید که داده کاوی نام گرفته به وجود آمده است. (Michalski et al 1998).
به عنوان یک ابزار تحلیل داده و اهداف داده کاوی برای آشکار کردن روندها یا الگوهایی که تاکنون ناشناخته بودند یا بنا کردن روابطی در مجموعه‌‌های داده بزرگ برای کمک به تصمیم گیرندگان برای گرفتن تصمیمات بهتر است که این هدف را به وسیله به کارگیری روش‌‌های آماری همچون تحلیل لجستیک و خوشه بندی و همچنین با استفاده از روش‌های تحلیل داده به دست آمده از رشته‌‌های دیگر همچون شبکه‌‌های عصبی در هوش مصنوعی و درختان تصمیم در یادگیری ماشین انجام می دهند.(Kotl &Gervaise 2008)
داده و اطلاعات یا دانش، یک نقش قابل توجه در فعالیت‌‌های انسان دارد. داده کاوی فرایند کشف دانش توسط تحلیل حجم عظیمی از داده از منابع مختلف و تبدیل آن به اطلاعات مفید است به علت اهمیت استخراج دانش و اطلاعات از پایگاه داده‌‌های عظیم داده کاوی یک مولفه اساسی در زمینه‌‌های گوناگون زندگی بشر شامل کسب و کار تحصیلات، پزشکی، علم و… شده است.
کشف دانش در پایگاه داده ها اغلب داده کاوی نامیده می شوند که به هدف کشف اطلاعات مفید از مجموعه‌‌های داده است. برنامه‌‌های کاربردی داده کاوی مختلفی به طور موفقیت آمیز در حوزه‌‌های مختلفی همچون خدمات درمانی، امور مالی، خرده فروشی، کشف تقلب، و تحلیل ریسک و…. پیاده سازی شده است.(Goel et al 2012).
به این علت که ابزارهای داده کاوی روندها و رفتارهای آینده را توسط رصد پایگاه داده ها برای الگوهای نهان پیش بینی می کنند باعث می شوند که سازمان ها تصمیمات مبتنی بر دانش و فعالانه بگیرند و به سوالاتی که پیش از این حل آن ها بسیار زمان بر بود پاسخ دهند. (Ramamohan et al 2012).
داده کاوی یک ابزار مفید برای کاوش دانش از داده‌‌های حجیم است روش ها و الگوهای متفاوت در دسترس در داده کاوی هستند. (Patic et al 2012).
داده کاوی یافتن اطلاعات با معانی خاص از یک تعداد زیادی از داده به وسیله بعضی از فناوری ها به عنوان رویه ای برای کشف دانش از پایگاه داده است. که گام‌‌های آن شامل موارد زیر است :
.(Han & kumber 2001).
1- پاکسازی داده ها : حذف داده نویز و ناسازگار
2- یک پارچه سازی داده : ترکیب منابع داده ی گوناگون
3- انتخاب داده :یافتن داده مرتبط با موضوع از پایگاه داده
4- تبدیل داده : تبدیل داده به شکل مناسب برای کاوش
5- داده کاوی : استخراج مدل‌‌های داده با بهره گیری از تکنولوژی
6- ارزیابی الگو : ارزیابی مدل هایی که واقعاً برای ارائه دانش مفید هستند.
7- ارائه دانش : ارائه دانش بعد از کاوش به کاربران به وسیله استفاده از تکنولوژی همچون ارائه بصری. (Lin &yeh 2012).
2-3-فرایند داده کاوی
استانداردهای مختلفی برای انجام فرایند‌‌های داده کاوی وجود دارد که معروف ترین استانداردهای مورد استفاده در این زمینه استاندارد Crisp-dm می باشد.
1-تعریف مسئله(Business understanding)
تعریف مسئله شامل تعریف هدف مسئله،ارزیابی شرایط فعلی،تعریف اهداف داده کاوی وایجاد یک برنامه زمان بندی پروژه داده کاوی است.
2-تحلیل داده ها(Data Understanding)
وقتی که هدف مسئله مشخص شد و برنامه ریزی پروژه انجام گرفت،گام تحلیل داده ها نیازمندی‌های داده ای را مورد مطالعه قرار می‌دهد.این مرحله شامل تهیه مجموعه داده‌های اولیه، توصیف داده ها،کنکاش در داده ها و ارزیابی کیفیت داده ها است.کنکاش داده ها شامل مشاهده‌ی پارامتر‌های آماری،می تواند در پایان این فاز نیز اتفاق بیفتد.مدل‌هایی مثل خوشه بندی (clustering)می تواند در طول این گام به منظور شناسایی الگوها در داده ها انجام گیرد.
3-آماده سازی داده ها (Data Preparation)
زمانی که منابع در دسترس داده مشخص شدند،بایستی داده ها از آن انتخاب (Selecting)، پاک (Cleanin) و در قالب مورد نظر ریخته شوند.
همچنین کنکاش عمیق تر داده ها نیز در طول این فاز می‌تواند انجام گیرد.به علاوه ممکن است مدلهای دیگری نیز به کار روند تا بتوان الگوها را براساس تعریف مسئله استخراج کرد.
4-مدل سازی(Modeling)
ابزار‌های نرم افزاری داده کاوی همچون تصویر سازی (Visualization)و تحلیل خوشه بندی برای تحلیل‌های اولیه مفید هستند.ابزار‌هایی مانند شناسایی قوانین عمومی می‌تواند قوانین همبستگی اولیه را استخراج کند.وقتی که فهم بیشتری از داده ها بوسیله‌ی شناسایی الگو که با توجه به خروجی‌های مدل‌های اولیه حاصل می‌شود،افزایش می‌یابد،مدل‌های تخصصی تر بر حسب نوع داده می‌تواند مورد استفاده قرار بگیرد.
در این مرحله تقسیم بندی داده ها به مجموعه داده‌های آموزشی و مجموعه داده‌های آزمون لازم است.
5-ارزیابی(Evaluation)
نتایج مدل‌های استفاده شده در مراحل قبلی بایستی در بستر مسئله تعریف شده و اهداف تعریف شده در مراحل اولیه مورد ارزیابی قرار بگیرد.این کار منجر به شناسایی نیازهای بعدی خواهد شد.این نیازها اغلب شامل بازگشت به مراحل قبلی در فرایند CRISP-DMاست.تعریف مسئله در داده کاوی فرایند تکراری با بازگشت به عقب است که در آن نتایج اقدامات مدل سازی مختلف و تکرار آن ها روابط جدید بین داده ها را به کاربر نشان می‌دهد که باعث درک عمیق تر از مسئله برای کاربر خواهد شد.
6- توسعه(Deployment)
تکمیل یک مدل اغلب هدف نهایی نیست بلکه هدف کشف اطلاعات بیشتر از داده است. اطلاعات از داده ی اصلی نیاز خواهد داشت که بیشتر سازماندهی شود و سپس تبدیل شود به فرمی که بتواند برای مشتری استفاده شود. این اغلب شامل کاربرد مدل‌‌های عملکردی در فرایند‌‌های تصمیم گیری سازمان است. این فاز می تواند ساده و در عین حال پیچیده باشد که بستگی به نیازمندی ها دارد. اغلب این فاز را مشتری به class=’link’>5

متن کامل در سایت homatez.com