تحلیل داده و آسیب های آن – قسمت دوم

جادوبی تحلیل داده, داشبورد مدیریتی, مجله جادوبی تحلیل داده و آسیب های آن – قسمت دوم
فرآیند تحلیل داده

تحلیل داده داشبورد مدیریتی مجله جادوبی

در نوشته قبل با تعریف ساده و شفافی از تحلیل داده آشنا شدیم:

تحلیل داده، فرآیند بررسی، مرتب سازی، تبدیل و مدل سازی داده با هدف کشف اطلاعات مفید، پیشنهاد کردن، نتیجه گیری و پیشتیبانی از تصمیم گیری است.

و در انتها، به این موضوع اشاره شد که تحلیل داده نیز می تواند یک چاقوی دو لبه باشد. پس بهتر است پیش از بکارگیری آن با آسیب های آن بیشتر آشنا شوید.

در این نوشته قصد داریم تا به آسیب های استفاده از تحلیل داده بپردازیم.

آسیب اول – ظهور بدیهیات و مهملات

آسیب دوم – بی حسی نرم افزاری

آسیب سوم – توزیع پوآسون!

آسیب چهارم – انجماد داده

آسیب پنجم- آچار فرانسه ای بنام داده کاوی

 

آسیب اول – ظهور بدیهیات و مهملات

با ارزش ترین خروجی تحلیل داده، گزاره های دانشی (کشفیات) است؛ گزاره هایی که بتازگی کشف می شوند و بر دانش ما از سیستم تحت مطالعه می افزایند. با این همه، از آنجا که عمده فعالیت های مرتبط با فرآیند تحلیل داده توسط کامپیوتر انجام می گیرد، همه خروجی های آن گزاره های دانشی (مفید) نیست. اغلب خروجی ها گزاره هایی است که شناخته شده و بدیهی به نظر می رسند بدیهیات . اینها می توانند مهر تاییدی بر درک ما از سیستم تحت مطالعه باشند. حتی ممکن است گزاره های ناقصی هم در خروجی تحلیل داده ظاهر شوند که به هیچ کار نیایند مهملات. اینها به دلیل ناکافی بودن داده یا دلایل دیگر ظاهر می شوند که فعلا می توان به آنها توجه نکرد!

به عنوان یک مثال تصویری به شکل زیر توجه کنید. در این تصویر بدیهیات (محیط)، مهملات (نقش های پیرامون جغد) و کشفیات (خود جغد) در یک قاب نشان داده شده اند.

ظهور بدیهیات و مهملات در تحلیل داده
ظهور بدیهیات و مهملات در تحلیل داده

آسیب دوم – بی حسی نرم افزاری

فرآیند تحلیل داده برای بعضی ها از دانلود، نصب و راه اندازی نرم افزار تحلیل داده شروع می شود و در ادامه نیز صرفا به آشنایی با نحوه وارد کردن داده و فشردن دکمه تحلیل و بررسی خروجی خلاصه می شود. نرم افزارهای امروزی بخش زیادی از کارها را به طور خودکار انجام می دهند و تحلیلگر را از بسیاری از امور بی نیاز می کند. در این شرایط، بعید نیست تحلیلگر کار را تمام شده فرض کند و نسبت به انجام اصلی ترین مراحل تحلیل داده، بی حس شود. اصلی ترین مرحله تحلیل داده این است که تحلیلگر، به دور از نرم افزارها و کارکردهای آن، و صرفا منطبق و متناسب با مساله و شرایط آن، فرآیند مورد نیاز برای تحلیل داده را ترسیم کند. سپس ببیند به چه ابزار یا ابزارهایی برای رسیدن به مقصد نیاز دارد.

مایلید با یک ابزار متفاوت تحلیل داده آشنا بشید؟

دوستی می گفت که فردی از او در زمینه انجام یک «پروژه تحلیل داده» کمک خواسته است. می گفت مساله او را دیدم و از او درباره داده اش هم پرسیدم. متوجه شدم که می خواهد رفتار فروش را بر اساس فروش دو دوره در گذشته بیابد. به او گفتم که دو نقطه را به هم وصل کن، بهترین خط برازش بدست می آید و نیازی به پروژه و نرم افزار هم نیست!!

آسیب سوم – توزیع پواسون!

مفاهیم تحلیل داده و ابزارهای آن به قدری جذاب هستند که به خودی خود هم درد هستند و هم درمان! این موضوع شاید از پرتمتراق بودن اصطلاحات آن یا پیوند قوی آن با بصری سازی های چشم نواز نشأت گرفته باشد. مثلا وقتی کسی می گوید برای حل مشکل شرکت را از روش کلاسترینگ استفاده کردم کلی بر اعتبار کارش افزوده می شود تا این که بگوید ۱۰ درصد بازدهی شرکت را بهبود دادم. اینجاست که اصل فرآیند تحلیل داده جهت حل مساله به فراموشی سپرده می شود.

یک نمونه واقعی: در بدو ورود، مساله اش را این گونه مطرح کرد: «می خواهم مساله ای را در شرکتم با استفاده از توزیع پوآسون حل کنم». از او پرسیده شد: «خب…مساله چیست؟» گفت: «فرقی نمی کند مهم این است که از توزیع پوآسون حل شود!!؟!»

انجماد داده
انجماد داده

آسیب چهارم – انجماد داده

جهان پیرامون ما مدام در حال تغییر است. داده منجمد نمی شود بلکه مثل رودخانه جاری است. پس چطور می شود که در چنین شرایطی، برخی فریب می خورند و با یک بار انجام فرآیند تحلیل داده و رسیدن به خروجی، کار را تمام شده می دانند؟ بله، نمی توان فرآیند تحلیل داده را یک بار انجام داد و یک عمر از ان استفاده کرد؛ زیرا، به محض استفاده از آن، خود ما تغییر خواهیم کرد، محیط ما و مشتریان ما تغییر خواهند کرد و شرایط متفاوت خواهد شد. در شرایط متفاوت، تحلیل های جدید مورد نیاز است. البته اینکه فرآیند تحلیل داده بخواهد به طور مداوم در قالب پروژه های متعدد انجام شود غیراقتصادی و غیرمعقول است. چاره کار این است که بخش عمده این تحلیل ها به ابزار قدرتمندی بنام داشبورد مدیریتی سپرده شود.

همین الان یک داشبورد مدیریتی مال خود کنید

آسیب پنجم- آچار فرانسه ای بنام داده کاوی

به طور خلاصه، علم داده کاوی در برگیرنده مفاهیم، مدلها و ابزار قدرتمند جهت انجام تحلیل های پیچیده بر روی داده است. داده کاوی به نوعی زیر مجموعه تحلیل داده به شمار می‌رود و خروجی آن اغلب توصیفی از اوضاع سیستم مورد مطالعه (مثلا چند دسته مشتری از نظر شدت فعالیت داریم؟) یا پیش بینی از آینده آن

گفته می شود بعضی از مدعیان علم داده کاوی، گستره این علم را بسیار وسیع می دانند. آن ها، طبق این گزاره که «خروجی فرایند داده کاوی (مانند تحلیل داده)، دانشی است که پیش تر آن را نمی دانستیم» پا را فراتر از مرزهای این علم نهاده و میانگین گیری چند مقدار را هم، از آنجا که پیش از محاسبه مقدار میانگین آن ها را نمی دانیم، در زمره داده کاوی بر می شمرند. این گزاره اشتباهی خطرناک است. در اینجا آن (اشتباه بودن آن گزاره) را اثبات نمی کنم فقط به این بیندیشید که اگر چنان باشد، حاصل جمع دو عدد سه رقمی هم داده کاوی خواهد بود!!! و داده کاوی، تحلیل داده را در بر خواهد گرفت.

اما آسیب اصلی آنجا است که وجود ابزارهای پرطمطراق داده کاوی سبب شده که افراد «مقداری آگاه از آن» به دنبال این باشند که کوچکترین مسایل تحلیلی خود را با آچارکشیهای داده کاوی حل کنند. این یک آسیب بزرگ است. زیرا آن عده گویا دنبال این هستند که پشه را با موشک کروز بکشند!

مطالب پیشنهادی

درج دیدگاه

You have to agree to the comment policy.

*