علم داده به‌صورت کلی دشوار بوده و سازمان‌ها برای موفقیت در پروژه‌های علم داده تلاش زیادی می‌کنند. شرکت گارتنر (Gartner) پیش‌بینی کرده است تا سال 2022 تنها 20 درصد از پروژه‌های تحلیلی می‌توانند در کسب‌و‌کار ارزش ایجاد کنند. این یعنی 80 درصد پروژه‌ها با شکست روبه‌رو می‌شوند. بنابراین سازمان‌ها باید برای تجزیه و تحلیل داده‌های خود دقت زیادی به خرج بدهند و مراقب باشند.

چرا پروژه‌های علم داده با شکست مواجه می‌شوند؟

در نظر داشته باشید علم داده به‌صورت کلی یک تکنیک و ابزار مارکتینگ بوده که در کنار سایر راهکارها، با تسهیل عملیات به ما کمک می‌کند. بنابراین معقول نیست که اصول مارکتینگ را رعایت نکرده و توقع داشته باشیم علم داده با بهبود اصول، مشکلات کسب و کار را حل کند.

هدف از بررسی دلایل شکست و چالش‌های پیش رو، این است که به‌عنوان یک مدیر مارکتینگ بدانیم باید به چه نکاتی دقت کنیم.

1- راه حل‌های تعیین شده در آغاز راه

رونالد کوز (Ronald Coase) می‌گوید «اگر داده‌ها را به اندازه کافی شکنجه کنیم، به هر چیزی که میخواهیم اعتراف می‌کنند». یعنی فرض کنید مدیران ارشد با بررسی برخی نمودارها متوجه شدند که اگر این نمودارها رو به بالا و نهایتا به سمت راست حرکت کنند، اتفاق خوبی در کسب‌و‌کار صورت می‌گیرد و از تیم داده می‌خواهند همچین نموداری تولید شود. شما با بررسی داده به نتایجی می‌رسید ولی نمودار طبق هدفی که انتظار داشتید پیش نمی‌رود و پروژه شکست می‌خورد.

باید دقت کنید که این پروژه یک پروژه علم داده نبوده چرا که راه‌حل از قبل مشخص شده و هدف این بوده که تیم داده دیتاها را جوری تغییر بدهد که آن نمودار به سمت بالا ایجاد شود. 

2- مشخص نبودن دقیق هدف پروژه

اگر هدف را مشخص نکنید و چشم‌اندازی تعیین نشود، پایان موفقیت‌آمیزی برای پروژه وجود نخواهد داشت. اگر چرخه‌ی کریسپ (CRISP) را به خاطر بیاورید، به طور مداوم برگشت می‌زنیم به گام اول متدولوژی کریسپ (بررسی مجدد کسب‌وکار، آماده‌سازی داده) و در نهایت هیچ پایانی وجود نخواهد داشت. بنابراین در پروژه‌های علم داده هدف باید به‌درستی تعیین شود و همه چیز شفاف باشد. برای مثال هدف بررسی ریزش مشتری یا بالا بردن فروش یا بهینه‌سازی قیمت‌گذاری است.

3- عدم تفکر صحیح تصمیم‌گیری داده‌محور نزد مدیران ارشد و میانی سازمان‌ها 

بسته به بلوغ مدیران سازمان و سطح درک آنها از مباحث داده‌ای، پروژه می‌تواند با شکست مواجه شود و یا با موفقیت انجام شود. شما به‌عنوان مدیر مارکتینگ با مفاهیم بازاریابی داده‌محور آشنا هستید و هدفتان این است از این مفاهیم در کسب‌وکارتان استفاده کنید. اما اگر مدیران رده بالا مثل مدیرعامل تفکر داده‌محور نداشته باشند و سازمان سطح مناسبی از بلوغ داده‌ای نداشته باشد، پروژۀ شما هر چقدر که عالی انجام شده باشد، در نهایت با شکست مواجه شده و اجرایی نخواهد شد.

4- در دسترس نبودن دیتای کافی و صحیح یا عدم دسترسی به این داده‌ها 

فرض کنید هدف دقیق مشخص شده و تفکر داده‌محور هم در سازمان وجود دارد، اما داده‌ها در دسترس نیست یا به‌صورت درست در جایی نگهداری نشده یا دست‌نویس هستند. خوراک پروژه‌های علم‌داده‌ای وجود دیتای مناسب و کافی است.

در مواقعی ممکن است نیاز به اقلام اطلاعاتی داشته باشید ولی توسط سازمان به درستی جمع‌آوری نشده است. باید در فاز آماده‌سازی دیتا دقت کنیم که اولا نیاز به چه دیتایی داریم و چطور می‌توانیم به این دیتا دسترسی پیدا کنیم؟ اصلا این دیتا وجود دارد یا خیر؟ که اگر وجود ندارد، باید به دنبال راهکار باشیم. در غیر این صورت با شکست مواجه می‌شویم.

5- عدم وجود زیرساخت مناسب برای ثبت داده‌ها و استخراج اطلاعات 

بسته به وسعت سازمان ممکن است حتی دیتا به صورت دستی ذخیره شود. در این صورت هیچ زیرساختی برای دیتا وجود ندارد پس دیتایی که تولید می‌شود قابل اتکا نیست. در سازمان‌هایی که بستر مناسب ذخیره اطلاعات وجود ندارد، در واقع دیتا به‌صورت جزیره‌ای نگهداری شده، قابل رصد نیستند و یک سورس مشخص برای دیتاها نداریم.

6- عدم وجود منابع انسانی متخصص برای اجرا یا برون‌سپاری پروژه‌ها 

پروژه‌های علم داده یک پروژه عام نیستند که هر فردی با دانش ابتدایی و پایه انجام دهد و نیاز به تخصص و تجربه کافی دارد. اگر به این موارد دقت نکنید سازمان دچار هزینه‌های اضافه می‌شود. چرا که نیروی متخصص برای اجرای درست پروژه حضور نداشته و سازمان متحمل هزینه مالی و زمانی بیشتر بابت نیروی دیگری می‌شود تا از شکست جلوگیری کند.

7- عدم مشارکت سطوح مختلف سازمان برای موفقیت پروژه‌های علم داده 

ممکن است واحدهای مختلف سازمان با شما به‌عنوان مدیر مارکتینگ همکاری نکنند یا دیتای لازم برای اجرای پروژه را در اختیار شما قرار ندهند. در این صورت حتی اگر پروژه در فاز استقرار باشد و خروجی پروژه انجام شده باشد، اما لزوما در سطح سازمان به صورت گسترده استفاده نشود، یک‌جور شکست پروژه محسوب می‌شود.

8- محرمانگی داده‌ها 

امروزه در هر سازمانی داده‌ها جزء اموال و دارایی‌های سازمان محسوب می‌شوند و به‌راحتی نباید در اختیار افراد قرار بگیرند. از طرف دیگر، کاربران نیز تمایل ندارند اطلاعاتشان به خارج از سازمان نشت پیدا کند. بنابراین، برای سطوح مختلف در سازمان‌ها، دسترسی‌های مختلف تعریف یا حتی کدگذاری می‌شوند یا گاهی برشی از اطلاعات را به‌جای کل اطلاعات در اختیارتان قرار می‌دهند. همه این‌ها یک‌ سری سیاست برای محرمانگی داده‌ها است. پس در فاز آماده‌سازی، لازم است مشخص کنیم که چگونه به داده مورد نظر دسترسی پیدا کنند.

9- عدم درک افق بلندمدت برای موفقیت در حوزه تبدیل شدن به یک سازمان داده‌محور 

پروژه‌های داده‌محور زمان‌بر و هزینه‌بر هستند. اگر مدیران سازمان‌ها دید بلندمدت نداشته باشند ممکن است تحمل سرمایه‌گذاری نداشته و با ایجاد فشار روی شما پروژه با شکست روبه‌رو شود.

10- عدم وجود زبان مشترک برای اجرای صحیح پروژه‌ها و تمرکز بیش از حد فنی 

هدف این است که زبان مشترک بین تیم داده و تیم بازاریابی کسب‌وکار ایجاد شود. اگر این اتفاق نیافتد باعث درک نادرست و ناکافی نیازمندی‌ها توسط تیم داده می‌شود، تیم مارکتینگ در یک لوپ بی‌نهایت برای اجرای پروژه گیر کرده و اسکوپ پروژه مدام تغییر می‌کند چون نیازمندی آن‌طور که باید توسط تیم داده درک نشده است.

نکات تکمیلی اجرای پروژه علم داده 

با یک برنامه مشخص شروع کنید 

آقای مونیکا روگاتی، از پیشگامان اولیه علم داده، سلسله‌مراتب علم داده را به صورت یک هرم ارائه کرده است. هوش مصنوعی و یادگیری عمیق در راس قرار دارند. همه می‌خواهند از آنجا شروع کنند با این حال، یک پایه بزرگ در زیر هوش مصنوعی وجود دارد. مراحل این پایه به ترتیب جمع‌آوری داده‌ها، نحوه ذخیره‌سازی داده‌ها، تمیز کردن و انتقال داده‌ها، تجمیع داده‌ها در صورت نیاز، انجام A/B تست و مدل‌سازی و در نهایت یادگیری عمیق در راس هرم.

انتظار داشته باشید که زمان ببرد

پروژه‌های علم داده زمان‌بر و هزینه‌بر هستند و نباید انتظار داشته باشید در کوتاه‌مدت اجرا شوند. برای اجرای دقیق و صحیح پروژه‌های علم داده زمان را در نظر بگیرید. در تمام پروژه‌ها هم نیازی نیست سراغ علم داده بروید. بسته به نوع مساله می‌توانید از پروژه‌های داده‌محور استفاده کنید. گاهی بعضی پروژه‌ها در مدت زمان کمی به نتیجه می‌رسد گاهی در بلندمدت و موضوع زمان‌بر بودن را نباید به تمام پروژه‌ها تعمیم داد و انتظار یکسانی از زمان پروژه‌های علم داده داشت.

تمرکز بر آموزش 

باید آموزش پایه و تفکر داده‌محور در سازمان ایجاد شود.

با در نظر گرفتن چالش‌های مطرح شده سعی می‌کنیم ریسک اجرای پروژه را تا جای ممکن کاهش دهیم.