علم داده‌ها چیست؟

تولید داده

همه ی ما هر روز در حال تولید داده هستیم. هر عکس و ویدئو و یا متنی که در شبکه های مجازی منتشر می کنیم و یا موضوعاتی در رابطه با آنها در وبلاگ خود می نویسیم بخشی از حجم عظیم داده ای است که هر در جهان دار حال تولید است. بخش بزرگ این داده ها به صورت غیر ساخت یافته اند و ارتباط درست و منطقی ای در ظاهر بین آنها وجود ندارد و به استفاده از ابزار ها و روش های قدیمی نمی توان الگو های پنهان درون این داده ها را استخراج کرد. برای آنکه بتوان به دانش نهفته و پنهان و البته ارزشمند درون داده ها دست یافت از روش های مانند یادگیری ماشین، داده کاوی و یا آمار استفاده می‌شود. علم داده‌ها مفهوم تازه تری است که به صورت کلی از تمامی این روش ها استفاده میکند و صفر تا صد فرآیند استفاده از داده را در برمی‌گیرد تا با کشف رابطه پنهان میان داده های کلان به نتایج درست و منطقی برسد. به طور کلی این علم در تکنولوژی هوش مصنوعی نقش به سزایی دارد.

علم داده

علم داده‌ها چیست؟

اصلی ترین و در عین حال مفهومی ترین سوالی که در رابطه با علم داده مطرح می‌شود این که علم داده چیست؟ باید بیان کرد که برخلاف بسیاری دیگر از مفاهیم مورد استفاده در رابطه با تحلیل داده که امروزه تعریف مشخصی دارند، علم داده مفهومی است که هنوز به تعریف مشترکی برای دست نیافته ایم و در عین حال تعداد زیادی تعاریف کلی و پراکنده توسط افراد متعدد برای بیان مفهوم آن ارائه شده است. هر یک از تعاریف بخشی از ویژگی های ای مفهوم را بیان می کند اما همیشه منتقدانی برای هر تعریف وجود داشته است که کلیات آن را پذیرفته اند اما جزئیات را رد کرده اند. در ادامه دو تا از تعاریفی که بیشتر در جامعه علمی مورد قبول است را با یکدیگر مرور می‌کنیم.

براشلر و همکارانش آن را به صورت ” علم داده‌ها ترکیب منحصر به فردی از ابزار های گوناگون مانند تحلیل، مهندسی، کارآفرینی و علم ارتباطات است که تلاش میکند سود اقتصادی از داده ها خلق کند” تعریف کرده اند.

تعریف دیگر توسط کهلر ارائه شده است که در این تعریف بیان می کند “علم داده‌ها مجموعه از مسائل، الگوریتم ها و فرآیندها است که برای استخراج الگو های پنهان موجود در کلان داده مورد استفاده قرار می‌گیرند.”

با توجه به آنچه که گفته شده می دانیم که این علم در واقع دانشی ترکیبی از سایر علوم است که به ما کمک میکند تا با استفاده از آنها به درک اطلاعات موجود در داده های ساخت یافته و غیر ساخت یافته و نیم ساخت یافته دست پیدا کنیم و در نهایت مسیر کسب و کار و زمینه فعالیت خود را به سمت سود بیشتر و هزینه کمتر و شناسایی دقیق مخاطبان هدف هدایت کنیم.

چه کسی متخصص علم داده‌ها است؟

مسئله بعدی ای که در رابطه با آن مطرح می‌شود این است که دانشمند علم داده‌ها چه کسی است؟ آیا دانشمند علم داده همان تحلیلگر داده و یا دانشمند علم آمار است ؟ در پاسخ باید گفت با توجه به تفاوت هایی که در عمل و وظایف متخصص علم داده‌ها با هر یک از دیگر عنوان های ذکر شده فرق میکند و نمی توان آنها یکی دانست. متخصص تحلیل داده تنها از دانش خود در مرحله تحلیل و پیدا کردن الگو های پنهان استفاده میکند اما وظایف دانشمند علم داده‌ها شامل جمع آوری داده، آماده سازی داده جهت تحلیل، تحلیل داده، استخراج مدل، آزمایش مدل ها و در نهایت ارائه گزارش ساده و قابل فهم و بیان استراتژی ها و راه حل های مختلف برای حل مسائل سازمان به بخش های مختلف است. همچنین تفاوت اصلی متخصص علم داده با متخصص آمار در این است که متخصص علم داده از آمار به عنوان یکی از ابزار ها برای رسیدن به هدف خود استفاده میکند.