7 مهارت برای دانشمند داده شدن مقدمه دانشمند داده شدن ایده ای بزرگ و پولسازیه ، ما توی این مقاله مهم ترین مهارت های یک دانشمند داده موفق رو توضیح دادیم. تصور کن دانشمند داده شدی! اولین وظیفه شما دریافت داده هاست که لزوما خیلی راحت رخ نمیده، ابتدا باید داده هارو ساختارمند(Structured Data) کنی و بعدش اونارو به هم ربط بدی که بهش داستان سرایی داده ها⇐! (Stories) می گیم و در آخر باید بینش یا تحلیل خودت رو ارائه بدی. بریم سراغ مهارت ها!
1. برنامه نویسی (Programming)
زبان های برنامه نویسی، مانند پایتون یا R، به دانشمندان داده برای مرتب سازی، تجزیه و تحلیل و مدیریت مقادیر زیادی از داده ها (که معمولاً به آنها “داده های بزرگ(“Big Data” گفته می شه) کمک می کنند. به عنوان یک دانشمند داده که تازه شروع به کار کردی، باید مفاهیم اولیه علم داده(Data Science)رو بدونی و برای شروع بهتره با پایتون کار کنی. زبان های برنامه نویسی معروف عبارتند از:
- پایتون
- R
- SAS
- SQL
2. آمار و احتمال (Statistics and probability)
به خاطر نوشتن مدل ها و الگوریتم های یادگیری ماشین(Machine Learning) اونم با کیفیت بالا، دانشمندان داده نیاز به یادگیری آمار و احتمال دارند. برای یادگیری ماشین، استفاده از مفاهیم تحلیل آماری مانند رگرسیون(Regression)خطی ضروری است. دانشمندان داده باید بتوانند داده ها را جمع آوری، تفسیر، سازماندهی و ارائه کنند و مفاهیمی مانند میانگین، میانه، مد، واریانس و انحراف معیار را به طور کامل درک بکنند. در اینجا انواع مختلفی از تکنیک های آماری وجود داره که باید بدانی:
3.آماده سازی داده ها و مدیریت پایگاه داده (Data wrangling and database management)
آماده سازی داده ها، فرآیند مرتب کردن و سازماندهی مجموعه داده های پیچیده است تا دسترسی و تجزیه و تحلیل آنها را آسان تر بکند. مرتب سازی دادهها برای دستهبندی آنها بر اساس الگوها و روندهاست، و تصحیح مقادیر دادههای ورودی میتونه زمانبر باشه، اما برای تصمیمگیریهای مبتنی بر داده ضروریه. همچنین این مبحث به درک مدیریت پایگاه داده مربوط می شه. از شما انتظار میره تا داده ها رو از منابع مختلف استخراج کنی و آنها را به قالبی مناسب برای پرس و جو و تجزیه و تحلیل تبدیل کنی و سپس آن را در یک پایگاه داده تحلیلی (Data warehouse)بارگذاری کنی. ابزارهای مفید برای آماده سازی داده ها عبارتند از:

و اما ابزارهای مدیریت پایگاه داده عبارتند از:

4.یادگیری ماشین و یادگیری عمیق (Machine learning and deep learning)
به عنوان یک دانشمند داده، می خواهی که خودت را در یادگیری ماشینی و یادگیری عمیق غرق کنی. گنجاندن این تکنیکها به شما کمک میکنه تا به عنوان یک دانشمند داده پیشرفت زیادی بکنی، زیرا میتونی دادهها رو به طور کارآمدتر جمعآوری و ترکیب بکنی. همچنین میتونی با کمک این تکنیک ها از طریق داده ها آینده رو یا به صورت کوتاه مدت و یا بلند مدت پیشبینی کنی. برای مثال، میتونی بر اساس داده های ماه قبل با استفاده از رگرسیون خطی پیش بینی کنی که شرکت شما در ماه آینده چند مشتری جذب خواهد کرد. البته، استفاده از دانش های پیچیده ای مثل Random Forest هم چیزیه که بعدا ازش استفاده میکنی. مهم ترین الگوریتم های یادگیری ماشین که باید بدونی عبارتند از:

5.دیداری سازی داده ها (Data visualization)

به عنوان یک دانشمند داده نه تنها باید بدونی که چگونه داده ها را تجزیه و تحلیل، سازماندهی و دسته بندی بکنی، بلکه باید مهارت های خودت رو در تجسم داده ها هم تقویت بکنی. توانایی تجسم کردن و به تصویر کشیدن داده ها یکی از ویژگی های مهم دانشمند های داده شدنه. با مهارت تجسم قوی، می تونی کار خودت رو به همکاران خودت ارائه بدی تا اونا بتونن داستان قانع کننده ای برای ارائه بینش های تجاری را معرفی کنن. و اما بهترین ابزار ها برای دیداری سازی داده ها:
6.پردازش ابری (Cloud computing)
به عنوان یک دانشمند داده، باید از ابزارهای رایانش ابری استفاده کنی تا بتونی داده هارو تجزیه، تحلیل و تجسم بکنی ودر پلتفرم های ابری ذخیره و یا بازیابی کنی. برخی از سرویس ها که به طور خاص بر روی خدمات ابری فعالیت می کنند مانند:
-
مهارت های بین فردی
شما برای اینکه بتوانید یک دانشمند داده حرفه ای بشید باید این نکته کلیدی را بدانید؛ اول خود را اصلاح کنید سپس به فکر اصلاح کسب و کار خود باشید. برای ایجاد ارتباطات نمونه باید خود را از لحاظ شخصیتی منعطف کنید و گوشی شنوا برای بهتر کردن اوضاع داشته باشید. یک دانشمند داده حرفه ای باید به دنبال بهبود فردی و افزایش مهارت بین فردی خود نیز باشد. برخی از مهارت های بین فردی را ذکر کردیم:
- گوش دادن فعال
- مهارت های برقراری ارتباط موثر
- به اشتراک گذاشتن بازخورد ها
- توجه به جزئیات
- رهبری
- یکدلی
- تمرکز در کار

