فرحناز سپهری؛ بازار: داده کاوی یا Data Mining به مفهوم استخراج اطلاعات یا الگوها و روابط مشخص در حجم زیادی از دادهها در یک یا چند بانک اطلاعاتی بزرگ گفته میشود که با در اختیار داشتن داده ها از طریق فناوریهای روز همچون هوش مصنوعی و پردازش زبان طبیعی تجزیه و تحلیل شده و درا ختیار کارشناسان قرار می گیرد. به طوریکه از تصمیمات احساسی جلوگیری و به سمت تصمیم گیریهای واقعی سوق داده میشود. از طرفی مدیر یک استارتاپ داده کاوی براین باور است هرچند در بخش تخصص فردی و تولید دانش در این حوزه جایگاه بالایی داریم اما از لحاظ ابزار و زیرساخت های دیتابیسی استفاده کننده هستیم.
وی که جواد شریعتی، کارشناس فناوری اطلاعات و محقق در حوزه Big Data است به عنوان مدیر محصول پایگاه تحلیلی سیاسی ایران پرزیدنت اولین پایگاه تحلیلی سیاسی مبتنی بر داده های حجیم فضای مجازی با محوریت انتخابات ریاست جمهوری ۱۴۰۰ زیر نظر شرکت لایف وب (یکی از بزرگترین شرکت های دانش بنیان در حوزه کلانداده، هوشمصنوعی و تحلیل شبکههایاجتماعی ) فعالیت میکند و در فرصتی که پیش آمد به پرسشهای خبرگزاری بازار در این حوزه پاسخ داده است که در ادامه متن این گفتگو از نظرتان میگذرد.
*مفهوم دادهکاوی را توضیح داده و بفرمایید از چه فناوری یا ابزارهایی در این حوزه بهره میبرند ؟
داده کاوی یعنی کاویدن و استخراج دانش از منابع حجیم داده تا اطلاعات با ارزش در حجم انبوهی از آن آشکار شود. در این حوزه از جدیدترین تکنولوژی های روز دنیا مانند Rapidmine ,Matlab ,Power BI و ...استفاده میشود. برای مثال در این استارتاپ با توجه به نوع فعالیت آن (که روی داده های شبکه های اجتماعی می باشد)، در فاز اول ابتدا داده ها با روشهای مختلف بصورت آنلاین انبوه از شبکه های اجتماعی جمع آوری می گردد و سپس در پایگاه داده های حجیم همانندelasticsearch ،mongodb ،cassandra ،apache druid و …جهت استفاده در فازهای بعدی ذخیره میشود. در فاز دوم با استفاده از هوش مصنوعی پردازش زبان طبیعی(natural language processing) که به اختصار NLP خوانده میشود جهت استخراج اطلاعات با ارزش، موجودیت های متنی ، تحلیل و آنالیز تمامی داده ها بررسی و مجدد ذخیره میشوند تا بتوان از آن ها در مراحل بعدی استفاده کرد.
* پلتفرم ها در این حوزه در چه بخش ها و صنایعی بیشتر به کار گرفته میشود؟
داده تقریبا در ۹۰ درصد صنایع و بخش هایی که با جوامع بشری در ارتباط هستند تاثیر گذار بوده و می تواند به یکی از الزامات در تصمیمات مهم سازمانی آن صنایع تبدیل شود. برای مثال صنایع داده محور نظیر بانک، بیمه، کارگزاری های بورس و …کسب وکارهای دیجیتال همچون فیلیمو، آپارات، تخفیفان، دیجی کالا، تپسی و اسنپ, و …بسیار مفید و پر استفاده است.
*در بخش اقتصاد و صنایع و همچنین برای کارشناسان این حوزه، داده کاوی چگونه میتواند جهت تحلیل و روند کاری موثر باشد؟ بیشتر توضیح دهید.
در بخش اقتصاد و صنایع، کارشناسان با داده کاوی مجبور می شوند تصمیمات احساسی را فراموش کنند و بر اساس واقعیت ها تصمیم بگیرند. برای مثال با شناخت رفتار و رویکرد مشتریان میتوان در جهت جذب مشتری بیشتر و وفاداری آنها قدم برداشت. کاهش هزینه های سرسام آور تبلیغات و همچنین هدفمند کردن آن با استفاده از شبیه سازی رفتار مشتری از جمله نتایج موثر در این حوزه میباشد. بنابراین ضررهای ناشی از ناآگاهی مدیران حذف و این کار منجر به تصمیمات واقع بینانه و همچنین سبب تکرار تصمیمات سودآور می شود.
* پلتفرمهای این چنین برای توسعه آنها به چه اقداماتی از سوی ارگانهای دولت نیاز دارد؟
یکی از مشکلات این حوزه عدم وجود منابع آزاد در سرویس های فارسی هوش مصنوعی و هزینه های زیاد تگ زنی جهت آموزش ماشین و استفاده از الگوریتم ها و کتابخانه هایی همچون LSTM, Topic Modeling, keras, clustering,classification و…میباشد. البته به تازگی مرکز توسعه فناوری های نوظهور دیجیتال ریاست جمهوری اقدامات مثبتی در این حوزه انجام داده است. در این میان میتوان تشکیل کارگروه های داده و هوش مصنوعی و حضور فعالین در آن و همچنین آزاد سازی و خرید دیتاستهای خاص و حق استفاده از نرم افزارهای کاربردی را از جمله اقدامات مفید این مرکز دانست.
*برای مثال بانک ها و موسسات با توجه به اینکه دادههایشان مهم است؛ چگونه میتواند این اطلاعات به منظور استفاده از اطلاعات جهت تحلیل داده و دادهکاوی در اختیار استارت آپ ها و پلتفرم هایی این حوزه قرار گیرد؟ تا چه اندازه این تعامل بین استارتاپ های در این حوزه انجام شده است؟ چه چالش هایی وجود دارد و چه اقداماتی باید انجام شود؟
البته این استارتاپ در این حوزه فعالیتی نداشته است اما در اختیار قرار دادن نمونهای از دیتاستها جهت آزمایش روی دادهها میتواند بسیار مفید باشد، مثلا ترافیکی، تصادفات ، بانکی، بیمه ، بورس و و سایر. از طرف دیگر کمک در تسریع دریافت و جمعآوری دادهها یکی از مهمترین چالشهای این حوزه میباشد که دولت با ایجاد کمیته شفافیت ( مجلس و سازمان آمار و … ) در جهت روشن کردن این نقاط تاریک قدم برداشته است. معمولا این نوع تعاملات با استارتاپها به دلیل نداشتن اعتماد و سابقه قبلی آن تیم به درستی صورت نمیگیرد.
*در ادامه سوال قبل در سایر کشورهای پیشرفته در حوزه داده کاوی و تحلیل داده چه کارهایی صورت میگیرد؟ کدام کشورها پیشرو هستند؟
از آنجایی که حجم دیتای روزانه بسیار زیاد می باشد و هوش مصنوعی یکی از مهمترین چرخ دندههای این صنعت است، تقریبا بیشتر کشورهای توسعه یافته همچون آمریکا، روسیه تولیدکننده ابزار در این حوزه و ما به عنوان استفاده کننده از آنها هستیم.
*ایران در حوزه داده کاوی در چه جایگاهی در منطقه است؟ (از لحاظ زیر ساختها ، دانش فنی یا موارد دیگر)؟
از نظر تخصص فردی و تولید دانش در برخی از حوزه ها جایگاه بالایی داریم به طوری که نرخ فرار مغزها در این حوزه به نظر بالاست اما از لحاظ ابزار و زیرساخت های دیتابیسی دانش و منابع جهت تولید آن در ایران به اندازه قابل قبول موجود نیست و بیشتر استفاده کننده هستیم.
*کلام پایانی را بفرمایید.
با وجود حمایت های انجام شده از استارتاپ ها که بیشتر بصورت معنوی بوده است. در این مسیر شرکت های زیادی همچون لایف وب خدماتی در حوزه کلانداده، هوشمصنوعی و تحلیل شبکههایاجتماعی وجود دارند که حامی استارت ها و تامین کننده داده های مورد نیاز آن ها هستند. اما یکی از مهم ترین چالش های ما دیده شدن و اعتماد می باشد، خوشحال می شویم به پایگاه iranpresident سر بزنید و نظرتان را درجهت بهتر قدم برداشتن در این صنعت با ما درمیان بگذارید.
نظر شما