۳۰ اردیبهشت ۱۴۰۰ - ۰۹:۴۸
جایگاه مناسب ایران در حوزه داده کاوی| نرخ فرار مغزها در این حوزه بالا است
مدیر یک استارتاپ داده کاوی در گفتگو با «بازار»:

جایگاه مناسب ایران در حوزه داده کاوی| نرخ فرار مغزها در این حوزه بالا است

شریعتی، مدیر محصول پایگاه تحلیلی سیاسی ایران پرزیدنت میگوید: کارشناسان با داده کاوی مجبور می شوند تصمیمات احساسی را فراموش کنند و بر اساس واقعیت ها تصمیم بگیرند.

فرحناز سپهری؛ بازار: داده کاوی یا Data Mining به مفهوم استخراج اطلاعات یا الگوها و روابط مشخص در حجم زیادی از داده‌ها در یک یا چند بانک اطلاعاتی بزرگ گفته می‌شود که با در اختیار داشتن داده ها از طریق فناوریهای روز همچون هوش مصنوعی و پردازش زبان طبیعی تجزیه و تحلیل  شده و درا ختیار کارشناسان قرار می گیرد. به طوریکه از تصمیمات احساسی جلوگیری و به سمت تصمیم گیریهای واقعی سوق داده میشود. از طرفی مدیر یک استارتاپ داده کاوی براین باور است هرچند در بخش  تخصص فردی و تولید دانش  در این حوزه جایگاه بالایی داریم اما از لحاظ ابزار و زیرساخت های دیتابیسی  استفاده کننده هستیم.

وی که جواد شریعتی، کارشناس فناوری اطلاعات و محقق در حوزه Big Data است به عنوان مدیر محصول پایگاه تحلیلی سیاسی ایران پرزیدنت اولین پایگاه تحلیلی سیاسی مبتنی بر داده های حجیم فضای مجازی با محوریت انتخابات ریاست جمهوری ۱۴۰۰  زیر نظر شرکت لایف وب (یکی از بزرگترین شرکت های دانش بنیان در حوزه کلان‌داده، هوش‌مصنوعی و تحلیل شبکه‌های‌اجتماعی ) فعالیت میکند  و در فرصتی که پیش آمد به پرسشهای خبرگزاری بازار در این حوزه پاسخ داده است که در ادامه متن این گفتگو از نظرتان میگذرد.

*مفهوم داده‌کاوی را توضیح داده و بفرمایید از چه فناوری یا ابزارهایی  در این حوزه بهره می‌برند ؟
داده کاوی یعنی کاویدن و استخراج دانش از منابع حجیم داده تا اطلاعات با ارزش در حجم انبوهی از آن آشکار شود. در این حوزه از جدیدترین تکنولوژی های روز دنیا مانند Rapidmine ,Matlab ,Power BI و ...استفاده  میشود.  برای مثال در این استارتاپ با توجه به نوع فعالیت آن (که روی داده های شبکه های اجتماعی می باشد)، در فاز اول ابتدا داده ها با روشهای مختلف بصورت آنلاین انبوه از شبکه های اجتماعی جمع آوری می گردد و سپس در پایگاه داده های حجیم همانندelasticsearch ،mongodb ،cassandra ،apache druid  و …جهت استفاده در فازهای بعدی ذخیره میشود. در فاز دوم با استفاده از هوش مصنوعی پردازش زبان طبیعی(natural language processing) که به اختصار NLP خوانده میشود جهت استخراج اطلاعات با ارزش، موجودیت های متنی ، تحلیل و آنالیز تمامی داده ها بررسی و مجدد ذخیره میشوند تا بتوان از آن ها در مراحل بعدی استفاده کرد.

* پلتفرم ها در این حوزه در چه بخش ها و صنایعی بیشتر  به کار گرفته میشود؟
داده تقریبا در ۹۰ درصد صنایع و بخش هایی که با جوامع بشری در ارتباط هستند تاثیر گذار بوده و می تواند به یکی از الزامات در تصمیمات مهم سازمانی آن صنایع تبدیل شود. برای مثال صنایع داده محور نظیر بانک، بیمه، کارگزاری های بورس و …کسب وکارهای دیجیتال همچون فیلیمو، آپارات، تخفیفان، دیجی کالا، تپسی و اسنپ, و …بسیار مفید و پر استفاده است.

*در بخش اقتصاد و صنایع  و همچنین برای کارشناسان این حوزه،  داده کاوی چگونه میتواند جهت تحلیل و روند کاری موثر باشد؟ بیشتر توضیح دهید.
در بخش اقتصاد و صنایع، کارشناسان با داده کاوی مجبور می شوند تصمیمات احساسی را فراموش کنند و بر اساس واقعیت ها تصمیم بگیرند. برای مثال با شناخت رفتار و رویکرد مشتریان میتوان در جهت جذب مشتری بیشتر و وفاداری آنها قدم برداشت. کاهش هزینه های سرسام آور تبلیغات و همچنین هدفمند کردن آن با استفاده از شبیه سازی رفتار مشتری از جمله نتایج موثر در این حوزه میباشد. بنابراین ضررهای ناشی از ناآگاهی مدیران حذف و این کار منجر به تصمیمات واقع بینانه و همچنین سبب تکرار تصمیمات سودآور می شود.

* پلتفرم‌های این چنین برای توسعه‌ آنها به چه اقداماتی از سوی ارگان‌های دولت نیاز دارد؟
یکی از مشکلات این حوزه عدم وجود منابع آزاد در سرویس های فارسی هوش مصنوعی و هزینه های زیاد تگ زنی جهت آموزش ماشین و استفاده از الگوریتم ها و کتابخانه هایی همچون LSTM, Topic Modeling, keras, clustering,classification و…میباشد. البته به تازگی مرکز توسعه فناوری های نوظهور دیجیتال ریاست جمهوری اقدامات مثبتی در این حوزه انجام داده است. در این میان می‌توان تشکیل کارگروه های داده و هوش مصنوعی و حضور فعالین در آن و همچنین آزاد سازی و خرید دیتاست‌های خاص و حق استفاده از نرم افزارهای کاربردی را از جمله اقدامات مفید این مرکز دانست.

*برای مثال  بانک ها و موسسات با توجه به  اینکه داده‌هایشان مهم است؛ چگونه می‌تواند این اطلاعات به منظور استفاده از اطلاعات جهت تحلیل داده و داده‌کاوی در اختیار استارت آپ ها  و پلتفرم هایی این حوزه قرار گیرد؟  تا چه اندازه این تعامل بین  استارتاپ های در این حوزه انجام شده است؟ چه چالش هایی وجود دارد و چه اقداماتی باید انجام شود؟
البته این استارتاپ در این حوزه فعالیتی نداشته است اما در اختیار قرار دادن نمونه‌ای از دیتاست‌ها جهت آزمایش روی داده‌ها می‌تواند بسیار مفید باشد، مثلا ترافیکی، تصادفات ، بانکی، بیمه ، بورس و و سایر. از طرف دیگر کمک در تسریع دریافت و جمع‌آوری داده‌ها یکی از مهم‌ترین چالش‌های این حوزه می‌باشد که دولت با ایجاد کمیته شفافیت ( مجلس و سازمان آمار و … ) در جهت روشن کردن این نقاط تاریک قدم برداشته است. معمولا این نوع تعاملات با استارتاپ‌ها به دلیل نداشتن اعتماد و سابقه قبلی آن تیم به درستی صورت نمی‌گیرد.

*در ادامه سوال قبل در سایر کشورهای پیشرفته در حوزه داده‌ کاوی و تحلیل داده چه کارهایی صورت می‌گیرد؟ کدام کشورها پیشرو هستند؟
از آنجایی که حجم دیتای روزانه بسیار زیاد می باشد و هوش مصنوعی یکی از مهم‌ترین چرخ دنده‌های این صنعت است، تقریبا بیشتر کشورهای توسعه یافته همچون آمریکا، روسیه تولیدکننده ابزار در این حوزه و ما به عنوان استفاده کننده از آنها هستیم.

*ایران در حوزه  داده کاوی در چه جایگاهی در منطقه است؟ (از لحاظ زیر ساختها ، دانش فنی یا موارد دیگر)؟
از نظر تخصص فردی و تولید دانش در برخی از حوزه ها جایگاه بالایی داریم به طوری که نرخ فرار مغزها در این حوزه به نظر بالاست اما از لحاظ ابزار و زیرساخت های دیتابیسی دانش و منابع جهت تولید آن در ایران به اندازه قابل قبول موجود نیست و بیشتر استفاده کننده هستیم.

*کلام پایانی را بفرمایید.
با وجود حمایت های انجام شده از استارتاپ ها که بیشتر بصورت معنوی بوده است. در این مسیر شرکت های زیادی همچون لایف وب خدماتی در حوزه کلان‌داده، هوش‌مصنوعی و تحلیل شبکه‌های‌اجتماعی وجود دارند که حامی استارت ها و تامین کننده داده های مورد نیاز آن ها هستند. اما یکی از مهم ترین چالش های ما دیده شدن و اعتماد می باشد، خوشحال می شویم به پایگاه iranpresident سر بزنید و نظرتان را درجهت بهتر قدم برداشتن در این صنعت با ما درمیان بگذارید.

کد خبر: ۸۹٬۴۵۳

اخبار مرتبط

اخبار رمزارزها

    برچسب‌ها

    نظر شما

    شما در حال پاسخ به نظر «» هستید.
  • نظرات حاوی توهین و هرگونه نسبت ناروا به اشخاص حقیقی و حقوقی منتشر نمی‌شود.
  • نظراتی که غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نمی‌شود.
  • captcha