نوآوری در الگوهای پرتکرار داده کاوی نرم افزاری برای آنالیز و تشخیص چالشهای کارآفرینی در شرکت ها و سازمان های بزرگ و استارت آپ ها

پنجمین کنفرانس ملی اقتصاد، مدیریت و حسابداری

نوآوری در الگوهای پرتکرار داده کاوی نرم افزاری برای آنالیز و تشخیص چالشهای کارآفرینی در شرکت ها و سازمان های بزرگ و استارت آپ ها

1.دنیا عین علی ورنوس فادرانی (مدیر عامل موسسه دنیای کسب و کار موفق)

2.ابراهیم پاینده نجف آبادی (رئیس هیئت مدیره موسسه دنیای کسب و کار موفق)

 

چکیده:

پژوهش حاضر به منظور ایجاد نوآوری در الگوهای پرتکرار داده کاوی نرم افزاری برای آنالیز و تشخیص چالش های کارآفرینی در شرکت ها و سازمان های بزرگ و استارت آپ ها و با روش آزمایشی انجام شد. به منظور دستیابی به اهداف پژوهش، شرایط و عملکرد حافظه مصرفی و زمان اجرا و همچنین تعداد الگوهای مکرر گم شده مورد بررسی قرار گرفته است زیرا عملکرد آنها تاثیر مستقیم روی نتایج کل سازمان دارد و یکی از بهترین گزینه ها برای آنالیز و تشخیص چالشهای کارآفرینی در شرکت ها و سازمان های بزرگ و استارت آپ ها می باشد. شرکت ها، سازمان های بزرگ و استارت آپ ها برای تصمیم گیری و برنامه ریزی به اطلاعات نیاز دارند که بخشی از این اطلاعات از داده کاوی پایگاه داده خود شرکت ها، سازمان های بزرگ و استارت آپ ها و مابقی از داده های محیط خارج از آنها ناشی می شود. این اطلاعات بدست آمده از داده کاوی نشان دهنده رفتار مشتریان و همکاران و بیان کننده موفقیت یا شکست شرکت ها، سازمان های بزرگ و استارت آپ ها در یک تصمیم و عمل خاص هستند. برای استخراج اطلاعات مفید و همچنین پیش بینی نتایجی که ممکن است در آینده بدست بیاید و روابط بین آنها، بایستی از میان انبوه حجم داده های ثبت شده از الگوریتم های پیچیده ی ریاضی استفاده کرد. تاکنون الگوریتم های بسیاری ارائه شده است که البته ایرادات مهمی از جمله نیاز به حافظه و زمان بسیار زیاد و از همه مهمتر گم شدن اطلاعات مهمی در روند پردازش داده های الگوهای پرتکرار در طول زمان بر اثر نوع الگوریتم می باشد که به همین دلیل احتمال شکست در نتیجه ی حاصل از داده کاوی را بسیار بالا می برد لذا در این مقاله تلاش شده است با ایجاد یک نوآوری در الگوریتم های پرتکرار باعث برطرف کردن تمام مشکلات موجود در تحقیقات گذشته شده و هیچ اطلاعاتی ازبین نرود و بدین ترتیب احتمال موفقیت شرکت ها، سازمان های بزرگ و استارت آپ ها به بالاترین حد امکان برسد.

کلمات کلیدی: کارآفرینی، داده کاوی در کارآفرینی، آنالیز چالشها، نوآوری.

مقدمه

داده های زیادی در صنعت اطلاعات وجود دارد که بایستی به اطلاعات مفید تبدیل بشوند تا قابل دسترسی باشند، بنابراین آنالیز این داده های زیاد و استخراج اطلاعات مفید از آنها ضروری است که به این فرآیند در اصطلاح داده کاوی گفته می شود. در اینجا از الگوهای پرتکرار میتوان به عنوان یکی از مهمترین موضوعات تحقیقاتی در داده کاوی کارآفرینی نام برد. الگوهای پرتکرار، الگوهایی هستند که به صورت مداوم در داده های تراکنش رخ میدهند و در واقع تمام دفعات رخداد موارد مختلف را با هم ذخیره می کنند و سپس با آمارگیری از این تعداد دفعات داده های مشابه به نتیجه گیری های فوق العاده ای در رابطه با مسائل مختلف در شرکت ها، سازمان های بزرگ و استارت آپ ها میرسند که اگر قرار بود این فرآیند توسط هر تیم اجرایی-محاسباتی انجام بشود ممکن بود ماه ها و یا حتی سال ها به طول بینجامد. مورد حائز اهمیت در داده کاوی به دلیل اضافه شدن داده های جدید، این است که پایگاه داده ها بروزرسانی شود تا با وارد شدن داده ها به اطلاعات جدید و قابل بحثی دست پیدا کنند و در این مرحله است که الگوریتم های متنوعی ارائه شده است که البته مشکلات مهمی از جمله نیاز به حافظه و زمان بسیار زیاد و از همه مهمتر گم شدن بخشی از اطلاعات در روند پردازش داده های الگوهای پرتکرار در طول زمان بر اثر نوع الگوریتم را دارا می باشد و به همین دلیل احتمال شکست در نتیجه ی حاصل از داده کاوی را بسیار بالا می برد لذا در این مقاله با ارائه یک نوآوری در الگوریتم های پرتکرار باعث برطرف کردن تمام مشکلات موجود در تحقیقات گذشته شده و بایستی گفته شود که هیچ اطلاعاتی ازبین نمی رود و بدین ترتیب احتمال موفقیت شرکت ها، سازمان های بزرگ و استارت آپ ها به بالاترین حد امکان میرسد.

  • داده کاوی شاهد یک مسیر تکاملی در توسعه می باشد که شامل مراحل، جمع آوری داده و ایجاد پایگاه داده ، مدیریت داده ( ذخیره، بازیابی و پردازش داده(، آنالیز پیشرفته داده ها می باشد.
  • کاربردهای داده کاوی: داده کاوی در علم پزشکی، تخمین تعداد رای دهندگان در انتخابات، تشخیص تقلب توسط شرکتها، کنترل کیفیت توسط شرکتهای تولید کننده، مورد استفاده شرکتهای بانکی و در بسیاری از سازمان ها، استارت آپ ها، مشاغل و صنعت های دیگر قابل استفاده است. داده کاوی، این که چه نوع الگوهایی می توانند استخراج شود را مدیریت می کند.
  • داده کاوی در کارآفرینی: شرکت‌ها، سازمان های بزرگ و استارت آپ ها یک سری خدمات به مشتریان ارائه ‌می‌دهند و با آنها ارتباط مستمر برقرار ‌می‌کنند. از سوی دیگر اطلاعات زیادی از مشتریان به دست ‌می‌آورند و این موضوع سبب ‌می‌شود که داده‌های زیادی برای آنالیز رفتار مشتری در دست داشته باشند که تحلیل درست آنها، شرکت را به سودآوری بیشتر می‌رساند. داده کاوی در واقع یک روش است، یک روش که قرار است به واسطه آن مسئله‌ای حل شود. این روش بر روی حجم زیادی از داده‌ها کار ‌می‌کند و آنالیز مورد نیاز را انجام ‌می‌دهد، در نهایت یک سری الگوهای تکرارشونده استخراج ‌می‌شود که ‌می‌تواند برگ برنده باشد. سپس نوبت به پیدا کردن ارتباطات بین الگوهای مختلف است و در نهایت یک سری راه حل‌های مهم در این چالش ها وارد ‌می‌شود. دنیای امروز، دنیای ارتباطات است، ارتباط بین مکان و زمان‌های مختلف به طوری که اغلب موارد در بستر مجازی دنبال ‌می‌شود. اطلاعاتی که قرار است از مشتریانی اخذ شود که شاید هرگز دیده نشوند و یک نعمت بزرگ برای سازمان ها محسوب ‌می‌شوند و اهمیت زیادی دارند. داده کاوی بر روی یک سری اطلاعات کار ‌می‌کند که در نگاه اول احتمالاً کاربرد زیادی نخواهد داشت اما وقتی پژوهش‌های دقیق صورت می‌گیرد نتایج بدست آمده بسیار ارزشمند ‌می‌شود. بنابراین داده کاوی یک علم قوی است که ‌می‌تواند به همه بخش‌ها نفوذ داشته باشد، در دل اطلاعات برود و پاسخ به همه سوالاتی باشد که ایجاد ‌می‌شود. این علم در شرکت‌های بزرگ آنقدر مهم و شناخته شده است که بسیاری از برنامه‌ریزی‌ها بر اساس آن صورت ‌می‌گیرد. به عنوان مثال پیش از طراحی یک پروژه پرهزینه نیاز است که اطلاعات زیادی در مورد این پروژه مورد بررسی قرار گیرد تا بهترین تصمیم برای نحوه اجرای پروژه یا عدم اجرای آن گرفته شود.
  • مزایای استفاده از داده کاوی در کارآفرینی: میتوان از مزایای استفاده از داده کاوی به بهبود روش های بازاریابی، به حداقل رساندن ریسک، حداقل کردن خطرات کلاهبرداری ایجاد روش برای به دست آوردن مشتریان جدید و استفاده از تکنیک هایی برای حفظ آنها، طراحی و ساخت انبارهای داده براساس مزایای داده کاوی، تحلیل اثربخشی کمپانی های فروش، حفظ مشتری، آنالیز سبد بازار، تقسیم مشتری و بازاریابی هدفمند، مدیریت ارتباط با مشتری و پروفایل مشتری، شناسایی مشتریان سودآور برای فعالیت در بازار یا راه اندازی محصول جدید، سیستم های توصیه گر یا پیشنهاد گر استفاده کرد.
  • نوآوری: واژه‌ی نوآوری نخستین بار توسط ژوزف شومپیتر تعریف شد (مقیمی و همکاران، 1396). او نوآوری را با توسعه اقتصادی مرتبط دانست و آن را به عنوان ترکیب جدیدی از منابع مولد ثروت، معرفی كرد. لازم به توضیح است نوآوری پدیده‌ای نیست که فقط یکبار رخ دهد، بلکه فرآیندی مستمر و متشکل از فرآیند تصمیم‌گیری سازمانی در تمام مراحل، از توسعه ایده جدید تا کاربردی شدن آن است. امروزه نوآوری، فرآیندی تعاملی برای حل مشکل و یادگیری، تعریف می‌شود.عواملی نظیر کاهش سطح دسترسی به منابع، تشابه و کم شدن عمر استراتژی‌ها، حفظ جوانی و چالاکی، رقابت در بازارهای جهانی و غیره باعث روی آوردن سازمان‌ها به نوآوری و خلق ایده‌های انقلابی شده است تا بدینوسیله ارزش های مشتریان مجدداً تعریف شده و ارتقاء یابد.
  • نوآوری باز: نوآوری باز پارادایمی است که سازمان ها می‌توانند و می‌بایستی از ایده‌های خارجی مطرح شده در خارج از سازمان، همانند ایده‌های داخلی مطرح شده در داخل سازمان استفاده نمایند و این ایده‌ها را به سمت بازار هدایت کنند، همان‌طوری که سازمان ها به فناوری‌های پیشرفته توجه می‌کنند. موضوع اصلی پشتوانه نوآوری باز این است که در جهان، دانش به‌ طور گسترده‌ای توزیع شده است و شرکت‌ها و سازمان های بزرگ و استات آپ ها نمی‌توانند تنها به پژوهش و تحقیقات خود اتکاء نمایند و بایستی به خرید و یا فرآیندهای دریافت مجوز اختراعات از شرکت‌های دیگر اقدام نمایند. به‌علاوه اختراعات داخلی تنها در داخل سازمان مورد استفاده قرار نمی‌گیرد بلکه می‌بایستی در بیرون سازمان نیز مورد استفاده واقع شود. در نوآوری باز، سازمان ها داده های محیط را برای فناوری دانش آنالیز نموده و صرفاً به تحقیق و توسعه داخلی خود وابسته نیستند. درواقع پیش‌ شرط کلیدی نشان این است که سازمان ها از ظرفیت جذبشان استفاده نموده تا دانش خارجی را درون سازی و بومی‌سازی نمایند.

روش

در زمینه داده کاوی اطلاعات شرکت ها و سازمان های بزرگ و استارت آپ ها، الگوریتم های زیادی ارائه شده است که البته ایرادات مهمی از جمله نیاز به حافظه و زمان بسیار زیاد و از همه مهمتر گم شدن اطلاعات مهمی در روند پردازش داده های الگوهای پرتکرار در طول زمان بر اثر نوع الگوریتم می باشد را دارا است که به همین دلیل احتمال شکست در نتیجه ی حاصل از داده کاوی را بسیار بالا می برد لذا در ادامه به ذکر معایب چند الگوریتم ارائه شده، پرداخته می شود:

  • الگوریتم Apriori (Agrawal, 1994)، از معایب آن میتوان به نداشتن یک ساختار داده مناسب جهت نگهداری داده ها و همچنین اسکن زیاد پایگاه داده که به تبع آن افزایش زمان اجرا و حافظه مصرفی را به دنبال دارد، اشاره کرد لذا به همین دلیل برای داده کاوی سازمان ها مورد استفاده قرار نمی گیرد.
  • الگوریتم ECLAT (Zaki, 2000)، از معایب آن میتوان به حذف داده های نامکرر اشاره کرد که احتمال اینکه در بروزرسانی های بعدی پایگاه داده این داده ها در صورت وجود مکرر می شدند ولی در زمان بروزرسانی به دلیل حذف این داده ها در گذشته، به شمار نمی آیند لذا نتیجه گیری لازم از داده کاوی با خطای بالایی روبرو می شود و حتی ممکن است باعث شکست در تصمیم گیری و فعالیت های سازمان شود.
  • الگوریتم FP-growth (Han et al, 2000)، از معایب آن میتوان به دوبار اسکن پایگاه داده که باعث افزایش زمان اجرا و حافظه مصرفی می شود اشاره کرد و همچنین عدم قابلیت بروزرسانی داده ها به دلیل اینکه با حذف ، درج و تغییر در داده ها بایستی داده کاوی از ابتدا مجدداً تکرار شود و نمیتواند ساختار قبلی را بروزرسانی کند و این یک مشکل اساسی در سازمان های بزرگ که دارای پایگاه داده های بزرگ با بروزرسانی های فراوان هستند می باشد.
  • الگوریتم BIT (Totad et al, 2012)، با وجود اینکه ساختار این الگوریتم برای بروزرسانی های متعدد داده ها مناسب است ولی همچنان با مشکل دوبار اسکن پایگاه داده که باعث افزایش زمان اجرا و حافظه مصرفی می شود، می توان اشاره کرد و ایراد دوم آن حذف داده های نامکرر می باشد که در بروزرسانی های بعدی ممکن است نتیجه گیری لازم از داده کاوی با خطای بالایی روبرو شود و حتی باعث شکست در تصمیم گیری و فعالیت های سازمان شود.
  • الگوریتم GM (Roul et al, 2014)، با وجود اینکه این الگوریتم مشکل الگوریتم های قبلی را ندارد ولی به دلیل بسط ساختار آن و عدم فشرده بودن باعث افزایش حافظه مصرفی و در نتیجه زمان اجراء بالا می باشد که برای سازمان ها به دلیل داشتن پایگاه داده های بزرگ، به عنوان یک مشکل اساسی مطرح می شود.

در این پژوهش الگوریتمی ارائه می شود که به وسیله نوآوری در ساختار الگوریتم های قبلی توانسته نه تنها مشکلات تمام الگوریتم های گذشته را برطرف کند بلکه باعث شود هیچ داده و اطلاعاتی ازبین نرود و بدین ترتیب احتمال موفقیت شرکت ها، سازمان های بزرگ و استارت آپ ها را به بالاترین حد امکان می رساند. ساختار الگوریتم بدینصورت است که با ورود اولین داده ها و اسکن و چینش داده ها بصورت همزمان یک لیست موقت برای درج تراکنش ها ساخته شده تا در زمان بروزرسانی داده ها در طول زمان نیازی به اسکن مجدد پایگاه داده نباشد و درعین حال بالاترین فشردگی را در زمان چینش داده ها داشته باشد که این فرآیند باعث می شود که حافظه مصرفی و همچنین زمان اجراء خیلی پایین بیاید و همچنین در این الگوریتم پیشنهادی با حذف نکردن داده های نامکرر و ذخیره آن در لیست موقت باعث شده که در بروزرسانی های آتی اگر مواردی مشابه آن داده ها وارد پایگاه داده شد، تمام اطلاعات از پیشینه سازمان در دست باشد و بدین وسیله بتوان در صورت داشتن حداقل آستانه پرتکرار شدن، جزء الگوهای پرتکرار به حساب بیاید و در نتیجه بهترین و اصولی ترین جواب و تصمیم ممکن را با داشتن اطلاعات دقیق از داده کاوی داده های سازمان در رابطه با مسائل مورد نظر داده شود. لذا ساختار این الگوریتم پیشنهادی به گونه ای است که مناسب برای تمامی شرکت ها و سازمان های بزرگ و استارت آپ ها بوده و با سریع ترین زمان اجرا و بهترین آنالیز و تشخیص چالشهای کارآفرینی به وسیله آنالیز پایگاه داده موردنظر میتواند بهترین گزینه انتخابی برای سازمان ها باشد.

نتایج

در این بخش، روش پیشنهادی در مقایسه با دو روش BIT و GM  که در گذشته ارائه شده با استفاده از 4مجموعه دادگان متفاوت که مشخصات آن در جدول(1) آمده است، مورد ارزیابی قرار می گیرد. بدین منظور زمان های مربوط به اجراء در محیط های ایستا و پویا، همچنین کاویدن افزایشی الگوهای مکرر مورد بررسی قرار می گیرد. تمامی برنامه ها در محیط مایکروسافت ویژوال استادیو 2012 و با زبان برنامه نویسی #C پیاده سازی شده و بر روی ویندوز 7 با CPU، GHz 66/2 و حافظه  GB4 اجرا گردیده است. زمان اجرای محاسبه شده در هر آزمایش میانگین زمان حاصل از چندین مرتبه اجرای برنامه ها می باشد. برای انجام این آزمایشات از مجموعه دادگان استاندارد مناسبی مانند مجموعه دادگان FIMI1 و IBM استفاده می شود که از سه مجموعه دادگان متراکم Mushroom و Connect و Chess و یک مجموعه دادگان غیرمتراکمT1014D100K  استفاده شده است. از بین مجموعه داده های مورد استفاده، T1014D100K  از مجموعه داده های مصنوعی می باشد که توسط (Koh et al, 2004)، ارائه گردیده است و سایر مجموعه داده ها یعنی Mushroom و Connect و Chess از مجموعه داده های واقعی می باشند که از  (Leung et al, 2007)، به دست آمده اند.

جدول (1): ویژگی های مجموعه های داده ها

  • زمان اجرا در حالت ایستا: هدف از آزمایشات انجام شده در این بخش، بررسی زمان اجراء الگوریتم های BIT و GM و الگوریتم پیشنهادی این تحقیق در یک محیط ایستا می باشد بدین ترتیب که 100% پایگاه داده این چهار مجموعه داده ذکر شده در بخش قبلی با حداقل آستانه های متفاوت مورد آزمایش قرار می گیرد و نتایج حاصل با یکدیگر مقایسه می شود. همانطور که در شکل(1) مشاهده می شود در مدل پیشنهادی زمان اجراء الگوریتم پیشنهادی نسبت به GM به طور قابل ملاحظه ای بهبود یافته و به زمان BIT نزدیک شده است و این نتیجه نشان دهنده فشردگی مناسب الگوریتم پیشنهادی می باشد و این اختلاف زمانی مدل پیشنهادی که نسبت به BIT وجود دارد به دلیل وجود پیمایش تمام الگوهای مکرری است که در BIT گمشده است.

شکل (1): نمودار زمان اجراء الگوریتم های BIT و GM و الگوریتم پیشنهادی در مجموعه داده های مختلف در یک محیط ایستا

  • زمان اجرا در حالت پویا: هدف از آزمایشات انجام شده در این بخش، بررسی زمان اجراء در الگوریتم های BIT و GM و الگوریتم پیشنهادی این تحقیق در یک محیط پویا می باشد بدین ترتیب که 70% و 80% و 90% و 100% این چهار مجموعه داده با حداقل آستانه ثابت مورد آزمایش قرار می گیرد و نتایج حاصل با یکدیگر مقایسه می شود. همانطور که در شکل(2) مشاهده می شود در روش پیشنهادی زمان اجراء به طور قابل توجهی نسبت به الگوریتمGM ، بهبود %60 داشته است و این بهبودی نشان دهنده فشردگی مناسب الگوریتم پیشنهادی و یکبار اسکن شدن پایگاه داده می باشد و این تفاوت زمان اجرایی که روش پیشنهادی با الگوریتم BIT دارد به دلیل گم شدن یکسری از الگوهای مکرر در BIT است زیرا درغیر اینصورت زمان اجرای الگوریتم روش پیشنهادی از BIT نیز کمتر می باشد.

شکل (2): نمودار زمان اجراء الگوریتم های BIT و GM و الگوریتم پیشنهادی در مجموعه داده های مختلف در یک محیط پویا

  • کاویدن افزایشی الگوهای مکرر: هدف از آزمایشات انجام شده در این بخش، بررسی کاویدن افزایشی الگوهای مکرر الگوریتم های BIT و GM و الگوریتم پیشنهادی این تحقیق در یک محیط پویا می باشد بدین ترتیب که 70% و 80% و 90% و 100% این چهار مجموعه داده با حداقل آستانه ثابت مورد آزمایش قرار می گیرد و نتایج حاصل با یکدیگر مقایسه می شود. همانطور که در شکل(2) مشاهده می شود در روش پیشنهادی نسبت به الگوریتمBIT، کاویدن افزایشی الگوهای مکرر بهبود 100% داشته و این الگوریتم همانند الگوریتم GM، تمام الگوهای مکرر را پیدا می کند، بدین دلیل که با حذف نکردن آیتم های نامکرر، با افزایش پایگاه داده و بروزرسانی های بعدی، داده های نامکرر به مکرر تبدیل شده و در این میان در روش پیشنهادی میتوان همانند GM تمام الگوهای مکرر را استخراج کرد.

شکل (3): نمودار کاویدن افزایشی الگوهای مکرر الگوریتم های BIT و GM و الگوریتم پیشنهادی در مجموعه داده های مختلف

بحث و نتیجه گیری

با توجه با آزمایشات انجام شده در این مقاله نتیجه می شود که در این روش پیشنهادی با ایجاد یک لیست موقت تراکنش، پایگاه داده فقط یکبار اسکن شده و در نتیجه در حافظه و زمان اجراء بهبودی چشمگیری حاصل شده است، بدین ترتیب که زمان اجراء در حالت ایستا تقریبا80% و در حالت پویا تقریبا 60% نسبت به الگوریتم GM بهبودی داشته است و نیز با حذف نکردن آیتم های نامکرر، الگوی مکرر گمشده وجود نخواهد داشت و همانند الگوریتم GM، 100% الگوهای مکرر یافت می شود. بدین ترتیب با توجه به نتایج بدست آمده از آزمایشات با استفاده از مجموعه دادگان مختلف گفته می شود که این الگوریتم پیشنهادی می تواند بهترین گزینه برای آنالیز و تشخیص چالشهای کارآفرینی در شرکت ها و سازمان های بزرگ و استارت آپ ها باشد و میتوان با اطمینان خاطر از اینکه هیچ داده و اطلاعاتی در این داده کاوی نادیده گرفته نمی شود به نتایج حاصل از آن اعتماد کرده و در تشخیص مسائل و چالشها، تصمیم و انتخاب عمل در شرکت ها و سازمان های بزرگ و استارت آپ ها از آن استفاده نمود.

 

منابع

مقیمی.سیدمحمد، وکیلی.یوسف، اکبری.مرتضی، “نظریه های کارآفرینی”، موسسه انتشارات دانشگاه تهران، 1396، صفحات 178-166.

Han, Jiawei, Jian Pei, and Yiwen Yin. “Mining frequent patterns without candidate generation.” ACM SIGMOD Record. Vol. 29, No. 2, ACM, 2000.

Koh, Jia-Ling, and Shui-Feng Shieh. “An efficient approach for maintaining association rules based on adjusting FP-tree structures.” Database Systems for Advanced Applications. Springer Berlin Heidelberg, 2004.

Leung, Carson Kai-Sang, et al. “CanTree: a canonical-order tree for incremental frequent-pattern mining.” Knowledge and Information Systems, vol. 11, no. 3, pp. 287-311, 2007.

R.S.Rakesh Agrawal. “Fast algorithms for mining association rules.” 20th Int. Conf. Very Large Data Bases, Vol. 1215, pp. 487-499. 1994.

Roul, Rajendra Kumar, and Ishaan Bansal. “GM-Tree: An efficient frequent pattern mining technique for dynamic database.” Industrial and Information Systems (ICIIS), International Conference on. IEEE, 2014.

Totad, S. G., Geeta, R. B., & Reddy, P. P. “Batch incremental processing for FP-tree construction using FP-Growth algorithm.” Knowledge and information systems, vol. 33, no. 2, pp. 475-490, 2012.

Zaki, Mohammed J. “Scalable algorithms for association mining.” Knowledge and Data Engineering, IEEE Transactions on, vol. 12, no. 3, pp. 372-390, 2000.

 

Fifth National Conference on Economics, Management and Accounting

Innovation in recurring patterns of software data mining to analyze and identify entrepreneurial challenges in large companies and organizations and startups

1.Donya Ain ali varnos faderani (CEO of Successful Business World Institute)

2.Ebrahim Payandeh najaf abadi (Chairman of the Board of the Successful Business World Institute)

Abstract:

The present study was conducted to innovate in repetitive patterns of software data mining to analyze and identify entrepreneurial challenges in companies and large organizations and startups and by experimental method. In order to achieve the research objectives, the conditions and performance of memory consumption and execution time as well as the number of frequently lost patterns have been examined because their performance has a direct impact on the results of the whole organization and is one of the best options for analyzing and identifying entrepreneurial challenges. Large companies and organizations and startups. Companies, large organizations and start-ups need information to make decisions and plans, some of which comes from the database mining of companies, large organizations and start-ups themselves, and the rest from environmental data outside of them. stems from. This information obtained from data mining reflects the behavior of customers and partners and indicates the success or failure of companies, large organizations and startups in a particular decision and action. Sophisticated mathematical algorithms must be used to extract useful information, as well as to predict future results and the relationships between them. So far, many algorithms have been proposed, but the important drawbacks, including the need for a lot of memory and time, and most importantly, the loss of important information in the process of processing data of repetitive patterns over time due to the type of algorithm, which is why the probability of failure As a result, it greatly enhances data mining, so in this article, an attempt has been made to innovate in repetitive algorithms to solve all the problems in previous research and not lose any information, and thus the probability of success of companies. Large organizations and startups reach the highest possible level.

Keywords: Entrepreneurship, data mining in entrepreneurship, challenge analysis, innovation.