هوش مصنوعی و حوزه وسیع‌تر علوم داده به سرعت در حال ایجاد تحول در زمینه‌های مطالعه هستند و خطوط بین فناوری‌ها و اصطلاحات مختلف غالباً تار است. بسیاری از آنها در روش‌ها و برنامه‌های خود با یک دیگر همپوشانی دارند و برخی نیز زیر مجموعه ایده‌های گسترده‌تری هستند. داده کاوی و یاد گیری ماشین دو اصطلاحی هستند که گاهی اوقات به صورت متقابل مورد استفاده قرار می‌گیرند، اما تفاوتهای مهمی بین آنها وجود دارد که درک آنها مهم است.
 

کاوش برای معنا

داده کاوی اصطلاحی عمومی برای کشف الگوهای پنهان در مجموعه داده‌های بزرگ با استفاده از روش‌هایی است که شامل یاد گیری ماشین است. این شامل رویکردهایی مانند تجزیه و تحلیل خوشه‌ای است، که به طور خودکار موارد را با توجه به خصوصیات مشترک، و نیز تشخیص ناهنجاری و دیگر تکنیک‌های لازم و ملزوم در یک مجموعه داده گروه بندی می‌کند. همچنین روابط بین متغیرهای بیشمار و ثابت در داده‌ها را تجزیه و تحلیل می‌کند تا پیش بینی‌های لازم را انجام دهد. این اغلب با تجزیه و تحلیل داده‌ها که برای آزمایش مدل‌ها و فرضیه‌های داده استفاده می‌شود اشتباه گرفته می‌شود.
 
با در نظر گرفتن همه این موارد، می‌توان نتیجه گرفت که اصطلاح داده کاوی در واقع یک اسم بی مسماست. از این گذشته، استخراج طلا به ماده استخراج شده اشاره دارد، نه مکانی که از آن استخراج شده است. در مورد داده کاوی، همین اصل اعمال می‌شود – داده‌هایی نیست که قرار است استخراج شوند، بلکه در عوض، از داده‌ها فهم استخراج می‌شود. یک اصطلاح تحت الفظی‌تر شاید بصیرت کاوی یا معنا کاوی باشد.
 
به همین دلیل است که داده کاوی گاهی به عنوان "کشف دانش" نیز شناخته می‌شود. این جستجوی سوزن دانش در انبار کاه مجموعه داده‌ای عظیم است - کاری که حتی برای کامل شدن توسط یک کامپیوتر سریع، دقیق و خستگی ناپذیر نیاز به کمک کردن به آن است.
 

یاد گیری و بهبود

تکنیک‌های داده کاوی به دنبال الگوهایی در داده‌ها، تجزیه و تحلیل و استخراج بینش هستند. قبل از ظهور هوش مصنوعی، آنها از رویکردهای سنتی به نرم افزار استفاده می‌کردند - یعنی شما مجبور بودید دقیقاً به برنامه بگویید که چه کاری انجام دهد و به دنبال چه چیزی هستید.
 
یاد گیری ماشین نیز با داده‌ها سر و کار دارد، اما به روشی کاملاً متفاوت. یاد گیری ماشین زیر مجموعه‌ای از فناوری هوش مصنوعی است که به توانایی یک سیستم هوش مصنوعی در تجزیه و تحلیل اطلاعات و ترسیم بینش می‌پردازد. تا کنون، بسیار آشناست. اما آنچه یاد گیری ماشین را جدا می‌کند، توانایی تصمیم گیری، آموختن از آنها و استفاده از آن دروس برای تصمیم گیری بهتر در آینده است.
 
برای به دست آوردن سطح عمیق‌تری از بینش یا طبقه بندی مقادیر زیادی از داده‌ها، مدل‌های یادگیری ماشین تحت نظارت یا نیمه نظارت بر روی داده‌های انتخاب شده و برچسب زده شده آموزش داده می‌شوند تا آنها بدانند که به دنبال چه چیزی هستند. یک مدل هوش مصنوعی می‌تواند یاد بگیرد که برخی از ویژگی‌های تعریف کننده در داده‌های آموزش را تشخیص دهد، و یک چارچوب مرجع برای اداره داده‌های بعدی ایجاد کند.
 
این تخصص، که حاصل از تجربه است، این مدل‌های یادگیری ماشین را بهبود می‌بخشد، و با استفاده از دانشی که در هنگام تجزیه و تحلیل داده‌ها یا انجام یک کار جمع آوری می‌کنند، دقیق‌تر و مؤثرتر می‌شوند. و پس از آموزش، آنها ممکن است بتوانند با داده‌های بدون ساختار کار کنند، زیرا می‌توانند ویژگی‌های مربوطه را بدون نیاز به پیش برچسب زدن تشخیص دهند.
 

جستجو برای روند

یکی از کاربردهای مهم داده کاوی در بیمه است که در آن روندها را می‌توان در مقادیر زیادی از مطالبات جستجو کرد. این امر به شرکتهای بیمه اجازه می‌دهد تا شرایط پوشش بیمه و حق بیمه خود را بر این اساس تنظیم کنند.
 
زیر مجموعه‌ای از داده کاوی به نام متن کاوی اغلب برای این منظور استفاده می‌شود. در ساده‌ترین شکل، این یک جستجوی کلمه کلیدی است ، مانند دستور Find در یک برنامه. داده کاوی اصطلاحی عمومی برای کشف الگوهای پنهان در مجموعه داده‌های بزرگ با استفاده از روش‌هایی است که شامل یاد گیری ماشین است. اما استخراج متن امروزی می‌تواند از منطق تصمیم گیری و پردازش زبان طبیعی برای برقراری روابط بین موارد داده - به عنوان مثال ، مکانها و سنین مشتریان - استفاده کند. این متن کاوی پیشرفته حتی می تواند احساسات مشتری را تحلیل کند، مانند عدم رضایت، که به بیمه گذار اجازه می‌دهد سیاست‌ها و خدماتی که بهتر در جهت این نیازها هدف گیری می‌کنند را طراحی و برنامه ریزی کند.
 
به عنوان مثال، اگر بسیاری از مشتریان زیر 20 سال از زبان منفی در مورد موضوعات قیمت گذاری بیمه اتومبیل استفاده می‌کنند، متن کاوی این امر را کشف می‌کند و شرکت بیمه می‌تواند حق بیمه قابل تحمل‌تری را برای مشتریان جوان تعیین کند، که در این صورت احتمالاً نیازهای بیمه‌ای خود را کمتر از جای دیگری تأمین خواهند کرد. این تنها یک نمونه از انواع داده کاوی بینش می‌تواند باشد و مزایایی که به کسب و کار ارائه می‌دهد.
 

درک گذشته و آینده بازار

خدمات مالی به سرعت از یاد گیری ماشین بهره مند شده‌اند. یک مطالعه انجام شده در سال 2019 توسط Refinitiv (تامسون روترز سابق) نشان داد که 90٪ از پاسخ دهندگان قبلاً یاد گیری ماشین را در مشاغل خود مستقر کرده بودند. از این گذشته، 78 درصد گفتند که یاد گیری ماشین جزء اصلی استراتژی تجاری آنها است. این گزارش همچنین به این نتیجه رسیده است که یاد گیری ماشین بزرگترین عامل ایجاد مزیت رقابتی در خدمات مالی است.
 
مشاغل مالی مشتاق هستند تا از مهارتهای یاد گیری ماشین برای تجزیه و تحلیل شرایط فعلی بازار و آموختن از داده‌های تاریخی برای به دست آوردن بینش تجاری، عملکرد قضاوت و پیدا کردن زمینه‌هایی با خطر بالقوه استفاده بیشتری کنند. این صنعت همیشه از پذیرش فن آوری، از چرتکه گرفته تا سیستم‌های تجارت خودکار زود هنگام و نوآوری‌های امروزی مبتنی بر هوش مصنوعی، پذیرای علاقه‌مندان به فناوری بوده است.
 

حفر کردن حتی عمیق‌تر

با وجود شکل‌های حتی پیشرفته‌تر یاد گیری ماشین، مانند یاد گیری عمیق، تکنیک‌های داده کاوی هم اکنون می‌توانند سطحی از بینش و دقت بی نظیر را به دست آورند، و برای برنامه‌هایی که قبلاً غیر قابل تصور بودند، استفاده شوند. آیا بینش انقلابی بعدی که آنها کشف خواهند کرد چیست؟
 
منبع:  والری بیکرت ELEMENT AI