تاریخ بروز رسانی :
۱۹
فروردین
۱۴۰۲
بلومبرگ از ChatGPT امور مالی به نام «BloombergGPT» رونمایی کرد
بلومبرگ به مانند ChatGPT که روزانه برای اهداف مختلفی در چت باتها به کار گرفته میشود، برای دنیای مالی یک مدل هوش مصنوعی طراحی کرده است.
زمان مطالعه :
1 دقیقهفهرست
در مقالهای که بلومبرگ اخیراً منتشر کرده، از کارایی این محصول خود در مقیاس وسیع سخن گفته و اظهار داشته که در آن از آن نوع تکنیکهای هوش مصنوعی که GPT برای مجموعه دادههای مالی خود استفاده میکند، بهره برده است. رسانه حرفهای بلومبرگ با بیش از چهار دهه فعالیت، منبعی مهم برای دادههای بازار مالی در تجارت و امور مالی بوده است. به همین دلیل در این مدت تعداد زیادی مجموعه داده اختصاصی و مدیریتشده را جمعآوری کرده یا توسعه داده است. از بسیاری جهات، این دادهها به منزله جواهراتِ تاج بلومبرگ هستند و در این نسخه از BloombergGPT، از این دادههای اختصاصی برای ساختن یک ابزار تحقیق و تحلیل مالی که تاکنون نظیرش در دنیای مالی مشاهده نشده، استفاده شده است.
مدلهای زبانی عمدهای که چنین پروژههای هوش مصنوعی را تقویت میکنند، ماهیت نحوی و معنایی دارند و برای پیشبینی نتیجهای جدید بر اساس روابط موجود در متون منبع به کار میروند.
الگوریتمهای یادگیری ماشینی (هوش مصنوعی) طی فرآیندی که «آموزش» نام دارد، از دادههای منبع آموزش میبینند و یک مدل تولید میکنند. آموزش مدل BloombergGPT تقریباً به ۵۳ روز محاسبات روی ۶۴ سرور نیاز داشت که هر کدام شامل ۸ پردازنده گرافیکی NVIDIA A100 چهل گیگابایتی بودند. برای مقایسه، وقتی از ChatGPT استفاده میکنیم، یک ورودی به یک مدل (یا فرمول) ارائه میکنیم که به عنوان prompt شناخته میشود، سپس این مدل یک خروجی تولید میکند؛ مانند وارد کردن یک مقدار (ورودی) به یک فرمول و مشاهده خروجی آن. تولید این مدلها به مقادیر عظیمی از توان محاسباتی نیاز دارد؛ در نتیجه بلومبرگ برای تولید این محصول با شرکایی چون NVIDIA و خدمات وب آمازون همکاری کرد.
از آنجایی که خرید هر GPU جدید، هزاران دلار هزینه دارد و تنها برای مدت زمان نسبی کوتاهی برای تولید مدل میتوان از آن استفاده کرد، تیم BloombergGPT بهکارگیری خدمات ابری AWS را برای اجرای این محاسبات انتخاب کرد. همچنین هزینه هر نمونه سرور ۳۳ دلار در ساعت است، پس با حسابی سرانگشتی میتوان این مدل را با هزینهای بالغ بر ۲.۷ میلیون دلار تولید کرد.
بخش تقویت کردن محتوای یک هوش مصنوعی نیاز به تقسیم کردن محتوا به تکهها یا نشانهها دارد. یکی از این روشها، روشی است که میتوانیم یک مقاله را به کلمات کلیدی آن تجزیه کنیم؛ اگرچه ممکن است راهبردهای دیگری برای نشانهسازی یا تقسیمبندی یک مقاله، مانند شکستن آن به جملات یا پاراگرافها وجود داشته باشد. یک الگوریتم نشانهساز تعیین میکند که محتوا با چه قسمتبندی باید قطعه قطعه شود، زیرا، برای مثال، بخش بخش کردن یک مقاله به حروف ممکن است منجر به از بین رفتن بافت متن یا معنی آن شود. این نوع قطعهبندی عملاً هیچ کارایی نخواهد داشت. هوش مصنوعی BloombergGPT منبع داده مالی خود را با استفاده از مدل Unigram به ۳۶۳ میلیارد توکن یا نشانه تقسیم میکند که کارایی و مزایای خاصی را ارائه میدهد.
تیم بلومبرگ از PyTorch، پک کامل یادگیری رایگان و منبع باز محبوب مبتنی بر پایتون، برای آموزش BloombergGPT استفاده کرده است.
در مورد BloombergGPT، مجموعه دادههای این منبع شامل اخبار مالی، پروندههای مالی شرکت، بیانیههای مطبوعاتی و محتوای اخبار بلومبرگ است که همگی توسط بلومبرگ طی دههها نظارت و جمعآوری شدهاند.
علاوهبراین منابع مالی خاص، BloombergGPT در برخی از مجموعه دادههای عمومی و رایج مانند The Pile، The Colossal Clean Crawled Corpus یا C4 و ویکیپدیا ادغام میشود. در مجموع، این هوش مصنوعی میتواند روشی کاملاً جدید برای انجام تحقیقات مالی ارائه دهد.
در دوره آموزشیِ این هوش مصنوعی از دادههای اول مارس ۲۰۰۷ تا ۳۱ ژوئیه ۲۰۲۲ بلومبرگ استفاده خواهد شد. بلومبرگ نام این مجموعه مالی از دادهها را FINPILE گذاشته است. FINPILE از پنج منبع اصلی محتوای مالی تشکیل شده است که عبارتند از:
وب مالی: محتوای عمومی وب (مانند وبسایتها و اسناد)، اما محدود به سایتهایی خاص که در رده سایتهای با مضامین اقتصادی قرار میگیرند. حتی در این دسته، BloomberGPT فقط سایتهای معتبر و باکیفیت را در نظر میگیرد.
اخبار مالی: این هوش مصنوعی سایتهای خبریای که محتوای خبری تولید میکنند با اعمال نظارتی دقیق در خود جای داده است.
پروندههای شرکت: هرکسی که تحقیقی در یک شرکت دولتی انجام میدهد باید پروندههای آن شرکت را مطالعه کند. در ایالات متحده، پایگاه داده EDGAR SEC منبعی است که معمولاً از آن برای جستجو و بازیابی پروندهها استفاده میشود.
بیانیههای مطبوعاتی: بیانیههای عمومی یک شرکت اغلب میتواند حاوی اطلاعات مالی باشد و این به عنوان منبعی در BloombergGPT گنجانده شده است.
اخبار بلومبرگ: با توجه به اینکه بلومبرگ خود نیز یک شرکت رسانهای است، از محتوای خبری آن استفاده و به BloombergGPT داده شد. این محتوا شامل نظرات و بخشهای تجزیه و تحلیل است.
اگرچه هنوز مشخص نیست BloombergGPT چه تأثیری بر صنعت فینتک خواهد گذاشت، اما برخی از کاربردهای احتمالی آن ممکن است شامل موارد زیر باشد:
۱. ایجاد پیشنویس اولیه تشکیل پرونده در کمیسیون بورس و اوراق بهادار؛ با توجه به حجم زیادی از دادههای پرونده ها و بسیار شبیه به ChatGPT که می تواند یک پرونده ثبت اختراع موقت یا کد برنامه نویسی سفارشی تولید کند، این محصول بلومبرگ میتواند پرونده SEC بسازد که به طور بالقوه هزینه تشکیل پرونده را کاهش میدهد.
۲. مقاله BloombergGPT؛ خلاصه کردن یک مبحث با محتوای مالی در قالب یک عنوان. برای مثال اگر متنی به این صورت به آن داده شود: بر اساس گزارش Redn، ارزش بازار مسکن ایالات متحده در نیمه دوم سال۲۰۲۲، ۲.۳ تریلیون دلار (۴.۹٪) کاهش یافته است. این بزرگترین افت درصدی از زمان بحران مسکن در سال ۲۰۰۸ بوده است، زمانی که قیمت مسکن در مدت مشابه ۵.۸٪ کاهش یافته بود. طبق این متن BloombergGPT خروجی زیر را تولید خواهد کرد: «قیمت خانه بیشترین کاهش را در ۱۵ سال گذشته داشته است.»
۳. ارائه نمودار شرکتی از یک سازمان و ارتباط بین یک فرد و چندین شرکت؛ از آنجایی که نام شرکت و نام مدیران در مدل BloombergGPT وارد شده است، این امکان کاملاً وجود دارد که بتوان حداقل برای ساختار سطح اجرایی این سازمان را مورد بررسی قرار داد.
۴. اتوماسیون تولید پیش نویس گزارشهای معمول بازار و خلاصه برای مشتریان
۵. بازیابی عناصر خاص صورتهای مالی برای دورههای خاص تنها با فیلتر کردن یک مقدار
بهطور خلاصه BloombergGPT نشاندهنده جهشی به جلو برای جوامع مالی و هوش مصنوعی است. در حال حاضر، این مدل به صورت عمومی در دسترس نیست و هیچ API و حتی یک رابط چت برای دسترسی به آن وجود ندارد. زمان عرضه این محصول و اینکه آیا اصلاً در دسترس عموم قرار خواهد گرفت یا بازبینیهای دیگری در ساختار فعلی این مدل صورت خواهد گرفت یا خیر، اطلاعی در دست نیست. تیم BloombergGPT در این خصوص اظهار کردند «ما جانب احتیاط را رعایت میکنیم و از رویه سایر توسعهدهندگان LLM در عدم انتشار مدل خود پیروی میکنیم و آن را در دسترس عموم قرار نمیدهیم.»
با ارزشگذاری کمپانی هوش مصنوعی OpenAI بالغ بر ۲۰ میلیارد دلار، کیست که بتواند از آنها ایراد بگیرد؟!
چنانچه به مشاوره رایگان علاقهمندید، پرسشها و نظرات خود را درباره این مقاله یا موضوعات مختلف حوزه بلاکچین و ارزهای دیجیتال مطرح کنید. برای پاسخگویی آمادهایم!
نظر بدهید
0