0

0

بلومبرگ از ChatGPT امور مالی به نام «BloombergGPT» رونمایی کرد

بلومبرگ به مانند ChatGPT که روزانه برای اهداف مختلفی در چت بات‌ها به کار گرفته می‌شود، برای دنیای مالی یک مدل هوش مصنوعی طراحی کرده است.

رونمایی بلومبرگ از BloombergGPT
هستی تاری

زمان مطالعه :

1 دقیقه

در مقاله‌ای که بلومبرگ اخیراً منتشر کرده، از کارایی این محصول خود در مقیاس وسیع سخن گفته و اظهار داشته که در آن از آن نوع تکنیک‌های هوش مصنوعی که GPT برای مجموعه داده‌های مالی خود استفاده می‌کند، بهره برده است. رسانه حرفه‌ای بلومبرگ با بیش از چهار دهه فعالیت، منبعی مهم برای داده‌های بازار مالی در تجارت و امور مالی بوده است. به همین دلیل در این مدت تعداد زیادی مجموعه داده اختصاصی و مدیریت‌شده را جمع‌آوری کرده یا توسعه داده است. از بسیاری جهات، این داده‌ها به منزله جواهراتِ تاج بلومبرگ هستند و در این نسخه از BloombergGPT، از این داده‌های اختصاصی برای ساختن یک ابزار تحقیق و تحلیل مالی که تاکنون نظیرش در دنیای مالی مشاهده نشده، استفاده شده است.

ارز دیجیتال

مدل‌های زبانی عمده‌ای که چنین پروژه‌های هوش مصنوعی را تقویت می‌کنند، ماهیت نحوی و معنایی دارند و برای پیش‌بینی نتیجه‌ای جدید بر اساس روابط موجود در متون منبع به کار می‌روند.

الگوریتم‌های یادگیری ماشینی (هوش مصنوعی) طی فرآیندی که «آموزش» نام دارد، از داده‌های منبع آموزش می‌بینند و یک مدل تولید می‌کنند. آموزش مدل BloombergGPT تقریباً به ۵۳ روز محاسبات روی ۶۴ سرور نیاز داشت که هر کدام شامل ۸ پردازنده گرافیکی NVIDIA A100 چهل گیگابایتی بودند. برای مقایسه، وقتی از ChatGPT استفاده می‌کنیم، یک ورودی به یک مدل (یا فرمول) ارائه می‌کنیم که به عنوان prompt شناخته می‌شود، سپس این مدل یک خروجی تولید می‌کند؛ مانند وارد کردن یک مقدار (ورودی) به یک فرمول و مشاهده خروجی آن. تولید این مدل‌ها به مقادیر عظیمی از توان محاسباتی نیاز دارد؛ در نتیجه بلومبرگ برای تولید این محصول با شرکایی چون NVIDIA و خدمات وب آمازون همکاری کرد.

از آنجایی که  خرید هر GPU جدید، هزاران دلار هزینه دارد و تنها برای مدت زمان نسبی کوتاهی برای تولید مدل می‌توان از آن استفاده کرد، تیم BloombergGPT به‌کارگیری خدمات ابری AWS را برای اجرای این محاسبات انتخاب کرد. همچنین هزینه هر نمونه سرور ۳۳ دلار در ساعت است، پس با حسابی سرانگشتی می‌توان این مدل را با هزینه‌ای بالغ بر ۲.۷ میلیون دلار تولید کرد.

بخش تقویت کردن محتوای یک هوش مصنوعی نیاز به تقسیم کردن محتوا به تکه‌ها یا نشانه‌ها دارد. یکی از این روش‌ها، روشی است که می‌توانیم یک مقاله را به کلمات کلیدی آن تجزیه کنیم؛ اگرچه ممکن است راهبردهای دیگری برای نشانه‌سازی یا تقسیم‌بندی یک مقاله، مانند شکستن آن به جملات یا پاراگراف‌ها وجود داشته باشد. یک الگوریتم نشانه‌ساز تعیین می‌کند که محتوا با چه قسمت‌بندی باید قطعه قطعه شود، زیرا، برای مثال، بخش بخش کردن یک مقاله به حروف ممکن است منجر به از بین رفتن بافت متن یا معنی آن شود. این نوع قطعه‌بندی عملاً هیچ کارایی نخواهد داشت. هوش مصنوعی BloombergGPT منبع داده مالی خود را با استفاده از مدل Unigram به ۳۶۳ میلیارد توکن یا نشانه تقسیم می‌کند که کارایی و مزایای خاصی را ارائه می‌دهد.

تیم بلومبرگ از PyTorch، پک کامل یادگیری رایگان و منبع باز محبوب مبتنی بر پایتون، برای آموزش BloombergGPT استفاده کرده است.

در مورد BloombergGPT، مجموعه داده‌های این منبع شامل اخبار مالی، پرونده‌های مالی شرکت، بیانیه‌های مطبوعاتی و محتوای اخبار بلومبرگ است که همگی توسط بلومبرگ طی دهه‌ها نظارت و جمع‌آوری شده‌اند.

علاوه‌براین منابع مالی خاص، BloombergGPT در برخی از مجموعه داده‌های عمومی و رایج مانند The Pile، The Colossal Clean Crawled Corpus یا C4 و ویکی‌پدیا ادغام می‌شود. در مجموع، این هوش مصنوعی می‌تواند روشی کاملاً جدید برای انجام تحقیقات مالی ارائه دهد.

در دوره آموزشیِ این هوش مصنوعی از داده‌های اول مارس ۲۰۰۷ تا ۳۱ ژوئیه ۲۰۲۲ بلومبرگ استفاده خواهد شد. بلومبرگ نام این مجموعه مالی از داده‌ها را  FINPILE گذاشته است. FINPILE از پنج منبع اصلی محتوای مالی تشکیل شده است که عبارتند از:

وب مالی: محتوای عمومی وب (مانند وبسایت‌ها و اسناد)، اما محدود به سایت‌هایی خاص که در رده سایت‌های با مضامین اقتصادی قرار می‌گیرند. حتی در این دسته، BloomberGPT فقط سایت‌های معتبر و باکیفیت را در نظر می‌گیرد.

اخبار مالی: این هوش مصنوعی سایت‌های خبری‌ای که محتوای خبری تولید می‌کنند با اعمال نظارتی دقیق در خود جای داده است.

پرونده‌های شرکت: هرکسی که تحقیقی در یک شرکت دولتی انجام می‌دهد باید پرونده‌های آن شرکت را مطالعه کند. در ایالات متحده، پایگاه داده EDGAR SEC منبعی است که معمولاً از آن برای جستجو و بازیابی پرونده‌ها استفاده می‌شود.

بیانیه‌های مطبوعاتی: بیانیه‌های عمومی یک شرکت اغلب می‌تواند حاوی اطلاعات مالی باشد و این به عنوان منبعی در BloombergGPT گنجانده شده است.

اخبار بلومبرگ: با توجه به اینکه بلومبرگ خود نیز یک شرکت رسانه‌ای است، از محتوای خبری آن استفاده و به BloombergGPT داده شد. این محتوا شامل نظرات و بخش‌های تجزیه و تحلیل است.

اگرچه هنوز مشخص نیست BloombergGPT چه تأثیری بر صنعت فین‌تک خواهد گذاشت، اما برخی از کاربردهای احتمالی آن ممکن است شامل موارد زیر باشد:

۱. ایجاد پیش‌نویس اولیه تشکیل پرونده در کمیسیون بورس و اوراق بهادار؛  با توجه به حجم زیادی از داده‌های پرونده ها و بسیار شبیه به ChatGPT که می تواند یک پرونده ثبت اختراع موقت یا کد برنامه نویسی سفارشی تولید کند، این محصول بلومبرگ می‌تواند پرونده SEC بسازد که به طور بالقوه هزینه تشکیل پرونده را کاهش می‌دهد.

۲. مقاله BloombergGPT؛  خلاصه کردن یک مبحث با محتوای مالی در قالب یک عنوان. برای مثال اگر متنی به این صورت به آن داده شود: بر اساس گزارش Redn، ارزش بازار مسکن ایالات متحده در نیمه دوم سال۲۰۲۲، ۲.۳ تریلیون دلار (۴.۹٪) کاهش یافته است. این بزرگترین افت درصدی از زمان بحران مسکن در سال ۲۰۰۸ بوده است، زمانی که قیمت مسکن در مدت مشابه ۵.۸٪ کاهش یافته بود. طبق این متن BloombergGPT خروجی زیر را تولید خواهد کرد: «قیمت خانه بیشترین کاهش را در ۱۵ سال گذشته داشته است.»

۳. ارائه نمودار شرکتی از یک سازمان و ارتباط بین یک فرد و چندین شرکت؛ از آنجایی که نام شرکت و نام مدیران در مدل BloombergGPT وارد شده است، این امکان کاملاً وجود دارد که بتوان حداقل برای ساختار سطح اجرایی این سازمان را مورد بررسی قرار داد.

۴. اتوماسیون تولید پیش نویس گزارش‌های معمول بازار و خلاصه برای مشتریان

۵. بازیابی عناصر خاص صورت‌های مالی برای دوره‌های خاص تنها با فیلتر کردن یک مقدار

به‌طور خلاصه BloombergGPT نشان‌دهنده جهشی به جلو برای جوامع مالی و هوش مصنوعی است. در حال حاضر، این مدل به صورت عمومی در دسترس نیست و هیچ API و حتی یک رابط چت برای دسترسی به آن وجود ندارد. زمان عرضه این محصول و اینکه آیا اصلاً در دسترس عموم قرار خواهد گرفت یا بازبینی‌های دیگری در ساختار فعلی این مدل صورت خواهد گرفت یا خیر، اطلاعی در دست نیست. تیم BloombergGPT در این خصوص اظهار کردند «ما جانب احتیاط را رعایت می‌کنیم و از رویه سایر توسعه‌دهندگان LLM در عدم انتشار مدل خود پیروی می‌کنیم و آن را در دسترس عموم قرار نمی‌دهیم.»

با ارزش‌گذاری کمپانی هوش مصنوعی OpenAI بالغ بر ۲۰ میلیارد دلار، کیست که بتواند از آنها ایراد بگیرد؟!

0
اشتراک در
اطلاع از
guest
0 تمام دیدگاه‌ها
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها

چنانچه به مشاوره رایگان علاقه‌مندید، پرسش‌ها و نظرات خود را درباره این مقاله یا موضوعات مختلف حوزه بلاکچین و ارزهای دیجیتال مطرح کنید. برای پاسخگویی آماده‌ایم!

نظر بدهید

نظرات پست (0)