Říká se, že není nic staršího než včerejší noviny. Ale i z nich je možné získat spoustu informací. A když si je do parády vezmou nejnovější modely ChatGPT, tak to pro investory na akciových trzích může být terno. Umělá inteligence totiž na jejich základě přináší přesnější předpovědi. Díky nim tak mohou být investoři úspěšnější a vydělat výrazně více.
Využití velkých jazykových modelů (LLM), jako je například ChatGPT, v nejrůznějších oblastech zaznamenalo v posledních měsících obrovský nárůst. Řada vědeckých studií také zkoumala jejich možný potenciál. Yuehua Tang a Alejandro Lopez-Lira, oba působící na University of Florida, se zaměřili na aplikování LLM při využití na finančních trzích, zejména při procesu investičního rozhodování.
Jak uvádějí ve své nejnovější studii, „ve finanční ekonomii zůstává používání LLM relativně neprobádaným územím, zejména pokud jde o jejich schopnost předpovídat výnosy akciového trhu.“ Jedním z důvodů podle vědců je, že tyto modely nejsou pro daný účel trénovány, a dá se tak očekávat, že nenabízejí velkou hodnotu při předpovídání pohybů na akciovém trhu.
Zároveň ale Tang a Lopez-Lira vnímají, že pokud jsou velké jazykové modely schopny lépe porozumět přirozenému jazyku, mohly by se stát cenným nástrojem pro zpracování textových informací využitelných při predikci výnosů akcií. Proto se ve svém výzkumu zaměřili na potenciál ChatGPT a dalších velkých jazykových modelů při předpovídání výnosů akciových trhů pomocí analýzy sentimentu novinových titulků.
S AI na burzovní zpravodajství
ChatGPT je sice výkonným nástrojem pro jazykové úkoly, není ale speciálně vytrénován k předpovídání výnosů akcií nebo poskytování finančního poradenství. Tang a Lopez-Lira ho při svém výzkumu použili k tomu, aby označil, zda je konkrétní titulek dobrou, špatnou nebo nepodstatnou zprávou pro firemní ceny akcií. Prostřednictvím nového přístupu, který využívá možnosti analýzy sentimentu modelu, hodnotili výkon ChatGPT pomocí dat získaných z titulků zpráv a porovnávali ho se současnými metodami analýzy sentimentu.
Lingvistickou analýzu zpravodajských článků tak využili ke zjištění obchodního sentimentu a následnému předpovídání cenového vývoje akcií. Na jejím základě pak vypočetli skóre a zaměřili se na korelaci mezi ním a následnými denními výnosy akciového trhu.
Ve srovnání s předchozími studiemi se badatelé z University of Florida zaměřili na pochopení toho, zda využití velkých jazykových modelů přidává hodnotu získáním dalších informací, které napomáhají předpovědět reakce akciového trhu. Proto se Tang a Lopez-Lira pokusili otestovat schopnosti ChatGPT při predikci výnosů akcií. Pro svou analýzu využili dva primární datové soubory. Jedním byly denní akciové výnosy, druhým pak titulky zpráv Centra pro výzkum cen cenných papírů (CRSP).
Zkoumané období začalo říjnem roku 2021, protože tréninková data ChatGPT byla v době výzkumu k dispozici pouze do září 2021, a končilo v prosinci 2022. Vědci dané časově vymezené období zvolili proto, že tyto informace nebyly součástí tréninkových dat modelu ChatGPT. Díky tomu tak bylo možné přesnější hodnocení jeho prediktivních schopností.
Na burzovní sentiment bez emocí
Datová sada CRSP obsahovala informace o denních výnosech akcií pro širokou škálu společností kotovaných na hlavních amerických burzách, včetně údajů o cenách akcií, objemech obchodů a tržní kapitalizaci. Šlo o všechny firmy kotované na New York Stock Exchange (NYSE), Národní asociace obchodníků s cennými papíry pro automatizované kotace (NASDAQ) a Americké burze cenných papírů (AMEX). Zároveň se o nich za sledované období objevila alespoň jedna zpráva, kterou výzkumníci mohli zařadit do zkoumaného vzorku.
Tento komplexní soubor dat vědcům umožnil prozkoumat vztah mezi skóre sentimentu generovaným ChatGPT a odpovídajícími výnosy akciového trhu. Získali tak robustní základ pro svou analýzu.
Nejdříve nashromáždili komplexní soubor dat, který tvořily zprávy CRSP. Posléze v nich vyhledávali všechny zprávy obsahující buď název společnosti nebo ticker (soubor písmen, který pro účely obchodování označuje jednotlivé akcie nebo cenné papíry, pozn. red.). Výsledná datová sada obsahovala titulky zpráv z různých zdrojů, jako jsou velké zpravodajské agentury, finanční zpravodajské weby a platformy sociálních médií. Pro každou společnost vědci shromáždili všechny novinky za sledované období.
Následovalo porovnání titulků s titulky od poskytovatele dat analýzy sentimentu zpráv RavenPack a spárování časového období a názvu společností, s jejichž akciemi se obchodovalo. Díky tomu byli výzkumníci schopni porovnat 67 586 zpravodajských titulků, které pojednávaly o 4 138 různých společnostech. Získaná data zpracovali pomocí metod předběžného zpracování.
Použili tzv. „skóre relevance“, které se pohybuje od 0 do 100, jako indikátor toho, jak výrazně se konkrétní zpráva týká dané společnosti. Zkoumaný vzorek vyžadoval, aby relevance v textech dosahovala maxima. Z analýzy tak vyloučili například titulky kategorizované jako „nárůst hodnoty akcií“ a „pokles hodnoty akcií“, protože pouze naznačují denní směr pohybu akcií.
Aby se vyhnuli zkreslování výsledků, odstranili ze zkoumaného vzorku duplicitní titulky pro jednu společnost z jednoho dne, případně titulky, které byly téměř shodné. Podobnost nadpisů měřili pomocí metriky optimální zarovnání řetězců (známé také jako omezená vzdálenost Damerau-Levenshtein) a odstranili nadpisy s podobností větší než 0,6 pro stejnou společnost ve stejný den.
AI místo portfolio manažera
Analýza odhalila, že skóre sentimentu ChatGPT vykázalo statisticky významnou prediktivní schopnost týkající se denních výnosů akciového trhu. Při zkoumání využití údajů z titulků zpráv a generovaných skóre sentimentu našli Tang a Lopez-Lira výraznou korelaci mezi hodnocením ChatGPT a následnými denními výnosy akcií. Tento výsledek dle nich zdůrazňuje potenciál ChatGPT jako cenného nástroje pro předpovídání pohybů na akciovém trhu na základě analýzy sentimentu.
Aby dále prozkoumali přesnost svých zjištění, porovnali výkon ChatGPT s tradičními metodami analýzy sentimentu. Výsledky ukázaly, že při kontrole skóre sentimentu ChatGPT se účinek ostatních skóre sentimentu na denní výnosy akciového trhu sníží na nulu. Dá se z toho proto dovodit, že model ChatGPT překonává stávající metody analýzy sentimentu při předpovídání výnosů akciového trhu.
Lepší výsledky ChatGPT v předpovídání výnosů akciového trhu je možné přičíst jeho pokročilým schopnostem porozumění jazyku, které mu umožňují zachytit nuance a jemnosti v titulcích zpráv. Tato schopnost dává modelu potenciál generovat spolehlivější skóre sentimentu, což ve svém důsledku vede k lepším předpovědím denních výnosů akciového trhu. Zjištění tak ukazují potenciální výhody začlenění LLM do procesů investičního rozhodování. Tím, že překonává tradiční metody analýzy sentimentu, ChatGPT demonstruje svou hodnotu při zvyšování výkonnosti kvantitativních obchodních strategií a poskytuje přesnější pochopení dynamiky trhu.
Ze studie badatelů z University of Florida zároveň vyplynulo, že starší modely jako GPT-1, GPT-2 a BERT nedokáží přesně předpovídat výnosy, což je schopností novějších komplexních modelů typu ChatCPT-3 a dalších. Rozdíl ve výsledcích předpovědí Tang a Lopez-Lira připisují jejich zaměření na používání historických numerických dat.
ChatGPT naopak vyniká v textových úlohách. Z předchozích výzkumů také vyplynulo, že ChatGPT může být užitečný při výběru mezi různými druhy aktiv. Výsledky naznačily, že začlenění těchto pokročilých jazykových modelů do procesu investičního rozhodování má potenciál přinést přesnější předpovědi a zvýšit výkon kvantitativních obchodních strategií.