Vlastní velký jazykový model? Díky Databricks nově žádný problém

13. dub 2023 Ondřej Černý 1 min

Společnost Databricks spustila Dolly 2.0. Jde o první otevřený velký jazykový model (LLM) určený k trénování vlastního modelu. Otevřená datová sada obsahuje patnáct tisíc člověkem vytvořených dotazů a odpovědí speciálně navržených pro ladění instrukcí velkých jazykových modelů.

Dolly 2.0 je 12B parametrický jazykový model založený na modelové rodině EleutherAI pythia a vyladěný výhradně na lidsky generované instrukci. Databricks poskytne zájemcům opensourcing včetně tréninkového kódu, datové sady a modelových závaží. Vše je vhodné pro komerční použití. Jakákoliv organizace tak díky tomu může vytvářet, vlastnit a přizpůsobovat výkonné LLM, které mohou komunikovat s lidmi, aniž by firmy byly nuceny platit za přístup k API nebo sdílení dat s třetími stranami.