텐센트가 투자한 체인베이스는 암호화폐에 초점을 맞춘 언어 모델인 Theia-Llama-3.1-8B의 오픈 소스를 발표했습니다. 훈련 데이터는 코인마켓캡과 자세한 프로젝트 연구 보고서에서 제공됩니다. 다른 주류 모델과 비교했을때, 더 낮은 복잡도와 더 높은 BERT 점수를 가지고 있습니다.
https://blog.chainbase.com/theia-open
We released TheiaChat in August, which is just an alpha version chatbot designed to showcase the basic capabilities of Theia. And in this blog, we introduced what is Theia and why we built Theia. Recently, we open sourced our first version Theia-Llama-3.1-8B, which is trained with carefully-designed dataset from the crypto field.Technical ImplementationCrypto-Oriented DatasetThe training dataset draws from two primary sources to create a comprehensive representation of blockchain projects. Th...