Model Językowy Falcon i Jego Odmiany

Model Językowy Falcon i Jego Odmiany

Falcon to rodzina najnowocześniejszych modeli językowych stworzonych przez Technology Innovation Institute w Abu Dhabi. Falcon 180B jest obecnie największym dostępnym modelem językowym z 180 miliardami parametrów, przeszkolonym na ogromnej liczbie 3,5 biliona tokenów przy użyciu zestawu danych RefinedWeb TII. Jest to najdłuższe pojedyncze przetwarzanie wstępne dla otwartego modelu.

Odmiany Modelu Falcon

Falcon 180B to najnowsza wersja w rodzinie Falcon, będąca rozwinięciem wcześniejszego modelu Falcon 40B. Model ten wprowadza innowacje, takie jak zaawansowany mechanizm uwagi, dla lepszej skalowalności. Falcon 180B został przeszkolony na 3,5 biliona tokenów na maksymalnie 4096 GPU jednocześnie, korzystając z Amazon SageMaker, co łącznie wynosiło około 7 000 000 godzin GPU. Oznacza to, że Falcon 180B jest 2,5 raza większy niż Llama 2 i został przeszkolony z 4-krotnie większą mocą obliczeniową.

Jakość Modelu Falcon

Falcon 180B jest obecnie najlepszym otwarcie udostępnionym LLM, przewyższając Llama 2 70B i OpenAI’s GPT-3.5 w rankingu MMLU. Jest on porównywalny z Google’s PaLM 2-Large w wielu zadaniach przetwarzania języka naturalnego. Z wynikiem 68,74 w rankingu Hugging Face, Falcon 180B jest najlepiej ocenianym otwartym modelem LLM, przewyższając Meta’s LLaMA 2 (67,35).

Zastosowanie w Języku Polskim

Falcon 180B, podobnie jak jego poprzednicy, nie został przeszkolony wyłącznie na danych w języku angielskim. Model ten został przeszkolony również w wielu innych językach, w tym w języku polskim, co sprawia, że jest zdolny do swobodnej komunikacji w tym języku.

Użycie Modelu Falcon

Falcon 180B jest dostępny w ekosystemie Hugging Face, począwszy od wersji Transformers 4.33. Model ten może być używany komercyjnie, ale pod bardzo restrykcyjnymi warunkami, wykluczając wszelkie „użycie hostingowe”. Zaleca się zapoznanie się z licencją i konsultację z zespołem prawnym w przypadku zainteresowania komercyjnym wykorzystaniem modelu.

Modele Falcon można pobrać:

https://huggingface.co/huggingface

Skwantyzowane modele Falcon można pobrać:

https://huggingface.co/TheBloke

Interesujące artykuły związane z tym modelem:

Comparing Falcon-180B to GPT4

Abu Dhabi’s Falcon 180B vs. Meta’s Llama 2!

Dodaj komentarz