
„Enterprise AI“ įmonė „Cohere“ pristatė naują daugiakalbių modelių šeimą, vykstančią Indijos AI viršūnių susitikime. Modeliai, pavadinti „Tiny Aya“, yra atviro svorio, o tai reiškia, kad jų pagrindinis kodas yra viešai prieinamas, kad galėtų naudoti ir modifikuoti – palaiko daugiau nei 70 kalbų ir gali veikti kasdieniuose įrenginiuose, pavyzdžiui, nešiojamuosiuose kompiuteriuose, nereikalaujant interneto ryšio.
Modelis, kurį pristatė bendrovės tyrimų padalinys „Cohere Labs“, palaiko tokias Pietų Azijos kalbas kaip bengalų, hindi, pandžabų, urdu, gudžarati, tamilų, telugų ir maratų.
Baziniame modelyje yra 3,35 milijardo parametrų – jo dydžio ir sudėtingumo matas. „Cohere“ taip pat išleido „TinyAya-Global“ versiją, pritaikytą geriau sekti vartotojo komandas, skirtas programoms, kurioms reikalingas platus kalbų palaikymas. Regioniniai variantai papildo šeimą: TinyAya-Earth Afrikos kalboms; TinyAya-Fire Pietų Azijos kalboms; ir TinyAya-Water Azijos Ramiojo vandenyno, Vakarų Azijos ir Europos.

„Šis metodas leidžia kiekvienam modeliui sukurti stipresnį kalbinį pagrindą ir kultūrinius niuansus, sukuriant sistemas, kurios jaučiasi natūralesnės ir patikimesnės bendruomenėms, kurioms jie skirti. Tuo pačiu metu visi Tiny Aya modeliai išlaiko plačią daugiakalbę aprėptį, todėl jie yra lankstūs tolesnio pritaikymo ir tyrimų pradžios taškai”, – sakoma bendrovės pranešime.
Cohere pažymėjo, kad šie modeliai, kurie buvo parengti viename 64 H100 GPU (didelės galios lusto tipas, sukurtas Nvidia) naudojant santykinai kuklius skaičiavimo šaltinius, yra idealūs mokslininkams ir kūrėjams, kuriantiems programas auditorijai, kuri kalba gimtąja kalba. Modeliai gali veikti tiesiogiai įrenginiuose, todėl kūrėjai gali juos naudoti vertimui neprisijungus. Bendrovė pažymėjo, kad sukūrė pagrindinę programinę įrangą, kad ji atitiktų įrenginio naudojimą, o tai reikalauja mažiau skaičiavimo galios nei daugumai panašių modelių.

Kalbų požiūriu įvairiose šalyse, pvz., Indijoje, tokios neprisijungus pasiekiamos galimybės gali atverti įvairias programas ir naudojimo atvejus be nuolatinės interneto prieigos.
Modelius galima rasti „HuggingFace“, populiarioje AI modelių bendrinimo ir testavimo platformoje, ir „Cohere“ platformoje. Kūrėjai gali juos atsisiųsti iš „HuggingFace“, „Kaggle“ ir „Ollama“, kad būtų galima naudoti vietoje. Bendrovė taip pat išleidžia mokymo ir vertinimo duomenų rinkinius HuggingFace ir planuoja išleisti techninę ataskaitą, kurioje išsamiai aprašoma jos mokymo metodika.
Techcrunch renginys
Bostonas, MA
|
2026 m. birželio 23 d
Startuolio generalinis direktorius Aidanas Gomezas praėjusiais metais sakė, kad bendrovė planuoja „greitai“ išeiti į biržą. Anot CNBC, 2025 m. įmonė baigė labai gerai – metinės pasikartojančios pajamos siekė 240 mln. USD, o per metus išaugo 50 proc.


