„Kažkas didelio.“ Amerika ant kelių ()
Tai yra reikšmingas patobulinimas.
Prisijunk prie technologijos.lt komandos!
Laisvas grafikas, uždarbis, daug įdomių veiklų. Patirtis nebūtina, reikia tik entuziazmo.
Sudomino? Užpildyk šią anketą!
„DeepSeek“ atvyksta nužudyti.
Silicio slėniui jau esant ant kelių, Kinijos startuolis išleidžia dar vieną atvirojo kodo DI modelį – šį kartą vaizdo generatorių, kuris, bendrovės teigimu, yra pranašesnis už „OpenAI DALL·E3“.
DI modelis, pavadintas „Janus-Pro 7B“, nurodant, kad jo pilna konfigūracija turi septynis milijardus parametrų, pirmadienį buvo prieinamas „GitHub“ ir „Hugging Face“ platformose kartu su plonesne vienu milijardo parametrų versija.
|
Tai yra ankstesnės „Janus“ versijos, išleistos praėjusiais metais, tęsinys ir, remiantis palyginimais su jos pirmtaku, kuriuo pasidalino „DeepSeek“, atrodo, kad tai yra reikšmingas patobulinimas.
Norint greitai peržiūrėti, jo vaizdo generavimo ir vaizdo supratimo galimybių demonstracinės versijos yra prieinamos internete „Hugging Face“. Rezultatai gali skirtis, tačiau įmonė rodo sistemos sukurtus tinkamus vaizdus.
Techniniame dokumente, išleistame kartu su DI modeliu, „DeepSeek“ teigia, kad „Janus-Pro“ žymiai lenkia DALL·E3 ir kitą pirmaujantį vaizdo generatoriaus modelį „Stable Diffusion XL“ pagal du pagrindinius etalonus: „GenEval“, kuriame jis gali pasigirti dideliu pranašumu, ir „DPG-Bench“, kur jo atotrūkis daug mažesnis. Pažymėtina, kad „Midjourney“ nebuvo analizuojamas.
Tai tik du etalonai, kad ir kaip jie būtų verti dėmesio, tik laikas ir ilgi testavimai parodys, kaip šie rezultatai pasitvirtins, nes vis daugiau žmonių eksperimentuoja su modeliu.
Nepaisant to, „DeepSeek“ įsitikinęsi, kad jis yra kelyje link kažko didelio.
„Janus-Pro“ pranoksta ankstesnį unifikuotą modelį ir atitinka arba viršija specifinių užduočių modelių našumą“, – rašė startuolis „Hugging Face“. „Dėl Janus-Pro“ paprastumo, didelio lankstumo ir efektyvumo jis yra tvirtas kandidatas naujos kartos vieningiems multimodaliniams modeliams.
„Janus-Pro 7B“ buvo išleistas iškart po to, kai „DeepSeek“ sukrėtė Amerikos technologijų pramonę, naudodamas savo R1 minties grandinės kalbos modelį.
Tariamai pagamintas su mažesniu nei 6 mln. USD biudžetu, „DeepSeek R1“ įspūdingai sugeba prilygti pirmaujančių DI modelių, tokių kaip „OpenAI“ o1, galimybėms, naudodamas tik dalį aparatinės įrangos ir galios.
Nebūtų perdėta sakyti, kad pokalbių robotas sugėdino savo užsienio konkurentus. Dabar keliami rimti klausimai dėl milijardų dolerių vertės investicijų, techninės įrangos ir energijos, kurių iki šiol reikalavo technologijų įmonės.