7 Minutit
Pärast 12 aastat Metas kinnitas Yann LeCun, et ta lahkub ettevõttest, et asutada sõltumatu idufirma, mis keskendub edenenud masinintellektile (AMI). Kaasaegse tehisintellekti pioneerina tuntud LeCun tõdeb, et ta vajab vabadust arendada süsteeme, mis tõeliselt mõistavad ja põhjendavad füüsilist maailma ning selle põhiseadusi.
Miks LeCun panustab LLM-trendi vastu
LeCun on pikka aega suhtunud skeptiliselt tööstuse möödunud aastate fookusesse — suuurtesse keelemudelitesse (LLM), mida skaleeritakse peamiselt »järgneva sõna« ennustamise paradigmas. Ta leiab, et pelgalt järjest suuremad ja arvukamad tekstipõhised mudelid ei too kaasa inimese tasemel üldintellekti. Selle asemel pooldab ta kontseptsiooni, mida ta nimetab maailmamudeliteks: süsteemid, mis simuleerivad ja põhjendavad reaalse maailma sündmusi, mõistavad füüsikat ja kausaalsust, säilitavad püsivaid mälestusi ning planeerivad mitmeastmelisi tegevussequenze.
Selline rõhuasetus füüsikale, põhjendamisele ja püsivale mälule eristub oluliselt tüüpilistest suurte keelemudelite arendusraamistiku projektidest. SEO-sõnadena tähistavad need teemad „edenenud masinintellekt“, „maailmamudelid“, „füüsikaline mõistmine“, „kausaalsus“ ja „püsiv mälu“ — kõik võtmekontseptsioonid, mida nähakse kui alternatiivset rada LLM-põhisele arengule.
LeCuni argument põhineb põhimõttel, et keelemudelid õpivad korrelatsioone teksti vahel, kuid ei pruugi omandada sisemist representeerimist maailma reeglitest. Kui eesmärgiks on agent, kes toimib füüsilises keskkonnas mitmeastmeliste planeerimisülesannete raames, siis on tarvis arhitektuure, mis ühendavad tajutud informatsiooni, dünaamikamudeleid ja mälustruktuure.
FAIR-i laboritest sõltumatu AMI-laborini
LeCun on neid ideid arendanud nii Meta (FAIR - Facebook AI Research) kui ka New Yorgi Ülikooli akadeemilises keskkonnas. FAIR andis talle võimaluse katsetada põhialuseid, kombineerides teoreetilist tööd konstandeeritud eksperimendikeskkondadega. Akadeemilistes ringkondades on rõhk sageli selgitustel ja metodoloogilisel uudsusel, kuid majanduslikult ja organisatsiooniliselt võivad suured korporatsioonid panna piirangud radikaalsemate lähenemiste kiirele skaleerimisele.
Sõltumatu idufirma struktuur võimaldab LeCunil katsetada arhitektuure, treeningmeetodeid ja eksperimentaalseid raamistikku ilma mõningate suurfirma protsesside ja prioriteetide piiranguteta. Selline keskkond võib soodustada agressiivsemat hüpoteesikatsetust: näiteks mudelipõhised agentlikud arhitektuurid, mis õpivad dünaamikat ja tegutsevad simuleeritud ning reaalses ruumis, ühendades sügavõppe, määratletud füüsikamudeleid ja toimetulekuplaneerimist.
LeCun kirjeldab visiooni agentidest, kes koguvad ja säilitavad püsivaid fakte maailmast, planeerivad mitmeastmelisi ülesandeid ning suudavad suhelda füüsilise keskkonnaga — olgu see simulaator või reaalne robot. Selline lähenemine puudutab valdkondi nagu embodied AI, robootika, model-based reinforcement learning ja pikaajaline representeeriv mälu ning see nõuab integreeritud uurimislahendusi.

Midagi muud kui puhas eraldumine: uus koostöövorm
LeCun jääb Metasse aasta lõpuni ning pärast seda liigub ta välist koostööpartneri rolli. Meta on juba avaldanud soovi teha koostööd tema idufirmaga ja pääseda ligipääsu selle innovatsioonile — suhe, mis sarnaneb Microsofti ja OpenAI või Google'i ja Anthropiciga. See tähendab, et tema lahkumine ei ole tingimata lõplik lõhenemine, vaid pigem strateegiline spin-off, mis võimaldab mõlema poolel tegutseda paindlikumalt ja kiiremini.
Selline hübriidmudel — kus teadlased asutavad iseseisvaid uurimisüksusi, kuid hoiavad tugevat partnerlussuhet suurettevõtetega — võib kiirendada teaduslikku teadlikkust ja rakendamist. Väikesed meeskonnad toovad sageli rohkem eksperimentaalset julgust ja alternatiivseid ideid, samas kui suured ettevõtted pakuvad infrastruktuuri, andmeid ja kapitali, mis on vajalikud ideede skaleerimiseks.
Konkreetsed koostöövormid võivad hõlmata ligipääsu Meta andmetele ja pilveinfrastruktuurile, ühiste projektide rahastamist, intellektuaalomandi litsentseerimist või tehnoloogiasiirdet. Need mehhanismid aitavad idufirmal säilitada teaduslikku vabadust, samal ajal hoides lauda tugevat ärilist ja tehnilist tuge.
Mida AMI võiks muuta tehisintellekti ja majanduse jaoks
LeCun kujutab AMI-d järgmise suure tehisintellekti revolutsioonina. Kui need süsteemid osutuvad edukaks, võivad nad muuta, kuidas tööstusharud automatiseerivad ülesandeid, mis nõuavad füüsikalist arutlust, pikaajalist planeerimist ja vastupidavat mälu. Selle asemel, et lihtsalt täiustada tekstipõhiseid ennustusi, püüab AMI luua arhitektuuri, mis mõistab füüsilise maailma seadusi — dünaamikat, kausaalset mõju ja hüpoteetilist käitumist erinevates kontekstides.
Majanduslik mõju võib olla ulatuslik: logistikast ja tootmisest kuni tervishoiu ja energeetikani, kus automatiseeritud agentidel on vaja teha otsuseid füüsilise süsteemi dünaamika alusel. Näiteks tööstusrobotid, mis planeerivad dünaamiliselt järjest keerukamaid koostalitlusi, või autonoomsed süsteemid, mis säilitavad püsivaid teadmisi konkreetsetest keskkondadest ning ennustavad pikaajalisi tagajärgi.
AMI edu nõuab siiski suuri tehnilisi läbimurdeid. Maailmamudelid vajavad rikkalikumaid treeningsignaale — mitte ainult teksti- ja pildipõhist vastust, vaid järjestikuseid andmeid sensoritest, rikaste simulatsioonide tagasisidet ning interaktiivset õppimist, kus agentid katsetavad ja õpivad oma tegudest. See tähendab tugevat integratsiooni sensorite, simulatsiooniplatvormide ja reaalse maailma andmevoogudega.
Arhitektuuriliselt nõutakse süsteeme, mis suudavad kombineerida tajumist, mälustruktuure ja planeerimise komponente. Praktikas võib see tähendada hierarhilisi mälumooduleid, mis säilitavad pikaajalist konteksti; dünaamilisi mudeliosa, mis ennustab järgmist seisundit; ning planeerimisüksusi, mis kanaldavad otsuseid mitmeastmeliste sihtide saavutamiseks. Sellised integratsioonid tüüpiliselt nõuavad kombinatsiooni sügavõppest, model-based reinforcement learningust, metareinforcement learningust ja sümbolistest või kausaalsetest representatsioonidest.
Meta kui partner annab uuele idule tõenäoliselt ligipääsu infrastruktuurile ja kapitalile, mis meelitab tipptalente ja teadlasi. LeCuni maine teadusliku juhina aitab ka meelitada tipptaso uurimisosakondi ning rahastust riskikapitalilt ja strateegilistelt investoritelt. Selline kooslus suurendab tõenäosust, et AMI-liin suudab teoreetilisi ideid rakendada skaleeritavateks süsteemideks.
Miks see on AI-maastiku jaoks oluline
LeCuni lahkumine Metast rõhutab kasvavat mustrit: vanemteadlaste üha levinum trend asutada sõltumatuid ettevõtteid, et uurida alternatiivseid lähenemisi, säilitades samas koostöö tehnoloogiahiidudega. See hübriidmudel võib ühendada väikeste meeskondade loovuse ja suurettevõtete ressursid, mis võib viia järsu edasimineku kiirenemiseni.
AI-huviliste ja poliitikakujundajate jaoks on oluline jälgida, kas AMI-lähenemised ületavad LLM-esimese teekonna või pigem täiendavad seda. Võimalik stsenaarium on kooseksisteerimine: LLM-id jätkavad keele- ja teadmistevahetuse rolli, samal ajal kui AMI süsteemid tegelevad inkorporeeritud agentlike ülesannetega, mis nõuavad füüsilist mõistmist, planeerimist ja püsivat mälukonteksti.
Lisaks tehnilistele kaalutlustele on oluline ka majandus- ja turumõju: kuidas väärtus jaguneb erinevate tööstusharude vahel ning millised regulatiivsed, eetilised ja tööjõumõjud sellest järelduvad. AMI-lahendused võivad asendada või täiendada töid, mis hõlmavad keerulist planeerimist ja füüsilist otsustamist, ning tekitada vajaduse uute oskuste ja hüvede järele tööturul.
Kui vaatate arengu tehnilist lubadust või majanduslikku mõju, rõhutab Yann LeCuni samm laiemat diskussiooni tehisintellekti uurimises: kas keskenduda olemasolevate keelemudelite skaleerimisele või ümbermõtestada intelligentsuse fundamentaale — loovalt ja praktiliselt. See on eksperiment, mida tasub jälgida nii teaduslikust kui ka majanduslikust vaatenurgast.
Lõpuks on oluline märkida, et AMI ja LLM ei pruugi olla vastandid, vaid pigem üksteist täiendavad lähenemised. Parimad süsteemid tulevikus võivad kombineerida suurt keele- ja teadmistebaasi (LLM) maailmamudelitega, mis annavad võime ette näha ja planeerida füüsilises ruumis. Selline süntees nõuab interdistsiplinaarset teadustööd, avatud koostööd akadeemia, idufirmade ja suurkorporatsioonide vahel ning läbimõeldud investeeringuid infrastruktuuri, andmete ja eetiliste raamistikute arendamisse.
Allikas: smarti
Jäta kommentaar